Como funciona o RAID

Última modificação: 4 de fevereiro de 2020 às 15:02 por Pedro Muxfeldt .

A tecnologia RAID é uma alternativa para aumentar a velocidade de processamento e a segurança dos seus dados no computador. Saiba o que é o RAID e quais os diferentes tipos dessa tecnologia.

O que é a tecnologia RAID
Quais são os principais níveis de um RAID
Nível RAID 0
Nível RAID 1
Nível RAID 2
Nível RAID 3
Nível RAID 4
Nível RAID 5
Nível RAID 6
JBOD
Quais os critérios para escolher um sistema de proteção RAID
Como é Instalada uma solução RAID

O que é a tecnologia RAID

A tecnologia RAID (Redundant Array of Independent Disks ou Conjunto Redundante de Discos Independentes) permite constituir uma unidade de armazenamento a partir de diversos discos rígidos. A unidade criada (chamada cluster) tem grande tolerância às avarias e maior capacidade/velocidade. A distribuição dos dados nos vários discos rígidos permite aumentar a segurança e viabilizar os serviços associados.

Esta tecnologia foi criada em 1987 por três pesquisadores, Patterson, Gibson e Katz na Universidade da Califórnia. Desde 1992, é o RAID Advisory Board que gerencia estas especificações. Ele consiste em constituir um disco de grande capacidade (por conseguinte, dispendioso) com discos menores e mais baratos (MTBF - Mean Time Between Failure).

Quais são os principais níveis de um RAID

Os discos montados de acordo com a tecnologia RAID podem ser utilizados de diferentes maneiras, chamadas Níveis RAID. A Universidade de Califórnia definiu cinco, aos quais foram acrescentados os níveis 0 e 6. Cada um deles descreve a maneira como os dados são repartidos nos discos. Cada nível constitui um modo de utilização do cluster, em função dos desempenhos, dos custo e do acesso aos discos

Nível RAID 0

O nível RAID 0, chamado striping (entrelaçamento ou agregado por banda) consiste em armazenar os dados repartindo-os no conjunto dos discos do cluster. Desta maneira, não há redundância, assim, não podemos falar de tolerância às avarias. Com efeito, no caso de insuficiência de um dos discos, a integralidade dos dados repartidos nos discos será perdida. Contudo, já que cada disco do cluster tem o seu próprio controlador, isto constitui uma solução que oferece uma velocidade de transferência elevada.

O RAID 0 é a justaposição lógica (agregação) dos vários discos rígidos físicos. Em modo RAID 0, os dados são escritos por bandas (em inglês stripes):

Disco 1
Banda 1
Banda 4
Banda 7

Disco 2
Banda 2
Banda 5
Banda 8

Disco 3
Banda 3
Banda 6
Banda 9

Fala-se de fator de entrelaçamento para caracterizar a dimensão relativa dos fragmentos (bandas) armazenados em cada unidade física. O débito de transferência médio depende deste fator (quanto menor é cada banda, melhor é o débito). Se um dos elementos do cluster for maior que os outros, o sistema de preenchimento por banda será bloqueado quando o disco menor estiver preenchido.

A dimensão final é assim igual ao dobro da capacidade do mais pequeno dos dois discos: dois discos de 20 Go dão um disco lógico de 40 Go e um disco de 10 Go utilizado conjuntamente com um disco de 27 Go permitirá obter um disco lógico de 20 Go (17 Go do segundo disco serão então inutilizados):

É recomendado utilizar discos do mesmo tamanho para fazer RAID 0, caso contrário, o disco de maior capacidade não será plenamente explorado

Nível RAID 1

A função do nível 1 é de duplicar a informação a ser armazenada nos vários discos. Este método é dito mirroring (espelhamento) ou shadowing (sombreamento):

Disco 1
Banda 1
Banda 2
Banda 3

Disco 2
Banda 1
Banda 2
Banda 3

Disco3
Banda 1
Banda 2
Banda 3

Obtém-se, desse modo, maior segurança dos dados, porque se um dos discos tem problema, os dados são salvos no outro. Por outro lado, a leitura pode ser muito mais rápida quando os dois discos estão em funcionamento. Por último, já que cada disco possui seu próprio controlador, o servidor pode continuar a funcionar mesmo quando um dos discos tem problema. Por outro lado, a tecnologia RAID 1 é muito cara, pois utiliza apenas a metade da sua capacidade de armazenamento.

Nível RAID 2

O nível RAID 2 é obsoleto, porque propõe um controle de erro por código Hamming (códigos ECC - Error Correction Code), este último está agora integrado diretamente nos controladores de discos rígidos.

Esta tecnologia consiste em armazenar os dados de acordo com o mesmo princípio do RAID 0, mas escrevendo numa unidade distinta os bits de controle ECC (geralmente 3 discos ECC são utilizados para 4 discos de dados).

A tecnologia RAID 2 tem um desempenho que deixa a desejar, mas, por outro lado, tem um nível de segurança elevado.

Nível RAID 3

O nível 3 propõe armazenar os dados sob a forma de bytes em cada disco e dedicar um dos discos ao armazenamento de um bit de paridade:

Disco 1
Bytes 1
Bytes 4
Bytes 7

Disco 2
Bytes 2
Bytes 5
Bytes 8

Disco 3
Bytes 3
Bytes 6
Bytes 9

Disco 4
Paridade 1+2+3
Paridade 4+5+6
Paridade 7+8+9

Desta maneira, se um dos discos falhar, seria possível reconstituir a informação a partir dos outros discos. Após a reconstituição, ou recuperação, o conteúdo do disco que falhou é novamente integrado. Por outro lado, se dois discos estão com problema simultaneamente, seria impossível evitar a perda de dados.

Nível RAID 4

O nível 4 é muito parecido do nível 3. A diferença encontra-se na paridade, que é feita em um setor, chamado bloco) e não no bit, e que é armazenado num disco dedicado, ou seja, o valor do fator de entrelaçamento é diferente em relação ao RAID 3:

Disco 1
Bloco 1
Bloco 4
Bloco 7

Disco 2
Bloco 2
Bloco 5
Bloco 8

Disco 3
Bloco 3
Bloco 6
Bloco 9

Disco 4
Paridade 1+2+3
Paridade 4+5+6
Paridade 7+8+9

Assim, para ler um número de blocos reduzidos, o sistema não tem que acessar os múltiplos leitores físicos, mas unicamente aqueles nos quais os dados estão efetivamente armazenados. Por outro lado, o disco que armazena os dados de controle tem que ter um tempo de acesso igual à soma dos tempos de acesso dos outros discos, para não limitar os desempenhos do conjunto.

Nível RAID 5

O nível 5 é semelhante ao nível 4, ou seja, a paridade é calculada em um setor, mas repartida pelo conjunto dos discos do cluster:

Disco 1
Bloco 1
Bloco 4
Paridade 7+8+9

Disco 2
Bloco 2
Paridade 4+5+6
Bloco 7

Disco 3
Bloco 3
Bloco 5
Bloco 8

Disco 4
Paridade 1+2+3
Bloco 6
Bloco 9

Desta maneira, o RAID 5 melhora amplamente o acesso aos dados, tanto em leitura quanto em escrita, porque o acesso aos bits de paridade está repartido nos diferentes discos do cluster.

O RAID 5 permite obter desempenhos muito próximos dos obtidos com o RAID 0, garantindo ao mesmo tempo uma tolerância às avarias bastante elevada, é a razão pela qual é um dos RAID mais interessantes em termos de desempenho e de fiabilidade:

Sendo o espaço disco útil num cluster de n discos iguais a n-1 discos, é interessante ter um grande número de discos para rentabilizar o RAID 5

Nível RAID 6

O nível 6 foi acrescentado aos níveis definidos por Berkeley. Ele define a utilização de 2 funções de paridade e, assim, o tem o seu armazenamento em dois discos dedicados. Este nível garante a redundância em caso de pane simultânea de dois discos. Isto significa que são necessários pelo menos 4 discos para instalar um sistema RAID 6.

JBOD

Esse tipo alternativo é bem simples. Ele apenas adiciona as capacidades dos diversos discos rígidos para obter uma capacidade única da partição lógica. Não se obtém nem o desempenho, nem a segurança. Quando o primeiro disco está cheio, ele continua a escrever no disco seguinte.

Quais os critérios para escolher um sistema de proteção RAID

As soluções RAID preferidas são geralmente a RAID de nível 1 e a RAID de nível 5. Mas, saiba que, a escolha de uma solução RAID obedece a três critérios:

A segurança: as soluções RAID 1 e 5 oferecem ambas um nível de segurança elevado, contudo o método de reconstrução dos discos varia entre as duas soluções. No caso de pane do sistema, a RAID 5 reconstitui o disco que falta a partir das informações armazenadas nos outros discos, enquanto RAID 1 opera uma cópia disco a disco.

O desempenho: a solução RAID 1 oferece melhor desempenho do que a RAID 5 em leitura, mas sofre nas operações de escrita.

O custo: o custo está diretamente ligado à capacidade de armazenamento que deve ser aplicada para ter uma certa capacidade efetiva. A solução RAID 5 oferece um volume útil que representa 80 a 90% do volume atribuído (o resto serve evidentemente para o controle de erro). A solução RAID 1 oferece em contrapartida apenas um volume disponível, que representa 50% do volume total (já que as informações são duplicadas).

Como é Instalada uma solução RAID

Existem vários métodos para instalar uma solução RAID em um servidor: com um software, que geralmente é um driver do sistema operacional capaz de criar um só volume lógico com vários discos SCSI ou IDE.

O modo material usando DASD (Direct Access Stockage Device), que são unidades de armazenamento externas fornecidas com uma alimentação própria. Além disso, estes materiais são dotados de conectores que permitem a troca de discos.

Esse material gerencia os seus próprios discos, de modo que é reconhecido como um disco SCSI standard; com os controladores de discos RAID que são cartões que se encaixam em slots PCI ou ISA e permitem controlar vários discos rígidos.

Veja também

Este documento, intitulado 'Como funciona o RAID', está disponível sob a licença Creative Commons. Você pode copiar e/ou modificar o conteúdo desta página com base nas condições estipuladas pela licença. Não se esqueça de creditar o CCM (br.ccm.net) ao utilizar este artigo.