Os sistemas RAID

Novembro 2017

O que é a tecnologia RAID

A tecnologia RAID (Redundant Array of Independent Disks ou Conjunto Redundante de Discos Independentes), permite constituir uma unidade de armazenamento a partir dos vários discos rígidos. A unidade assim criada (chamada cluster) tem assim uma grande tolerância às avarias (elevada disponibilidade), ou maior capacidade/velocidade de escrita. A distribuição dos dados nos vários discos rígidos permite por conseguinte aumentar a segurança e viabilizar os serviços associados.

Esta tecnologia foi criada em 1987 por três pesquisadores, Patterson, Gibson e Katz na Universidade de Califórnia (Berkeley). Desde 1992, é o RAID Advisory Board que gerencia estas especificações. Ele consiste em constituir um disco de grande capacidade (por conseguinte, dispendioso) com discos mais pequenos e baratos (ou seja, MTBF - Mean Time Between Failure, ou seja o tempo médio entre duas avarias, é fraco).

Quais são e quais os principais níveis de um RAID

Os discos montados de acordo com a tecnologia RAID podem ser utilizados de diferentes maneiras, chamadas Níveis RAID. A Universidade de Califórnia definiu 5, aos quais foram acrescentados os níveis de 0 e 6. Cada um deles descreve a maneira como os dados são repartidos nos discos:

Nível RAID 0: chamado, em inglês, striping


Nível RAID 1: chamado, em inglês, mirroring, shadowing ou duplexing

Nível RAID 2: chamado, em inglês, striping with parity (obsoleto)

Nível RAID 3: chamado, em inglês, disk array with bit-interleaved data

Nível RAID 4: chamado, em inglês, disk array with block-interleaved data

Nível RAID 5: chamado, em inglês, disk array with block-interleaved distributed parity

Nível RAID 6: chamado, em inglês, disk array with block-interleaved distributed parity

Cada um destes níveis constitui um modo de utilização do cluster, em função dos desempenhos, dos custo e do acesso aos discos

Nível RAID 0

O nível RAID-0, chamado striping (entrelaçamento ou agregado por banda) consiste em armazenar os dados repartindo-os no conjunto dos discos do cluster. Desta maneira, não há redundância, assim, não podemos falar de tolerância às avarias. Com efeito, no caso de insuficiência de um dos discos, a integralidade dos dados repartidos nos discos será perdida. Contudo, já que cada disco do cluster tem o seu próprio controlador, isto constitui uma solução que oferece uma velocidade de transferência elevada.

O RAID 0 é a justaposição lógica (agregação) dos vários discos rígidos físicos. Em modo RAID-0, os dados são escritos por bandas (em inglês stripes):


Disco 1
Banda 1
Banda 4
Banda 7
Disco 2
Banda 2
Banda 5
Banda 8
Disco 3
Banda 3
Banda 6
Banda 9


Fala-se de fator de entrelaçamento para caracterizar a dimensão relativa dos fragmentos (bandas) armazenados em cada unidade física. O débito de transferência médio depende deste fator (quanto menor é cada banda, melhor é o débito). Se um dos elementos do cluster for maior que os outros, o sistema de preenchimento por banda será bloqueado quando o disco menor estiver preenchido. A dimensão final é assim igual ao dobro da capacidade do mais pequeno dos dois discos: dois discos de 20 Go dão um disco lógico de 40 Go e um disco de 10 Go utilizado conjuntamente com um disco de 27 Go permitirá obter um disco lógico de 20 Go (17 Go do segundo disco serão então inutilizados):


Nota
É recomendado utilizar discos do mesmo tamanho para fazer RAID-0, caso contrário, o disco de maior capacidade não será plenamente explorado

Nível RAID 1

A função do nível 1 é de duplicar a informação a ser armazenada nos vários discos. Este método é dito mirroring (espelhamento) ou shadowing (sombreamento):


Disco 1
Banda 1
Banda 2
Banda 3
Disco 2
Banda 1
Banda 2
Banda 3
Disco3
Banda 1
Banda 2
Banda 3


Obtém-se, desse modo, maior segurança dos dados, porque se um dos discos tem problema, os dados são salvos no outro. Por outro lado, a leitura pode ser muito mais rápida quando os dois discos estão em funcionamento. Por último, já que cada disco possui o seu próprio controlador, o servidor pode continuar a funcionar mesmo quando um dos discos tem problema, assim como um caminhão poderá continuar a rodar mesmo se um dos seus pneus estourar, porque ele tem vários em cada eixo. Por outro lado, a tecnologia RAID1 é muito cara, pois utiliza apenas a metade da sua capacidade de armazenamento.

Nível RAID 2

O nível RAID-2 é obsoleto, porque propõe um controle de erro por código Hamming (códigos ECC - Error Correction Code), este último está agora integrado diretamente nos controladores de discos rígidos.

Esta tecnologia consiste em armazenar os dados de acordo com o mesmo princípio do RAID-0, mas escrevendo numa unidade distinta os bits de controle ECC (geralmente 3 discos ECC são utilizados para 4 discos de dados).

A tecnologia RAID 2 tem um desempenho que deixa a desejar, mas, por outro lado, tem um nível de segurança elevado.

Nível RAID 3

O nível 3 propõe armazenar os dados sob a forma de bytes em cada disco e dedicar um dos discos ao armazenamento de um bit de paridade:


Disco 1
Bytes 1
Bytes 4
Bytes 7
Disco 2
Bytes 2
Bytes 5
Bytes 8
Disco 3
Bytes 3
Bytes 6
Bytes 9
Disco 4
Paridade 1+2+3
Paridade 4+5+6
Paridade 7+8+9


Desta maneira, se um dos discos falhar, seria possível reconstituir a informação a partir dos outros discos. Após a reconstituição, ou recuperação, o conteúdo do disco que falhou é novamente integrado. Por outro lado, se dois discos estão com problema simultaneamente, seria impossível evitar a perda de dados.

Nível RAID 4

O nível 4 está muito próximo do nível 3. A diferença encontra-se na paridade, que é feita em um setor, chamado bloco) e não no bit, e que é armazenado num disco dedicado, ou seja, o valor do fator de entrelaçamento é diferente em relação ao RAID 3:



Disco 1
Bloco 1
Bloco 4
Bloco 7
Disco 2
Bloco 2
Bloco 5
Bloco 8
Disco 3
Bloco 3
Bloco 6
Bloco 9
Disco 4
Paridade 1+2+3
Paridade 4+5+6
Paridade 7+8+9


Assim, para ler um número de blocos reduzidos, o sistema não tem que acessar os múltiplos leitores físicos, mas unicamente aqueles nos quais os dados estão efetivamente armazenados. Por outro lado, o disco que armazena os dados de controle tem que ter um tempo de acesso igual à soma dos tempos de acesso dos outros discos, para não limitar os desempenhos do conjunto.

Nível RAID 5

O nível 5 é semelhante ao nível 4, ou seja, a paridade é calculada em um setor, mas repartida pelo conjunto dos discos do cluster:



Disco 1
Bloco 1
Bloco 4
Paridade 7+8+9
Disco 2
Bloco 2
Paridade 4+5+6
Bloco 7
Disco 3
Bloco 3
Bloco 5
Bloco 8
Disco 4
Paridade 1+2+3
Bloco 6
Bloco 9


Desta maneira, o RAID 5 melhora amplamente o acesso aos dados, tanto em leitura quanto em escrita, porque o acesso aos bits de paridade está repartido nos diferentes discos do cluster.

O RAID-5 permite obter desempenhos muito próximos dos obtidos com o RAID-0, garantindo ao mesmo tempo uma tolerância às avarias bastante elevada, é a razão pela qual é um dos RAID mais interessantes em termos de desempenho e de fiabilidade:


Nota
Sendo o espaço disco útil num cluster de n discos iguais a n-1 discos, é interessante ter um grande número de discos para rentabilizar o RAID-5

Nível RAID 6

O nível 6 foi acrescentado aos níveis definidos por Berkeley. Ele define a utilização de 2 funções de paridade e, assim, o tem o seu armazenamento em dois discos dedicados. Este nível garante a redundância em caso de pane simultânea de dois discos. Isto significa que são necessários pelo menos 4 discos para instalar um sistema RAID-6.

Quais os critérios para escolher um sistema de proteção RAID

As soluções RAID preferidas são geralmente a RAID de nível 1 e a RAID de nível 5. Mas, saiba que, a escolha de uma solução RAID obedece a três critérios:


A segurança: as soluções RAID 1 e 5 oferecem ambas um nível de segurança elevado, contudo o método de reconstrução dos discos varia entre as duas soluções. No caso de pane do sistema, a RAID 5 reconstitui o disco que falta a partir das informações armazenadas nos outros discos, enquanto RAID 1 opera uma cópia disco a disco.

O desempenho: a solução RAID 1 oferece melhor desempenho do que a RAID 5 em leitura, mas sofre nas operações de escrita.

O custo: o custo está diretamente ligado à capacidade de armazenamento que deve ser aplicada para ter uma certa capacidade efetiva. A solução RAID 5 oferece um volume útil que representa 80 a 90% do volume atribuído (o resto serve evidentemente para o controle de erro). A solução RAID 1 oferece em contrapartida apenas um volume disponível, que representa 50% do volume total (já que as informações são duplicadas).

Como é Instalada uma solução RAID

Existem vários métodos para instalar uma solução RAID em um servidor: com um software, que geralmente é um driver do sistema operacional do computador capaz de criar um só volume lógico com vários discos SCSI ou IDE; o modo dito material usando matérias ditos DASD (Direct Access Stockage Device) que são unidades de armazenamento externas fornecidas com uma alimentação própria. Além disso, estes materiais são dotados de conectores que permitem a troca de discos quente (diz-se geralmente que este tipo de disco é hot swappable). Este material gerencia os seus próprios discos, de modo que é reconhecido como um disco SCSI standard; com os controladores de discos RAID que são cartões que se encaixam em slots PCI ou ISA e permitem controlar vários discos rígidos.

Protección - Sistemas RAID
Protección - Sistemas RAID
Protection - Les systèmes RAID
Protection - Les systèmes RAID
Protezione - I sistemi RAID
Protezione - I sistemi RAID
Última modificação: 3 de julho de 2017 às 15:23 por Pedro.CCM.
Este documento, intitulado 'Os sistemas RAID', está disponível sob a licença Creative Commons. Você pode copiar e/ou modificar o conteúdo desta página com base nas condições estipuladas pela licença. Não se esqueça de creditar o CCM (br.ccm.net) ao utilizar este artigo.