Proteção - Os sistemas RAID

Agosto 2015

Apresentação da tecnologia RAID


A tecnologia RAID (acrônimo deRedundant Array of Inexpensive Disks, às vezes Redundant Array of Independent Disks, ou "conjunto redundante de discos independentes") permite constituir uma unidade de armazenamento a partir dos vários discos duros. A unidade assim criada (chamada cluster) tem assim uma grande tolerância às avarias (elevada disponibilidade), ou maior capacidade/velocidade de escrita. A distribuição dos dados nos vários discos duros permite por conseguinte aumentar a segurança e fiabilizar os serviços associados.

Esta tecnologia foi criada em 1987 por três investigadores (Patterson, Gibson e Katz) na Universidade de Califórnia (Berkeley). Desde 1992, é o RAID Advisory Board que gere estas especificações. Consiste em constituir um disco de grande capacidade (por conseguinte, dispendioso) com discos mais pequenos e baratos (ou seja, cujo MTBF, Mean Time Between Failure, ou seja o tempo médio entre duas avarias, é fraco).

Os discos montados de acordo com a tecnologia RAID podem ser utilizados de diferentes maneiras, chamadas Níveis RAID. A Universidade de Califórnia definiu 5, aos quais foram acrescentados os níveis 0 e 6. Cada um deles descreve a maneira como os dados são repartidos nos discos:

  • Nível 0: chamado striping
  • Nível 1: chamado mirroring, shadowing ou duplexing
  • Nível 2: chamado striping with parity (obsolète)
  • Nível 3: chamado disk array with bit-interleaved data
  • Nível 4: chamado disk array with block-interleaved data
  • Nível 5: chamado disk array with block-interleaved distributed parity
  • Nível 6: chamado disk array with block-interleaved distributed parity



Cada um destes níveis constitui um modo de utilização do cluster, em função de:

  • desempenhos
  • custo
  • acesso aos discos

Nível 0


O nível RAID-0, chamado striping ("entrelaçamento" ou "agregado por banda", às vezes injustamente chamado stripping) consiste em armazenar os dados repartindo-os sobre o conjunto dos discos do cluster. Desta maneira, não há redundância, não se pode por conseguinte falar de tolerância às avarias. Com efeito, no caso de insuficiência de um dos discos, a integralidade dos dados repartidos sobre os discos será perdida.

Contudo, já que cada disco do cluster tem o seu próprio controlador, isto constitui uma solução que oferece uma velocidade de transferência elevada.

RAID 0 consiste assim na justaposição lógica (agregação) dos vários discos duros físicos. Em modo RAID-0 os dados são escritos por "bandas" (em inglês stripes):

Disco 1
Banda 1
Banda 4
Banda 7
Disco 2
Banda 2
Banda 5
Banda 8
Disco 3
Banda 3
Banda 6
Banda 9



Fala-se de factor de entrelaçamento para caracterizar a dimensão relativa dos fragmentos (bandas) armazenados em cada unidade física. O débito de transferência médio depende deste factor (quanto mais pequena é cada banda, melhor é o débito).

Se um dos elementos do cluster for maior que os outros, o sistema de preeencimento por banda será bloqueado quando o disco mais pequeno estiver preenchido. A dimensão final é assim igual ao dobro da capacidade do mais pequeno dos dois discos :

  • dois discos de 20 Go dão um disco lógico de 40 Go.
  • um disco de 10 Go utilizado conjuntamente com um disco de 27 Go permitirá obter um disco lógico de 20 Go (17 Go do segundo disco serão então inutilizados).

Nota
É recomendado utilizar discos do mesmo tamanho para fazer RAID-0, porque no caso contrário o disco de maior capacidade não será explorado plenamente.

Nível 1


O nível 1 tem por objectivo duplicar a informação a armazenar sobre vários discos, fala-se por conseguinte de mirroring, ou shadowing, para designar este método.

Disco 1
Banda 1
Banda 2
Banda 3
Disco 2
Banda 1
Banda 2
Banda 3
Disco3
Banda 1
Banda 2
Banda 3



Obtém-se assim maior segurança dos dados, porque se um dos discos avaria, os dados são salvaguardados no outro. Por outro lado, a leitura pode ser muito mais rápida quando os dois discos estão em funcionamento. Por último, já que cada disco possui o seu próprio controlador, o servidor pode continuar a funcionar mesmo quando um dos discos avaria, assim como um camião poderá continuar a circular se um dos seus pneus rebentar, porque tem vários em cada eixo...

Por outro lado, a tecnologia RAID1 é muito cara, já que apenas metade da capacidade de armazenamento é realmente utilizada.

Nível 2


O nível RAID-2 é agora obsoleto, porque propõe um controlo de erro por código Hamming (códigos ECC - Error Correction Code), ora este último está agora integrado directamente nos controladores de discos duros.

Esta tecnologia consiste em armazenar os dados de acordo com o mesmo princípio que com o RAID-0, mas escrevendo numa unidade distinta as bits de controlo ECC (geralmente 3 discos ECC são utilizados para 4 discos de dados).

A tecnologia RAID 2 oferece pobres desempenhos mas um nível de segurança elevado.

Nível 3


O nível 3 propõe armazenar os dados sob a forma de bytes em cada disco e dedicar um dos discos ao armazenamento de uma bit de paridade.


Disco 1
Octet 1
Octet 4
Octet 7
Disco 2
Octet 2
Octet 5
Octet 8
Disco 3
Octet 3
Octet 6
Octet 9
Disco 4
Paridade 1+2+3
Paridade 4+5+6
Paridade 7+8+9

Desta maneira, se um dos discos viesse a falhar, seria possível reconstituir a informação a partir dos outros discos. Após "reconstituição" o conteúdo do disco que falhou é outra vez integrado. Em contrapartida, se dois discos avariarem simultaneamente, seria então impossível remediar a perda de dados.


Nível 4


O nível 4 está muito próximo do nível 3. A diferença encontra-se a nível da paridade, que é feita sobre um sector (chamado bloco) e não a nível da bit, e que é armazenada num disco dedicado. Ou seja, o valor do factor de entrelaçamento é diferente em relação ao RAID 3.


Disco 1
Bloco 1
Bloco 4
Bloco 7
Disco 2
Bloco 2
Bloco 5
Bloco 8
Disco 3
Bloco 3
Bloco 6
Bloco 9
Disco 4
Paridade 1+2+3
Paridade 4+5+6
Paridade 7+8+9




Assim, para ler um número de blocos reduzidos, o sistema não tem de aceder a múltiplos leitores físicos, mas unicamente aqueles sobre os quais os dados estão efectivamente armazenados. Por outro lado, o disco que aloja os dados de controlo deve ter um tempo de acesso igual à soma dos tempos de acesso dos outros discos para não limitar os desempenhos do conjunto.

Nível 5



O nível 5 é semelhante ao nível 4, ou seja, a paridade é calculada a nível de um sector, mas repartida sobre o conjunto dos discos do cluster.


Disco 1
Bloco 1
Bloco 4
Paridade 7+8+9
Disco 2
Bloco 2
Paridade 4+5+6
Bloco 7
Disco 3
Bloco 3
Bloco 5
Bloco 8
Disco 4
Paritdade 1+2+3
Bloo 6
Bloco 9



Desta maneira, o RAID 5 melhora amplamente o acesso aos dados (igualmente em leitura como em escrita) porque o acesso às bits de paridade está repartido sobre os diferentes discos do cluster.

O modo RAID-5 permite obter desempenhos muito próximos dos obtidos com o RAID-0, assegurando ao mesmo tempo uma tolerância às avarias elevada, é a razão pela qual é um dos modos RAID mais interessantes em termos de desempenho e de fiabilidade.

Nota
Sendo o espaço disco útil num cluster de n discos igual a n-1 discos, é interessante ter um grande número de discos para "rentabilizar"o RAID-5.

Nível 6


O nível 6 foi acrescentado aos níveis definidos por Berkeley. Define a utilização de 2 funções de paridade, e por conseguinte o seu armazenamento em dois discos dedicados. Este nível permite assim assegurar a redundância em caso de avaria simultânea de dois discos. Isto significa que são necessários pelo menos 4 discos para instalar um sistema RAID-6.

Comparação


As soluções RAID eleitas são geralmente o RAID de nível 1 e RAID de nível 5.
A escolha de uma solução RAID está ligada a três critérios :

  • A segurança : RAID 1 e 5 oferecem ambos um nível de segurança elevado, contudo o método de reconstrução dos discos varia entre as duas soluções. No caso de avaria do sistema, RAID 5 reconstrói o disco que falta a partir das informações armazenadas nos outros discos, enquanto RAID 1 opera uma cópia disco a disco.
  • Os desempenhos : RAID 1 oferece melhores desempenhos que RAID 5 em leitura, mas sofre aquando de importantes de operações de escrita.
  • O custo: o custo está directamente ligado à capacidade de armazenamento que deve ser aplicada para ter uma certa capacidade efectiva. A solução RAID 5 oferece um volume útil que representa 80 a 90% do volume atribuído (o resto serve evidentemente para o controlo de erro). A solução RAID 1 oferece em contrapartida apenas um volume disponível, que representa 50% do volume total (já que as informações são duplicadas).

Instalação de uma solução RAID


Existem várias maneiras diferentes de instalar uma solução RAID sobre um servidor :

  • de maneira software: trata-se geralmente de um driver a nível do sistema de exploração do computador capaz de criar um só volume lógico com vários discos (SCSI ou IDE).
  • de maneira material
    • com materiais DASD (Direct Access Stockage Device): trata-se de unidades de armazenamento externas fornecidas com uma alimentação própria. Além disso, estes materiais são dotados de conectores que permitem a troca de discos quente (diz-se geralmente que este tipo de disco é hot swappable). Este material gere ele mesmo os seus discos, de modo que é reconhecido como um disco SCSI standard.
    • com controladores de discos RAID : trata-se de cartões que se encaixam em slots PCI ou ISA e permitindo controlar vários discos duros.
Para uma leitura offline, é possível baixar gratuitamente este artigo no formato PDF:
Protecao-os-sistemas-raid .pdf

Veja também


Protection - RAID Systems
Protection - RAID Systems
Protección - Sistemas RAID
Protección - Sistemas RAID
Schutz - die RAID-Systeme
Schutz - die RAID-Systeme
Protection - Les systèmes RAID
Protection - Les systèmes RAID
Protezione - I sistemi RAID
Protezione - I sistemi RAID
Este documento, intitulado « Proteção - Os sistemas RAID »a partir de CCM (br.ccm.net) está disponibilizado sob a licença Creative Commons. Você pode copiar, modificar cópias desta página, nas condições estipuladas pela licença, como esta nota aparece claramente.