A tecnologia RAID é uma alternativa para aumentar a velocidade de processamento e a segurança dos seus dados no computador. Saiba o que é o RAID e quais os diferentes tipos dessa tecnologia.
A tecnologia RAID (Redundant Array of Independent Disks ou Conjunto Redundante de Discos Independentes) permite constituir uma unidade de armazenamento a partir de diversos discos rígidos. A unidade criada (chamada cluster) tem grande tolerância às avarias e maior capacidade/velocidade. A distribuição dos dados nos vários discos rígidos permite aumentar a segurança e viabilizar os serviços associados.
Esta tecnologia foi criada em 1987 por três pesquisadores, Patterson, Gibson e Katz na Universidade da Califórnia. Desde 1992, é o RAID Advisory Board que gerencia estas especificações. Ele consiste em constituir um disco de grande capacidade (por conseguinte, dispendioso) com discos menores e mais baratos (MTBF - Mean Time Between Failure).
Os discos montados de acordo com a tecnologia RAID podem ser utilizados de diferentes maneiras, chamadas Níveis RAID. A Universidade de Califórnia definiu cinco, aos quais foram acrescentados os níveis 0 e 6. Cada um deles descreve a maneira como os dados são repartidos nos discos. Cada nível constitui um modo de utilização do cluster, em função dos desempenhos, dos custo e do acesso aos discos
O nível RAID 0, chamado striping (entrelaçamento ou agregado por banda) consiste em armazenar os dados repartindo-os no conjunto dos discos do cluster. Desta maneira, não há redundância, assim, não podemos falar de tolerância às avarias. Com efeito, no caso de insuficiência de um dos discos, a integralidade dos dados repartidos nos discos será perdida. Contudo, já que cada disco do cluster tem o seu próprio controlador, isto constitui uma solução que oferece uma velocidade de transferência elevada.
O RAID 0 é a justaposição lógica (agregação) dos vários discos rígidos físicos. Em modo RAID 0, os dados são escritos por bandas (em inglês stripes):
|
|
|
Fala-se de fator de entrelaçamento para caracterizar a dimensão relativa dos fragmentos (bandas) armazenados em cada unidade física. O débito de transferência médio depende deste fator (quanto menor é cada banda, melhor é o débito). Se um dos elementos do cluster for maior que os outros, o sistema de preenchimento por banda será bloqueado quando o disco menor estiver preenchido.
A dimensão final é assim igual ao dobro da capacidade do mais pequeno dos dois discos: dois discos de 20 Go dão um disco lógico de 40 Go e um disco de 10 Go utilizado conjuntamente com um disco de 27 Go permitirá obter um disco lógico de 20 Go (17 Go do segundo disco serão então inutilizados):
É recomendado utilizar discos do mesmo tamanho para fazer RAID 0, caso contrário, o disco de maior capacidade não será plenamente explorado |
A função do nível 1 é de duplicar a informação a ser armazenada nos vários discos. Este método é dito mirroring (espelhamento) ou shadowing (sombreamento):
|
|
|
Obtém-se, desse modo, maior segurança dos dados, porque se um dos discos tem problema, os dados são salvos no outro. Por outro lado, a leitura pode ser muito mais rápida quando os dois discos estão em funcionamento. Por último, já que cada disco possui seu próprio controlador, o servidor pode continuar a funcionar mesmo quando um dos discos tem problema. Por outro lado, a tecnologia RAID 1 é muito cara, pois utiliza apenas a metade da sua capacidade de armazenamento.
O nível RAID 2 é obsoleto, porque propõe um controle de erro por código Hamming (códigos ECC - Error Correction Code), este último está agora integrado diretamente nos controladores de discos rígidos.
Esta tecnologia consiste em armazenar os dados de acordo com o mesmo princípio do RAID 0, mas escrevendo numa unidade distinta os bits de controle ECC (geralmente 3 discos ECC são utilizados para 4 discos de dados).
A tecnologia RAID 2 tem um desempenho que deixa a desejar, mas, por outro lado, tem um nível de segurança elevado.
O nível 3 propõe armazenar os dados sob a forma de bytes em cada disco e dedicar um dos discos ao armazenamento de um bit de paridade:
|
|
|
|
Desta maneira, se um dos discos falhar, seria possível reconstituir a informação a partir dos outros discos. Após a reconstituição, ou recuperação, o conteúdo do disco que falhou é novamente integrado. Por outro lado, se dois discos estão com problema simultaneamente, seria impossível evitar a perda de dados.
O nível 4 é muito parecido do nível 3. A diferença encontra-se na paridade, que é feita em um setor, chamado bloco) e não no bit, e que é armazenado num disco dedicado, ou seja, o valor do fator de entrelaçamento é diferente em relação ao RAID 3:
|
|
|
|
Assim, para ler um número de blocos reduzidos, o sistema não tem que acessar os múltiplos leitores físicos, mas unicamente aqueles nos quais os dados estão efetivamente armazenados. Por outro lado, o disco que armazena os dados de controle tem que ter um tempo de acesso igual à soma dos tempos de acesso dos outros discos, para não limitar os desempenhos do conjunto.
O nível 5 é semelhante ao nível 4, ou seja, a paridade é calculada em um setor, mas repartida pelo conjunto dos discos do cluster:
|
|
|
|
Desta maneira, o RAID 5 melhora amplamente o acesso aos dados, tanto em leitura quanto em escrita, porque o acesso aos bits de paridade está repartido nos diferentes discos do cluster.
O RAID 5 permite obter desempenhos muito próximos dos obtidos com o RAID 0, garantindo ao mesmo tempo uma tolerância às avarias bastante elevada, é a razão pela qual é um dos RAID mais interessantes em termos de desempenho e de fiabilidade:
Sendo o espaço disco útil num cluster de n discos iguais a n-1 discos, é interessante ter um grande número de discos para rentabilizar o RAID 5 |
O nível 6 foi acrescentado aos níveis definidos por Berkeley. Ele define a utilização de 2 funções de paridade e, assim, o tem o seu armazenamento em dois discos dedicados. Este nível garante a redundância em caso de pane simultânea de dois discos. Isto significa que são necessários pelo menos 4 discos para instalar um sistema RAID 6.
Esse tipo alternativo é bem simples. Ele apenas adiciona as capacidades dos diversos discos rígidos para obter uma capacidade única da partição lógica. Não se obtém nem o desempenho, nem a segurança. Quando o primeiro disco está cheio, ele continua a escrever no disco seguinte.
As soluções RAID preferidas são geralmente a RAID de nível 1 e a RAID de nível 5. Mas, saiba que, a escolha de uma solução RAID obedece a três critérios:
A segurança: as soluções RAID 1 e 5 oferecem ambas um nível de segurança elevado, contudo o método de reconstrução dos discos varia entre as duas soluções. No caso de pane do sistema, a RAID 5 reconstitui o disco que falta a partir das informações armazenadas nos outros discos, enquanto RAID 1 opera uma cópia disco a disco.
O desempenho: a solução RAID 1 oferece melhor desempenho do que a RAID 5 em leitura, mas sofre nas operações de escrita.
O custo: o custo está diretamente ligado à capacidade de armazenamento que deve ser aplicada para ter uma certa capacidade efetiva. A solução RAID 5 oferece um volume útil que representa 80 a 90% do volume atribuído (o resto serve evidentemente para o controle de erro). A solução RAID 1 oferece em contrapartida apenas um volume disponível, que representa 50% do volume total (já que as informações são duplicadas).
Existem vários métodos para instalar uma solução RAID em um servidor: com um software, que geralmente é um driver do sistema operacional capaz de criar um só volume lógico com vários discos SCSI ou IDE.
O modo material usando DASD (Direct Access Stockage Device), que são unidades de armazenamento externas fornecidas com uma alimentação própria. Além disso, estes materiais são dotados de conectores que permitem a troca de discos.
Esse material gerencia os seus próprios discos, de modo que é reconhecido como um disco SCSI standard; com os controladores de discos RAID que são cartões que se encaixam em slots PCI ou ISA e permitem controlar vários discos rígidos.
Foto: © kozirsky - Shutterstock.com