Protección - Sistemas RAID

Mayo 2017

Presentación de la tecnología RAID

La tecnología RAID (sigla que significa Redundant Array of Inexpensive Disks, conjunto redundante de discos de bajo costo, o en ciertos casos
Redundant Array of Independent Disks, conjunto redundante de unidades independientes) permite al usuario formar una unidad de almacenamiento a partir de varios discos rígidos. Por tanto, la unidad creada (denominada
clúster) es altamente tolerante a los errores (disponibilidad alta) o posee una mayor capacidad/velocidad de escritura. La distribución de datos en varios discos rígidos proporciona una mayor seguridad de los datos y servicios asociados más fiables.

Esta tecnología fue desarrollada en 1987 por tres investigadores (Patterson, Gibson y Katz) en la Universidad de California (Berkeley). Desde 1992, la junta consultiva para el uso de sistemas RAID (RAID Advisory Board) ha administrado estas especificaciones. Estas consisten en la formación de una unidad con gran capacidad (y por lo tanto costosa) a partir de unidades más pequeñas y económicas (es decir, unidades en las que el MTBF,
Mean Time Between Failure [tiempo medio entre fallos], sea corto).

Con la tecnología RAID, los discos unidos pueden utilizarse de maneras diferentes, denominadas niveles RAID. La Universidad de California ha definido 5 niveles, a los que se han agregado los niveles 0 y 6. Cada uno de estos niveles describe la forma en la que se distribuyen los datos en las unidades:

  • Nivel 0: denominado configuración en bandas (striping)
  • Nivel 1: Nivel 1: denominado réplica (mirroring), emulación (shadowing) o duplicación (duplexing)
  • Nivel 2: Nivel 2: denominado configuración en bandas con paridad (obsoleto)
  • Nivel 3: Nivel 3: denominado conjunto de discos con datos entrelazados en bits
  • Nivel 4: Nivel 4: denominado conjunto de discos con datos entrelazados en bloques
  • Nivel 5: Nivel 5: denominado conjunto de discos con paridad distribuida de entrelazado de bloques
  • Nivel 6: Nivel 5: denominado conjunto de discos con paridad distribuida de entrelazado de bloques



Cada uno de estos niveles constituye una forma de utilizar el clúster, según:

  • el rendimiento
  • el costo
  • el acceso a los discos.

Nivel 0

El nivel RAID-0, denominado de configuración en bandas (striping, concepto al que a veces se denomina erróneamente stripping) consiste en almacenar datos distribuyéndolos en todas las unidades de clúster. Este nivel no tiene redundancia alguna y por tanto no tolera errores. De hecho, si falla una de las unidades, los datos divididos y distribuidos por todas las unidades se perderán.

Sin embargo, dado que cada unidad del clúster posee su propio controlador, esta solución ofrece una velocidad de transferencia elevada.

El RAID-0 supone la yuxtaposición lógica (agregación) de varios discos rígidos físicos. En el modo RAID-0, los datos se anotan en bandas (traducción del término inglés "stripes"):

Unidad 1
Banda 1
Banda 4
Banda 7
Unidad 2
Banda 2
Banda 5
Banda 8
Unidad 3
Banda 3
Banda 6
Banda 9



El término "striping" se utiliza para caracterizar el tamaño relativo de los fragmentos (bandas) almacenadas en cada unidad física. La salida promedio depende de este factor (cuanto más cortas sean las bandas, mejor serán las salidas)

Si alguno de los elementos del clúster es más grande que el resto, el sistema que se usa para almacenar datos en las unidades se bloqueará cuando el disco más pequeño se llene. Por tanto, el tamaño final equivale al doble de la capacidad del más pequeño de los dos discos:

  • dos unidades de 20 GB equivalen a una unidad lógica de 40 GB
  • si una unidad de 10 GB se utiliza junto con una unidad de 27 Gb, se creará una unidad lógica de 20 Gb (17 GB de la segunda unidad quedarán entonces inutilizados)

N.B.

Se recomienda utilizar dos discos del mismo tamaño para el RAID-0; de lo contrario, no se podrá explotar al máximo la unidad con mayor capacidad.

Nivel 1

El objetivo del nivel 1 es duplicar la información y almacenarla en varias unidades. Los términos réplica (mirroring) o emulación (shadowing) se utilizan para describir este procedimiento.

Unidad 1
Banda 1
Banda 2
Banda 3
Unidad 2
Banda 1
Banda 2
Banda 3
Unidad 3
Banda 1
Banda 2
Banda 3


El nivel 1 brinda una mayor seguridad de datos, ya que si una de las unidades falla los datos se guardan en la otra. Asimismo, la lectura de los datos puede ser mucho más rápida cuando ambos discos están en funcionamiento. Por último, dado que cada unidad tiene su propio controlador, el servidor puede continuar funcionando aún cuando una de las unidades falle, de la misma manera en que un camión puede seguir en movimiento si uno de sus neumáticos revienta, ya que posee varios neumáticos en cada eje.

Por el contrario, la tecnología RAID-1 es muy costosa si se tiene en cuenta que sólo se aprovecha la mitad de la capacidad de almacenamiento.

Nivel 2

Actualmente el nivel RAID-2 es obsoleto, ya que utiliza un código Hamming para la corrección de errores (códigos ECC - Error Correction Code (código de corrección de errores). En la actualidad, el código Hamming se encuentra directamente integrado dentro de los controladores de los discos rígidos.

Esta tecnología consiste en el almacenamiento de datos bajo el mismo principio que se aplica al RAID-0, aunque la escritura de bits de verificación ECC se realiza en una unidad aparte (normalmente se utilizan 3 unidades ECC para 4 unidades de datos).

La tecnología RAID 2 ofrece rendimientos mediocres pero un alto nivel de seguridad.

Nivel 3

La tecnología del nivel 3 RAID almacena datos en bytes en cada unidad y utiliza una de las unidades para almacenar un bit de paridad.


Unidad 1
Byte 1
Byte 4
Byte 7
Unidad 2
Byte 2
Byte 5
Byte 8
Unidad 3
Byte 3
Byte 6
Byte 9
Unidad 4
Paridad 1+2+3
Paridad 4+5+6
Paridad 7+8+9

De esta manera, si uno de los discos fallara, sería posible reconstituir la información a partir de las demás unidades. Luego de reconstituir la información, el contenido de la unidad con fallos volvería a estar completo. Por otro lado, si dos de las unidades fallaran en forma simultánea, sería entonces imposible recuperar cualquier dato perdido.


Nivel 4

La tecnología RAID 4 es muy similar a la del nivel 3. La diferencia reside en el nivel de paridad: El nivel 4 utiliza striping a nivel de bloque con un disco de paridad dedicado, mientras que el nivel 3 utiliza striping a nivel de byte. Más precisamente, esto significa que el striping es diferente al del RAID 3.


Unidad 1
Bloque 1
Bloque 4
Bloque 7
Unidad 2
Bloque 2
Bloque 5
Bloque 8
Unidad 3
Bloque 3
Bloque 6
Bloque 9
Unidad 4
Paridad 1+2+3
Paridad 4+5+6
Paridad 7+8+9


Para leer una cantidad reducida de bloques, no es necesario que el sistema acceda a unidades físicas múltiples, sino solamente a aquéllas en las que los datos están realmente almacenados. Por el contrario, la unidad que posee los datos de control debe tener un tiempo de acceso equivalente a la suma del tiempo de acceso de los demás discos para no limitar el rendimiento del conjunto.

Nivel 5

El nivel 5 es similar al nivel 4, es decir que la paridad se calcula a nivel del bloque pero se distribuye en todas las unidades del clúster.


Unidad 1
Bloque 1
Bloque 4
Paridad 7+8+9
Unidad 2
Bloque 2
Paridad 4+5+6
Bloque 7
Unidad 3
Bloque 3
Bloque 5
Bloque 8
Unidad 4
Paridad 1+2+3
Bloque 6
Bloque 9



De esta manera, el RAID 5 mejora en gran medida el acceso a los datos (tanto en escritura como en lectura) ya que el acceso a los bits de paridad se distribuye en las diferentes unidades del clúster.

RAID-5 brinda rendimientos muy similares a los obtenidos en RAID-0 al tiempo que asegura una alta tolerancia de errores. Por este motivo, es uno de los mejores modos RAID en términos de rendimiento y confiabilidad.

N.B.

Ya que el espacio utilizable de unidad en un clúster de n unidades equivale a n-1 unidades, se recomienda contar con un gran número de unidades para lograr que el RAID 5 sea más "rentable".

Nivel 6

Se agregó el nivel 6 a los niveles definidos por los investigadores de Berkeley. Se define el uso de dos funciones de paridad y su almacenamiento en dos unidades dedicadas. Este nivel asegura redundancia en caso de que ambas unidades se dañen simultáneamente. Esto significa que se necesitan al menos 4 unidades para implementar el sistema RAID-6.

Comparación

Las soluciones RAID que generalmente se utilizan son los niveles 1 y 5.

La elección de una solución RAID depende de tres criterios:

  • seguridad: Tanto el RAID 1 como el 5 ofrecen un alto nivel de seguridad. Sin embargo, el método de reconstrucción de unidades es diferente en cada solución. Si el sistema falla, el RAID 5 reconstruye la unidad que falta con la información almacenada en las otras unidades, mientras que RAID 1 proporciona una copia en cada unidad.
  • Rendimiento: El RAID 1 ofrece un mayor rendimiento que el RAID 5 en términos de lectura, pero su rendimiento es menor en términos de escritura.
  • Costo: el costo está directamente vinculado a la capacidad de almacenamiento que debe implementarse para tener una capacidad efectiva específica. La solución RAID 5 ofrece un volumen utilizable que representa entre el 80 y el 90% del volumen asignado. (el resto se utiliza para la corrección de errores). Por otro lado, el volumen disponible de la solución RAID 1 constituye sólo el 50% del volumen total (si se tiene en cuenta que la información se duplica).

Cómo implementar la solución RAID

Hay diferentes maneras de implementar una solución RAID en un servidor.

  • RAID basado en software: Generalmente, aquí se necesita un driver en el nivel del sistema operativo del ordenador que sea capaz de crear un volumen lógico con varias unidades (SCSI o IDE).
  • RAID basado en hardware:
    • con los DASD (Direct Access Storage Device, dispositivo de almacenamiento de acceso directo): unidades de almacenamiento externo con fuente de alimentación propia. Además, estos dispositivos cuentan con conectores que permiten el cambio de unidades mientras se encuentran encendidos (dichas unidades son "intercambiables en caliente"). Estos dispositivos administran sus unidades en forma automática, por lo que se los reconoce como unidades SCSI estándares.
    • con controladores RAID: tarjetas que se colocan en ranuras de expansión PCI o ISA y que permiten el control de varios discos rígidos.

Consulta también


Protection - Les systèmes RAID
Protection - Les systèmes RAID
Protezione - I sistemi RAID
Protezione - I sistemi RAID
Proteção - Os sistemas RAID
Proteção - Os sistemas RAID
Última actualización: 18 de octubre de 2016 a las 11:04 por Carlos-vialfa.
El documento «Protección - Sistemas RAID» se encuentra disponible bajo una licencia Creative Commons. Puedes copiarlo o modificarlo libremente. No olvides citar a CCM (es.ccm.net) como tu fuente de información.