Estructura RAID. Diferencias, ventajas, inconvenientes.

RAID

•    “Redundant Array of Inexpensive/Independent Disks”, Tabla de Discos Redundates (comenzó siendo baratos)

•    RAID – múltiples discos que proporcionan fiabilidad a través de redundancia
- Antiguamente también para velocidad

•    El RAID se ordena en seis diferentes niveles: RAID 0, RAID 1, RAID 2, RAID 3, RAID 4, RAID 5, RAID 6


Mejoras generales

•    Hay varias mejoras en las técnicas de disco que implican el uso de múltiples discos trabajando cooperativamente
•    La técnica “disk striping” usa un grupo de discos como una única unidad de almacenamiento
•    Los esquemas RAID mejoran la ejecución y mejoran la fiabilidad del sistema de almacenamiento almacenando datos redundantes.
-    Las técnicas de mirroring o shadowing mantienen duplicados de cada disco
-    La técnica de block interleaved parity usa mucha menos redundancia

RAID    0

•    Un disco duro virtual se divide en franjas (“strips”)
-    Strip 0: sector 0, …, i-1
-    Strip 1: sector i, …, 2i-1
-    Etc.
•    Distribución de strips sobre discos independientes
-    Posible lectura/escritura en paralelo
•    RAID 0 soporta manejo eficiente de una enorme cantidad de datos (p.e. para streaming de vídeo)
•    El fallo de uno de los discos destruye el RAID
•    Capacidad de almacenamiento : Sum(Ni)


RAID    1

•    Todos los discos se mantienen redundantes
•    El proceso de escritura necesita escribir en el disco
original y en el de respaldo (“backup”)
•    La lectura se puede distribuir entre el disco original y el disco de respaldo
-    Balance de carga
-    Velocidad de transferencia doble
•    Un fallo de disco (backup u original) mantiene en pie el RAID


RAID    2

•    Almacena cada bit en un disco por separado
-    Almacena bits de paridad en discos adicionales
-    Como un código de correción de errores (ECC) en RAM pero implementado en discos: 4 + 3
-    Posible cuando muchos discos están disponibles pero no se aplica a menudo


RAID 3
-    Se sabe qué sector/disco ha fallado
-    Un único disco de paridad de bit permite corregir
-    Se necesitan menos recursos que en RAID 2


RAID    4
•    Organización de la distribución de la paridad por bloques (block interleaved parity).
•    El striping es como en RAID 0 pero un disco mantiene el bloque de paridad para los N-1 discos restantes
•    El proceso de escritura de grandes escrituras puede actualizar la paridad mientras escribe
•    Las pequeñas escrituras sufren porque no se pueden ejecutar en paralelo y el disco de paridad tiene que ser accedido por separado
•    Reconstrucción posible de un disco (fallido)

Una escritura requiere de cuatro accesos (lectura- modificación-escritura)
•Leer datos viejos y paridad
•Escribir datos nuevos y paridad


RAID    5
•    Paridad distribuida en bloques entrelazadados (Block- interleaved distributed parity)
•    Datos y paridad dispersos entre N+1 discos
•    Capacidad de almacenamiento (N ≡ capacidad de todos los discos): N-1
•    Ningún fallo de un disco destruye el RAID (como RAID4)

RAID    6

•    Esquema de redundancia P+Q (Ej.: Red-Solomon)
•    Es como RAID 5 pero almacena más información extra para posibles múltiples fallos de HD.
•    En lugar de paridad se usan códigos de corrección de errores coo el RED SOLOMON CODE.
•    Ejemplo: se almacenan 2 bits por cada 4 bit; se puede recuperar el fallo de dos discos

RAID    0+1

•    Combinación de RAID 0 y RAID 1
•    Mejor rendimiento que RAID 5
•    Capacidad de almacenamiento (N ≡ capacidad de todos los discos): N/2
-    Bastante caro
-    Compromiso entre redundancia y rendimiento
•    El conjunto de discos se desarma y después se hacen copias espejo

RAID    1+0 (RAID10)

•    Parecido a RAID 0+1 (RAID 01)
•    Primero se hace una copia espejo del disco y después se desarma
•    Ventaja teórica
-    Un disco falla en RAID01: un strip entero no está disponible (el otro strip sí lo está)
-    Un disco falla en RAID10: el disco que falla no está disponible pero su espejo sí lo está

“Hot spare disk”

•    Un disco no usado para datos.
•    Reemplaza un disco fallido durante la ejecución, permitiendo así reconstruir el array.
•    Posibilita el reestablecimiento automático del nivel de RAID

Selección del nivel RAID

•    RAID 0 sólo para administración de datos de alto rendimiento sin seguridad en caso de fallo
•    Reconstrucción rápida: RAID 1
-    sólo copia el disco
-    tiene un gran coste en recursos en relación al almacenamiento
•    RAID 0+1 y 1+0: ambas a la vez
•    RAID 5 es un compromiso entre el gran volumen de almacenamiento y la fiabilidad
•    RAID 2, 3, 6 apenas se implementan – no tienen relevancia en el mercado hoy día