En el mundo actual, los datos se han convertido en uno de los activos más valiosos para las organizaciones. Desde la información empresarial crítica, hasta los archivos personales, la pérdida de datos puede tener consecuencias devastadoras. Para reducir este riesgo, las soluciones RAID (Redundant Array of Independent Disks) han demostrado ser una herramienta crucial en la protección y disponibilidad de datos.
En este post, haremos un repaso por niveles RAID más utilizados. Comprender cómo funcionan estos niveles y cómo se pueden implementar de manera efectiva permitirá a las organizaciones mantener la integridad de sus datos y garantizar una continuidad operativa ininterrumpida.
RAID 0
También conocido como «striping«, es un nivel de almacenamiento que se enfoca en mejorar el rendimiento y la capacidad de transferencia de datos al dividir los datos en bloques y distribuirlos entre varios discos. Se requieren al menos dos discos para crear el conjunto, formando una sola unidad lógica.
Los datos se dividen en bloques de igual tamaño y se distribuyen secuencialmente entre los discos. Por ejemplo, si tienes dos discos A y B, el bloque 1 se almacena en el disco A, el bloque 2 en el disco B, el bloque 3 en el disco A nuevamente, y así sucesivamente. Esta distribución en paralelo permite que las operaciones de lectura y escritura se realicen simultáneamente en los discos, mejoran el rendimiento general del sistema.
La capacidad total del conjunto es la suma de las capacidades de todos los discos involucrados. Por ejemplo, dos discos de 500 GB formarían un conjunto de 1 TB.
Un dato muy importante a tener en cuenta es que no existe redundancia ni protección contra fallos. Si uno de los discos falla, se perderán todos los datos del conjunto.
RAID 0 generalmente se utiliza en situaciones donde la velocidad y el rendimiento son prioritarios, como en aplicaciones que requieren un acceso rápido a grandes archivos, como la edición de video o el procesamiento de datos.
RAID 1
También conocido como «mirroring» o «espejo», es un nivel de almacenamiento que se enfoca en la redundancia y la protección de datos al crear copias idénticas de los datos en dos o más discos.
Requiere al menos dos discos para crear el conjunto. Se configuran en pares y los datos se escriben en cada pareja de discos, de forma idéntica y simultánea. Por ejemplo, si tienes dos discos A y B, cualquier dato escrito en el disco A se duplicará en el disco B, y viceversa. Esta duplicación garantiza que los dos discos mantengan en todo momento una copia exacta de los datos.
La capacidad efectiva es igual a la capacidad de un solo disco, ya que todos los datos se duplican en cada disco. Si se dispone de dos discos de 500 GB cada uno, el conjunto tendrá una capacidad efectiva total de 500 GB.
En términos de rendimiento, no ofrece mejoras significativas de velocidad escritura en comparación con un solo disco, ya que los datos se escriben en ambos discos de manera simultánea. En cuando a la velocidad de lectura, puede mejorar ligeramente, ya que se pueden leer los datos desde cualquiera de los discos espejo.
RAID 10
También conocido como «RAID 1+0» o «mirroring with striping«, es un nivel de almacenamiento que combina las características de los niveles 1 (espejo) y 0 (striping). RAID 10 proporciona tanto redundancia como rendimiento mejorado al utilizar múltiples discos en una configuración específica.
Este sistema requiere al menos 4 discos duros para crear el conjunto, organizados en pares, donde cada grupo estará configurado como un espejo (mirroring). Los datos se distribuyen en bloques (striping) a través de las parejas de discos espejo y se escriben simultáneamente en ambos discos. Cada bloque de datos se duplica en los dos discos, garantizando redundancia y protección contra fallos de un disco.
Si contamos con cuatro discos A, B, C y D, el bloque 1 se almacena en el par A (disco A1 y disco A2), el bloque 2 en el par B (disco B1 y disco B2), el bloque 3 en el par C (disco C1 y disco C2), el bloque 4 en el par D (disco D1 y disco D2), y así sucesivamente.
RAID 10 proporciona tolerancia a fallos. Si un disco falla, los datos se mantienen intactos en el otro disco del mismo par y únicamente sería necesario sustituir el disco averiado y esperar a que la reconstrucción finalice.
Es muy recomendable realizar una copia de seguridad tan pronto como se detecte una avería, puesto que en esos momentos perderíamos la redundancia y la reconstrucción implica volver a copiar todos los datos en el nuevo disco, algo que provoca mayor estrés, tanto en la controladora como en los discos.
La capacidad efectiva es la mitad de la capacidad total de los discos involucrados, ya que la mitad se utiliza para la duplicación de datos. Si se dispone de 4 discos de 500 GB cada uno, la capacidad efectiva total de 1 TB.
Este sistema ofrece un rendimiento mejorado en comparación con un solo disco. Durante las operaciones de lectura, los bloques de datos se pueden leer simultáneamente de diferentes pares de discos, mejorando la velocidad de lectura. Durante las operaciones de escritura, los bloques de datos se dividen y se escriben en los discos correspondientes de manera simultánea, mejorando la velocidad de escritura.
RAID 5
Es un nivel de almacenamiento de datos que combina múltiples discos duros en un solo conjunto lógico para mejorar el rendimiento, la capacidad de almacenamiento y la tolerancia a fallos.
Se requieren al menos tres disco duros para crearlo. Los datos se distribuyen de manera uniforme, dividiendo los datos en bloques de igual tamaño. Para cada bloque de datos se calcula una paridad utilizando operaciones lógicas (XOR). Los bloques de datos y paridad se distribuyen de manera intercalada entre todos los discos. Por ejemplo, si tienes tres discos A, B y C, los datos del bloque 1 se almacenan en el disco A, el bloque 2 en el disco B, el bloque 3 en el disco C, el bloque 4 en el disco A nuevamente, y así sucesivamente.
Si un disco falla, los datos perdidos pueden ser reconstruidos utilizando la información de paridad almacenada en los otros discos.
La capacidad efectiva depende del número de discos utilizados. En el caso de 3 discos de 500 GB cada uno, la capacidad sería de 1 TB, puesto que los 500 GB restantes estarían destinados a la paridad. Cuantos más discos se empleen, menos capacidad se desperdiciará.
Te puede interesar → Calculadora RAID
RAID 5 ofrece más rendimiento que un único disco, debido a la distribución de datos en paralelo. Durante las operaciones de lectura, los bloques de datos se pueden leer simultáneamente de diferentes disco, lo que mejora la velocidad de lectura. Durante las operaciones de escritura se requiere tiempo adicional para calcula y escribir la paridad en el disco correspondiente.
Es importante tener en cuenta que la sustitución de un disco averiado implica la reconstrucción de los discos perdidos a partir de la paridad almacenada en el resto, un proceso que requiere mucho tiempo y que provoca un gran estrés en la controladora y los discos, por lo que es uno de los momentos más susceptibles a nuevos fallos.
El problema de los discos SSD con RAID 5
RAID 5 es una solución de almacenamiento excelente que ofrece un equilibrio entre rendimiento, capacidad y tolerancia a fallos. Sin embargo, cuando se utiliza con unidades de estado sólido (SSD), hay ciertas consideraciones a tener en cuenta.
Los SSD tienen una vida útil determinada por la cantidad de escrituras que pueden manejar, conocida como «ciclos de escritura/programación y borrado» (P/E cycles). Cada vez que se escribe en una celda de memoria de un SSD, se desgasta un poco, y eventualmente, después de un cierto número de escrituras, esa celda ya no será fiable para almacenar datos.
La configuración RAID 5 tiene un impacto directo en este aspecto debido a algo conocido como «penalización de escritura de RAID». Esto se refiere a la cantidad de operaciones de escritura que un RAID tiene que hacer por cada operación de escritura solicitada. En el caso de RAID 5, por cada operación de escritura, se deben hacer cuatro operaciones de disco: leer datos antiguos, leer paridad antigua, escribir datos nuevos y escribir nueva paridad. Esto significa que se realizan muchas más escrituras en los SSD en comparación con un solo disco o incluso otras configuraciones de RAID, lo que puede llevar a que los SSD se desgasten más rápido.
Por otro lado, el rendimiento en la escritura también puede verse afectado. Los SSD son generalmente más rápidos que los discos duros tradicionales, pero en un RAID 5, debido al cálculo y escritura de paridad adicional, la velocidad de escritura puede ser más lenta que en otras configuraciones de RAID.
Finalmente, la recuperación de fallas en un RAID 5 puede ser un proceso intensivo de lectura, y si un SSD está cerca del final de su vida útil, este proceso podría causar un fallo adicional.
RAID 6
Este nivel de almacenamiento utiliza una técnica de distribución de paridad doble para proporcionar una mayor tolerancia a fallos. Para poder implementarlo se necesitan un mínimo de cuatro discos. La primera paridad se calcula utilizando operaciones XOR sobre los datos y la segunda aplicando también operaciones XOR, pero esta vez sobre la primera paridad.
La principal ventaja de RAID 6 sobre el 5 es que permite una mayor tolerancia a fallos, puesto que es capaz de reconstruir los datos incluso con 2 discos dañados de forma simultánea.
Si dispones de cuatro discos A, B, C y D, los datos del bloque 1 se almacenan en el disco A, el bloque 2 en el disco B, el bloque 3 en el disco C, el bloque 4 en el disco D, y así sucesivamente.
Este sistema ofrece mejor rendimiento de lectura en comparación con un solo disco, puesto que los datos pueden ser leídos a la vez desde varios discos. En las de escritura se requiere tiempo adicional para poder escribir las paridades actualizadas en los discos correspondientes.
En entornos en los que se utilicen discos de gran capacidad, es muy recomendable utilizar RAID 6, puesto que el tiempo necesario para una reconstrucción completa después de un fallo es muy alto y la probabilidad de fallo aumenta considerablemente.
Su implementación sobre discos SSD tiene unos problemas similares al RAID-5 en cuanto a desgaste prematuro de los discos, solo que en este caso el problema se agrava por la implementación de la doble paridad.
JBOD
JBOD (Just a Bunch of Disks) no es realmente un nivel de almacenamiento RAID, sino una configuración básica de discos independientes en un sistema de almacenamiento.
En lugar de combinar los discos, JBOD simplemente muestra los discos individuales como una única entidad de almacenamiento, sin ninguna combinación o configuración especial.
Te puede interesar → JBOD: qué es y sus diferencias con RAID
Raid Z
Es un tipo de RAID por software que está diseñado para funcionar con el sistema de archivos ZFS (Zettabyte File System), creado originalmente por Sun Microsystems. ZFS es un sistema de archivos avanzado que proporciona muchas características que los sistemas de archivos tradicionales no ofrecen, como la integridad de los datos y la capacidad de eliminar la mayoría de los errores de los datos.
Existen tres variantes de RAID-Z:
- RAID-Z1 ofrece protección contra la pérdida de un solo disco, similar a RAID 5.
- RAID-Z2 proporciona protección contra la pérdida de dos discos, similar a RAID 6.
- RAID-Z3 aumenta la protección a la pérdida de hasta tres discos.
Su principal ventaja sobre el resto de los RAID que utilizan paridad, además del rendimiento, es la protección contra el error de escritura por caída del sistema de RAID. En un RAID-5, si se produce un corte eléctrico antes de que todos los bloques se hayan escrito en el disco, la paridad se desincroniza con los datos y deja de ser útil. Gracias al sistema ZFS, que utiliza repartos de discos en bandas RAID de ancho variable, este problema desaparece.
Fakeraid
Fakeraid, también conocido como RAID por hardware basado en software o RAID por firmware, se refiere a una configuración que simula un RAID por hardware utilizando controladoras RAID incorporadas en la placa base de un sistema. A diferencia de los RAID por software o los RAID por hardware dedicado, el fakeraid depende de una combinación de controladores y software para implementar y administrar el RAID.
En un fakeraid, la controladora integrada en la placa base se encarga de gestionar los discos duros y las operaciones de RAID, mientras que el software del sistema operativo se utiliza para configurar y administrar el RAID. A nivel de hardware, el fakeraid puede parecer similar a un RAID por hardware dedicado, pero en realidad, gran parte del procesamiento y la gestión se realiza a través del controlador y el software del sistema operativo.
Algunas controladoras integradas pueden ofrecer características avanzadas y un buen rendimiento, mientras que otras pueden tener limitaciones en cuanto a compatibilidad o capacidades de RAID.
Fakeraid puede ser una opción viable para aquellos que desean aprovechar las funcionalidades RAID sin invertir en una controladora dedicada. Sin embargo, es importante conocer las limitaciones y características específicas del hardware antes de implementarlo en un sistema.
Discos HOT-SPARE
Un elemento muy útil en muchos sistemas RAID es el disco hot spare. Se trata de un disco adicional que está en espera y listo para entrar en acción tan pronto como se detecte un fallo en uno de los discos activos. En esencia, el disco hot spare es una capa adicional de seguridad en caso de fallo del hardware.
El beneficio de tener un disco hot spare es que permite lanzar la reconstrucción de forma inmediata en caso de fallo de un disco, evitando la necesidad de intervención manual para reemplazar el disco defectuoso y luego reconstruir los datos perdidos.
La decisión de incluir un disco hot spare en el sistema depende de la importancia de los datos y el tiempo de inactividad que la organización puede permitirse. Si los datos son críticos y el tiempo de inactividad es caro, un disco hot spare puede ser una inversión que vale la pena para proteger su información y mantener el sistema en funcionamiento en caso de fallos inesperados.
Los diferentes niveles de RAID proporcionan una variedad de enfoques para balancear el rendimiento, la redundancia y la capacidad de almacenamiento, cada uno con sus propias ventajas y desventajas únicas. En este artículo, nos hemos centrado en los niveles más comúnmente utilizados, desde el 0, que prioriza el rendimiento por encima de la redundancia, hasta el 6, que ofrece protección contra la falla de hasta dos discos.
Existen otros niveles de RAID, como el 2, 3, 4 y 7, así como otras combinaciones complejas como RAID 50 y 60. Estos niveles son menos comunes en la práctica debido a diversos factores, incluyendo su complejidad, los requerimientos de hardware, el costo o la eficiencia relativa en comparación con los niveles más populares.
La elección del nivel adecuado debe ser determinada por las necesidades específicas y los recursos disponibles para su implementación. El mejor nivel para una empresa puede no ser el mismo para otra, dependiendo de factores como el tipo de datos a almacenar, el rendimiento requerido, el presupuesto y el nivel de tolerancia a fallos que se necesite.
Por último, es importante recordar que ninguna configuración de RAID reemplaza la necesidad de realizar copias de seguridad regulares. La redundancia que proporciona RAID puede proteger contra el fallo físico de un disco, pero no contra la corrupción de datos, el error humano o los desastres naturales. Por eso, independientemente del nivel seleccionado, siempre es esencial contar con una estrategia de respaldo de datos sólida.