¿Qué es RAID?
● La interfaz SCSI es una interfaz de uso general que permite conectar un adaptador host y ocho controladores periféricos SCSI al bus SCSI. Los dispositivos periféricos incluyen discos, cintas, CD-ROM, unidades ópticas regrabables, impresoras, escáneres y equipos de comunicaciones.
● SCSI es una interfaz multitarea con función de arbitraje de bus. Varios periféricos conectados a un único bus SCSI pueden funcionar simultáneamente y los dispositivos del SCSI comparten el bus por igual.
● La interfaz SCSI puede realizar transmisión de datos síncrona o asíncrona, con una velocidad de transmisión síncrona de hasta 10 MB/segundo y una velocidad de transmisión asíncrona de hasta 1,5 MB/segundo. La interfaz SCSI se puede conectar a dispositivos externos con un cable de hasta 6 metros de longitud.
El estándar SCSI original tenía una velocidad de transferencia síncrona máxima de 5 MB/s, y posteriormente SCSI II proporcionó dos métodos para aumentar la velocidad de transferencia. Una es aumentar la frecuencia de transmisión de datos, es decir, Fast SCSI. Dado que la frecuencia se duplica, puede alcanzar hasta 10 MB/s. La otra opción para aumentar la velocidad es duplicar la frecuencia de transmisión y también aumentar el ancho de la misma. la ruta de datos aumentó de 8 bits a 16 bits, es decir, SCSI ancho, la velocidad de transferencia síncrona máxima es de 20 MB/s.
Esta interfaz es un sistema fácil de integrar que puede reducir costos y mejorar la eficiencia. Cada vez más dispositivos adoptarán el estándar de interfaz SCSI. Por lo tanto, cada vez más discos duros y unidades ópticas SCSI adoptan la interfaz SCSI. .
RAID es la abreviatura de Redundant Array of Independent Disk, que significa matriz redundante de discos independientes. La tecnología Redundant Array of Independent Disks (RAID) nació en 1987 en la Universidad de California, Berkeley.
Matriz de discos RAID (Redundant Array of Independent Disks)
Explicado de forma sencilla, combina N discos duros a través de un controlador RAID (dividido en hardware y software) en un único virtual de gran capacidad. Se utilizan discos duros, que se caracterizan por una velocidad de lectura más rápida y una mayor tolerancia a fallas de N discos duros. Por lo tanto, se utiliza RAID como método de acceso principal para el almacenamiento de datos en lugar de una solución de respaldo.
Existe un concepto básico en RAID llamado EDAP (Disponibilidad y protección extendida de datos), que enfatiza la importancia de ampliar la capacidad del disco duro y la capacidad del disco duro para servir como solución de respaldo. Datos listos Datos listos El correo electrónico, las redes sociales y las aplicaciones en la nube siempre están listos con las últimas versiones y el estado en el momento en que enciende su computadora. Modo avanzado El modo avanzado proporciona un entorno UEFI BIOS más completo y está especialmente diseñado para overclockers y usuarios intensivos que desean tener el máximo control del hardware de su computadora.
Una vez que la matriz RAID falla, el proveedor de servicios de hardware solo puede reinicializarla o reconstruirla para el cliente, por lo que los datos del cliente se perderán irreparablemente. Por lo tanto, para la recuperación de datos de RAID0, RAID1, RAID5 y matrices de discos de la serie RAID combinadas, después de que se produzca una falla, siempre que la matriz de discos no se inicialice, existe la posibilidad de recuperar los datos de la matriz de discos fallida.
Especificaciones técnicas
(1) Introducción a las especificaciones RAID
La intención original de desarrollar tecnología de matriz de discos redundantes es combinar discos pequeños y baratos para reemplazar discos grandes y costosos. , reduciendo así el costo del almacenamiento de datos de gran capacidad. Al mismo tiempo, también se espera que al utilizar información redundante, no se pierda el acceso a los datos cuando se produzca una falla del disco, de modo que se pueda alcanzar un cierto nivel de tecnología de protección de datos. desarrollado y Capacidad para aumentar adecuadamente la velocidad de transferencia de datos.
En el pasado, RAID siempre ha estado disponible sólo para servidores de alta gama y se ha utilizado como tecnología de aplicación de soporte para discos duros SCSI de alta gama. Recientemente, con el desarrollo de la tecnología y la continua disminución de los costos de los productos, el rendimiento de los discos duros IDE ha mejorado enormemente. Junto con la popularidad de los chips RAID, RAID se ha utilizado gradualmente en las computadoras personales.
Entonces, ¿por qué se llama matriz redundante? Redundancia significa redundancia y repetición en chino. Una matriz de discos representa no solo un disco, sino un grupo de discos. En este punto, todos deberían comprender que utiliza discos duplicados para procesar datos y mejorar la estabilidad de los datos.
(2) Cómo funciona RAID
¿Cómo logra RAID una alta estabilidad del almacenamiento de datos? Veamos cómo funciona. RAID se divide en diferentes niveles según diferentes principios de implementación, y los modos de trabajo entre diferentes niveles también son diferentes. Toda la estructura RAID es una estructura de discos múltiples. El propósito de mejorar la eficiencia y reducir los errores se logra mediante la combinación de discos. No se deje intimidar por tantos sustantivos. Sus principios son realmente muy simples. P. Para facilitar la explicación, cada cuadrado en el siguiente diagrama representa un disco, el vertical se llama bloque o matriz y el horizontal se llama área de cinta.
(3) Especificaciones RAID
Incluye principalmente varias especificaciones, como RAID 0 a RAID 7. Sus enfoques son diferentes. Las especificaciones comunes son las siguientes:
RAID. 0: Grupo Bandwagon sin control de errores
Para implementar RAID 0, debe tener más de dos discos duros. RAID 0 implementa un grupo Bandwagon. Los datos no se almacenan en un disco duro, sino que se dividen en bloques y se almacenan en diferentes discos duros. Dado que los datos se distribuyen en diferentes discos duros, la tasa de rendimiento de datos mejora enormemente y la carga en los discos duros está más equilibrada. Es más eficiente si guarda sólo los datos que necesita en diferentes discos duros. No requiere cálculo de suma de comprobación y es fácil de implementar. Su desventaja es que no hay control de errores de datos. Si los datos de una unidad son incorrectos, incluso si los datos de otros discos son correctos, no ayudará. No debe utilizarse cuando los requisitos de estabilidad de los datos sean altos. Si el usuario está editando imágenes (incluidas animaciones) y otras ocasiones que requieren una gran cantidad de transmisión, RAID0 es más adecuado. Al mismo tiempo, RAID puede aumentar la velocidad de transferencia de datos. Por ejemplo, los archivos que deben leerse se distribuyen en dos discos duros y los dos discos duros se pueden leer al mismo tiempo. De esta forma, el tiempo necesario para leer el mismo archivo se reduce a la mitad. RAID 0 es el más rápido de todos los niveles. Sin embargo, RAID 0 no tiene redundancia, por lo que si un disco está (físicamente) dañado, todos los datos quedarán inutilizables
RAID 1: arquitectura reflejada
Para dispositivos que utilizan la arquitectura RAID 1, el El controlador RAID debe poder leer datos de ambos discos y escribir datos en ambos discos reflejados simultáneamente. Como puede ver en el diagrama de bloques a continuación, debe haber dos unidades. Debido a la estructura de espejo, el espejo se puede utilizar para mejorar la tolerancia a fallas del sistema cuando ocurre un problema en un grupo de discos. La duplicación es relativamente sencilla de diseñar e implementar. Cada disco solo puede leer un bloque de datos, lo que significa que la velocidad de transferencia del bloque de datos es la misma que la velocidad de lectura de los discos individuales. Debido a que la suma de comprobación de RAID1 es muy completa, tiene un gran impacto en la potencia de procesamiento del sistema. Por lo general, las funciones RAID se implementan mediante software. Cuando la carga del servidor es relativamente pesada, este método de implementación afectará en gran medida la eficiencia del servidor. Cuando el sistema requiere alta confiabilidad, como estadísticas de datos, RAID1 es más apropiado. Además, la tecnología RAID1 también admite el "reemplazo en caliente", es decir, reemplazar el disco defectuoso sin encenderlo y luego recuperar los datos del disco espejo una vez completado el reemplazo. Cuando el disco duro principal está dañado, el disco duro espejo puede reemplazar el disco duro principal. Un disco duro reflejado es equivalente a un disco de respaldo. Se puede imaginar que la seguridad de este modo de disco duro es muy alta. Entre todos los niveles de RAID, RAID 1 tiene la mejor seguridad de datos. Pero su utilización del disco es sólo del 50%, el más bajo de todos los niveles RAID.
RAID 2: Uso de sumas de comprobación HMI
Conceptualmente, RAID 2 es similar a RAID 3 en que distribuye datos a diferentes discos duros en unidades de bits o bytes superiores.
Sin embargo, RAID 2 utiliza ciertas técnicas de codificación para proporcionar verificación y recuperación de errores. Esta técnica de codificación requiere varios discos para contener la información de verificación y recuperación, lo que hace que la tecnología RAID 2 sea más compleja de implementar. Por lo tanto, esta técnica rara vez se utiliza en entornos comerciales. En el lado izquierdo de la imagen siguiente hay bits de datos individuales en cada disco. Los códigos de suma de comprobación de Hemming obtenidos operando en diferentes bits de datos se pueden almacenar en otro conjunto de discos, como se detalla en la siguiente figura. Debido a las características del código Hamming, puede corregir errores cuando los datos son incorrectos y garantizar una salida correcta. Su tasa de transferencia de datos es bastante alta y, si desea lograr mejores velocidades, es mejor agregar un disco duro que contenga el código ECC de suma de verificación. Asimismo, el diseño de su controlador es más simple que RAID 3, 4 o 5. No hay almuerzo gratis en el mundo, y esto no es una excepción. Para aprovechar el código Hemming, debes pagar por la redundancia de datos. Los datos se emiten a una velocidad igual a la velocidad más lenta del grupo de unidades.
RAID3: Transmisión paralela con código de paridad
Este tipo de código de paridad se diferencia del RAID2 en que sólo puede comprobar si hay errores, no corregirlos. Accede a los datos uno por uno para procesar un área de ancho de banda, lo que aumenta las velocidades de lectura y escritura. Almacena cantidades en paralelo como RAID 0, pero no es tan rápido como RAID 0. Se genera una suma de comprobación cuando los datos se escriben y almacenan en otro disco. Los usuarios deben tener más de tres discos duros para lograr esto. La velocidad de escritura y la velocidad de lectura son muy altas. Debido a que hay menos dígitos de control, el tiempo de cálculo es relativamente pequeño. Implementar el control RAID en software es difícil y el controlador no es fácil de implementar. Se utiliza principalmente para gráficos (incluida la animación) y otras aplicaciones que requieren un alto rendimiento. A diferencia de RAID 2, RAID 3 utiliza un único disco para almacenar información de paridad. Si un disco falla, el disco de paridad y otros discos de datos pueden regenerar los datos. RAID 3 proporciona buenas tasas de transferencia para grandes cantidades de datos secuenciales, pero para datos aleatorios, el disco de paridad puede convertirse en un cuello de botella para las operaciones de escritura.
RAID 4: Arquitectura de disco independiente con código de paridad
RAID 4 es muy similar a RAID 3, excepto que accede a los datos en bloques, es decir, por disco. Acceda a un disco a la vez. Puede ver en la imagen que RAID3 es una barra horizontal a la vez, mientras que RAID4 es una barra vertical a la vez. Es similar a RAID3, pero la recuperación de fallas es mucho más difícil, los controladores son mucho más difíciles de diseñar y el acceso a los datos no es tan eficiente.
RAID5: Arquitectura de disco independiente de paridad distribuida
Como se puede ver en su diagrama esquemático, su código de paridad existe en todos los discos, donde p0 representa el valor de paridad de la banda 0, también se incluyen otros significados. lo mismo. La eficiencia de lectura de RAID5 es muy alta, la eficiencia del proceso de escritura es promedio y la eficiencia del acceso colectivo del tipo de bloque es muy buena. RAID 5 también utiliza los bits de paridad de los datos para garantizar la seguridad de los datos, pero en lugar de almacenar los bits de paridad de los datos en un disco duro separado, los bits de paridad de los segmentos de datos se almacenan indistintamente en discos duros separados. De esta manera, si algún disco duro se daña, los datos dañados se pueden reconstruir en función de los bits de paridad de los otros discos duros. La utilización del disco duro es n-1. La diferencia importante entre RAID 3 y RAID 5 es que RAID 3 requiere la participación de todos los discos de la matriz en cada transferencia de datos. En RAID 5, la mayoría de las transferencias de datos ocurren en un solo disco y pueden ocurrir en paralelo. En RAID 5, hay "pérdida de escritura", lo que significa que por cada operación de escritura hay cuatro operaciones de lectura/escritura reales, dos de las cuales se usan para leer los datos antiguos y la información de paridad, y dos de las cuales se usan para escribir nuevos. datos e información de paridad.
RAID6: Arquitectura de disco independiente con dos paridades de almacenamiento distribuido
El nombre es largo, pero si ves el diagrama entenderás inmediatamente por qué. Tenga en cuenta que p0 representa el valor de paridad con 0 y pA representa el valor de paridad del bloque de datos A. Es una extensión de RAID5 y se utiliza principalmente cuando se requiere que los datos estén absolutamente libres de errores.
Por supuesto, debido a que se introduce el segundo valor de paridad, se requieren N + 2 discos. Al mismo tiempo, el diseño del controlador se vuelve muy complicado y la velocidad de escritura no es buena para calcular el valor de paridad y verificarlo. exactitud de los datos, el sexo requiere más tiempo, creando una carga innecesaria. No creo que nadie más que los militares pueda permitirse algo así.
RAID7: Optimiza la estructura del disco y logra una transmisión de datos de alta velocidad
Todas las transmisiones de E/S en RAID7 son síncronas y se pueden controlar por separado, lo que mejora el paralelismo del sistema y mejora la velocidad a la que el sistema accede a los datos; cada disco tiene su propia memoria caché y el sistema operativo en tiempo real puede utilizar cualquier chip de operación en tiempo real para satisfacer las necesidades de diferentes sistemas en tiempo real. Permite el uso del protocolo SNMP para gestión y monitoreo, y puede especificar un canal de transmisión independiente para el área de verificación para mejorar la eficiencia. Se pueden conectar varios hosts debido a la adición de caché, cuando varios usuarios acceden al sistema, el tiempo de acceso es casi nulo. Debido a la estructura paralela, la eficiencia del acceso a los datos mejora enormemente. Una cosa a tener en cuenta es que introduce un caché, lo cual tiene ventajas y desventajas, ya que todos los datos del caché se perderán una vez que el sistema pierda energía, por lo que debe usarse con un UPS. Por supuesto, esa velocidad también es muy cara.
RAID10: estructura de disco eficiente y de alta confiabilidad
Esta estructura no es más que una estructura de ancho de banda más una estructura espejo. Debido a que ambas estructuras tienen sus propias ventajas y desventajas, pueden aprender de ellas. entre sí para lograr un propósito eficiente y de alta velocidad. Puede comprender esta nueva estructura combinando las ventajas y desventajas de las dos estructuras. Esta nueva estructura es más cara y menos escalable. Se utiliza principalmente para bases de datos de pequeña capacidad pero que requieren velocidad y control de errores.
RAID53: Estructura de disco de transferencia de datos eficiente
La estructura posterior es una copia y reutilización de la estructura anterior. Esta estructura es la unificación de RAID3 y la estructura de tira, por lo que la velocidad. Es más rápido y tolerante a fallos. Pero el precio es muy alto y difícil de conseguir. Esto se debe a que todos los datos deben pasar por almacenamiento de banda y bit a bit. Si se considera la eficiencia, realmente no es fácil sincronizar estos discos.
RAID1:
La combinación de tecnologías RAID0 y RAID1 se denomina RAID1 y proporciona redundancia completa además de distribuir datos en varios discos. Permite que falle menos de un disco. impactando la disponibilidad de datos, así como las capacidades rápidas de lectura/escritura. RAID1 requiere al menos cuatro discos duros.
(3) Modo JBOD
JBOD generalmente se llama Span. Es una matriz lógica compuesta por múltiples discos físicos conectados uno por uno para formar un disco lógico grande. jBOD no proporciona tolerancia a fallas, la capacidad del arreglo es igual a la suma de las capacidades de todos los discos que componen el tramo. JBOD no proporciona tolerancia a fallos. La capacidad de una matriz es igual a la suma de las capacidades de todos los discos que componen el tramo. Sin embargo, muchos chips de controlador RAID IDE ahora tienen un modo JBOD incorporado, que es un simple apilamiento de la capacidad del disco duro, pero el sistema no utiliza procesamiento paralelo. Al escribir datos, el primer disco duro se escribe primero y luego el primero. el disco duro se escribe cuando está lleno. Escribiendo en el segundo disco duro….
Los más comunes en aplicaciones prácticas son RAID0, RAID1, RAID5 y RAID10. Debido a que RAID5 incluye las ventajas de RAID2-4 en la mayoría de las situaciones, RAID2-4 básicamente se ha retirado del mercado.
En general, se cree que RAID2-4 solo se usa en la investigación sobre el desarrollo de RAID
(4) IDE RAID que podemos usar
Lo anterior presenta el principio de RAID, y nuestros fanáticos de PC más De interés son las aplicaciones de RAID. Todos usamos discos duros IDE todos los días, y las tarjetas RAID IDE y las placas base con chips RAID integrados están disponibles. Entonces, lo más cercano que tenemos es IDE RAID, que está limitado a niveles de aplicación muy bajos, y la mayoría de IDE RAID solo admiten los modos RAID 0, RAID 1, RAID 1 y JBOD.
Aplicación RAID
La solución RAID original se utilizaba principalmente para sistemas de disco duro SCSI y el costo del sistema era relativamente alto.
En 1993, HighPoint lanzó el primer chip de control IDE-RAID, que podía utilizar discos duros IDE relativamente baratos para construir un sistema RAID, reduciendo así en gran medida el "umbral" de RAID. "Umbral". Desde entonces, los usuarios individuales también han comenzado a prestar atención a esta tecnología, porque los discos duros son los dispositivos "más lentos" y menos seguros de los ordenadores personales modernos, y los datos almacenados en ellos a menudo superan con creces el precio del ordenador. La propia tecnología RAID permite a los usuarios individuales disfrutar de mejoras exponenciales en la velocidad del disco y una mayor seguridad de los datos a un costo relativamente bajo. Actualmente, los chips controladores IDE-RAID en el mercado de PC provienen principalmente de HighPoint y Promise, y algunos también provienen de AMI (tabla). 2).
Los chips IDE-RAID para usuarios individuales generalmente solo brindan soporte para especificaciones RAID como RAID 0, RAID 1 y RAID 1 (RAID 10), aunque técnicamente son incompatibles con las comerciales. Los sistemas de uso son comparables, pero las garantías de velocidad y seguridad proporcionadas a los usuarios comunes son suficientes. A medida que la velocidad de transmisión de las interfaces del disco duro continúa aumentando, los chips IDE-RAID también se actualizan constantemente. Actualmente, todos los chips convencionales en el mercado de chips son compatibles. El último chip HPT 372 de HighPoint y el último chip PDC20276 de Promise pueden incluso admitir discos duros IDE estándar ATA 133. Hoy en día, a medida que se intensifica la competencia entre los fabricantes de placas base y aumentan gradualmente los requisitos de los usuarios de computadoras personales, los fabricantes de chips RAID integrados ya han comenzado. Hay muy pocos y los usuarios pueden construir directamente sus propias matrices de discos sin comprar tarjetas RAID y experimentar la creciente velocidad de los discos.