Definition

RAID (Redundant Array of Independent Disks)

La technologie de batterie redondante de disques indépendants, ou RAID (Redundant Array of Independent Disks ; à l'origine Redundant Array of Inexpensive Disks), permet de stocker les mêmes données à différents emplacements (donc par redondance) sur plusieurs disques durs.

Remarquons que les niveaux de RAID n'apportent pas tous la redondance. En plaçant des données sur plusieurs disques durs, il est possible de faire chevaucher les opérations d'entrée/sortie (E/S) de manière équilibrée, ce qui améliore les performances. Etant donné que l'utilisation de plusieurs disques augmente le temps moyen entre défaillances (MTBF, Mean Time Before Failure), un stockage redondant des données accroît également la tolérance aux pannes.

Les batteries de disques RAID se présentent au système d'exploitation sous la forme d'un seul disque dur logique. La technologie RAID fait appel à la mise en miroir (Disk Mirroring) ou agrégation en bandes des disques (Disk Striping). Cette technique implique un partitionnement de l'espace de stockage de chaque disque en unités dont la taille va d'un secteur (soit 512 octets) à plusieurs mégaoctets. Les bandes de tous les disques sont entrelacées et adressées dans l'ordre.

Sur un système mono-utilisateur où sont stockés des enregistrements volumineux, tels que des images médicales ou scientifiques, les bandes sont généralement de petite taille (de l'ordre de 512 octets). Ainsi, un seul et même enregistrement est réparti sur tous les disques et devient accessible rapidement par lecture simultanée de tous les disques.

Dans un système multi-utilisateurs, on obtient de meilleures performances en définissant des bandes suffisamment larges pour contenir individuellement un enregistrement type ou de taille maximale. Cette approche permet de faire chevaucher les E/S disque sur tous les lecteurs.

Niveaux de RAID standard

RAID 0 : Cette configuration utilise l'agrégation en bandes mais ne présente aucune redondance des données. Elle offre des performances optimales, mais aucune tolérance aux pannes.

RAID 0
RAID 0

RAID 1 : Egalement connue sous le nom de mise en miroir des disques, cette configuration comprend au moins deux lecteurs qui dupliquent le stockage des données. Elle ne présente aucune agrégation en bandes. Les performances en lecture sont améliorées car les disques peuvent être lus simultanément. Les performances en écriture sont identiques à celles d'une solution de stockage sur disque unique.

RAID 1
RAID 1

RAID 2 : Cette configuration fait appel à une agrégation en bandes opérant à l'échelle de plusieurs disques, dont certains consignent des informations de contrôle et de correction des erreurs (ECC, Error Checking and Correcting). Elle ne présente aucun avantage par rapport à la technologie RAID 3 et n'est plus utilisée.

RAID 2
RAID 2

RAID 3 : Cette configuration fait appel à une agrégation en bandes et dédie un disque spécifique au stockage d'informations de parité. Les informations ECC ainsi intégrées servent à détecter les erreurs. La récupération des données s'effectue en calculant les valeurs OR exclusives (XOR) des informations enregistrées sur les autres disques. Sachant que les opérations E/S adressent simultanément tous les lecteurs, la configuration RAID 3 ne peut pas faire chevaucher ces opérations. C'est la raison pour laquelle la configuration RAID 3 est davantage adaptée aux systèmes mono-utilisateur dont les applications portent sur des enregistrements longs.

RAID 3
RAID 3

RAID 4 : Ce niveau de RAID utilise des bandes de grande taille. Vous pouvez ainsi lire des enregistrements à partir de n'importe quel disque de la batterie. Vous pouvez en outre faire chevaucher les E/S pour les opérations de lecture. En revanche, comme toutes les opérations d'écriture doivent mettre à jour le lecteur de parité, aucun chevauchement des E/S n'est possible. La configuration RAID 4 n'offre aucun avantage par rapport au niveau RAID 5.

RAID 4
RAID 4

RAID 5 : Cette configuration RAID repose sur une agrégation en bandes de niveau bloc avec parité. Les informations de parité sont distribuées sur les différents lecteurs. La batterie de disques peut ainsi fonctionner même si l'un des lecteurs tombe en panne. L'architecture de la batterie permet de répartir les opérations de lecture et d'écriture sur plusieurs lecteurs. Les performances obtenues sont généralement meilleures que celles d'un lecteur unique, mais pas aussi élevées que celles d'une batterie RAID 0. La configuration RAID 5 nécessite au moins trois disques, mais il est souvent recommandé d'en utiliser au moins cinq pour des questions de performance.

Les batteries RAID 5 sont généralement considérées comme un choix médiocre pour les systèmes fortement sollicités en écriture. En effet, l'écriture des informations de parité influe négativement sur les performances. En outre, lorsqu'un disque tombe en panne, la reconstitution de la batterie RAID 5 peut prendre un certain temps. Lors de cette phase de reconstitution, les performances sont généralement dégradées. De plus, la batterie est exposée à la défaillance d'un autre disque tant que la reconstitution n'est pas terminée.

RAID 5
RAID 5

RAID 6 : Cette configuration est similaire au RAID 5 mais comprend un deuxième schéma de parité réparti sur l'ensemble des lecteurs de la batterie. Le recours à une parité supplémentaire permet un fonctionnement ininterrompu de la batterie, même si deux disques tombent en panne simultanément. Toutefois, cette protection supplémentaire a un coût : le coût au gigaoctet (Go) des batteries RAID 6 est plus élevé, et leur vitesse d'écriture est plus faible que celle des batteries RAID 5.

RAID 6
RAID 6

Niveaux de RAID imbriqués

Certains niveaux de RAID sont connus sous le nom de RAID imbriqué car ils reposent sur une combinaison de deux niveaux de RAID standard. En voici quelques exemples.

RAID 10 (RAID 1+0) : Combinant RAID 1 et RAID 0, cette configuration est souvent appelée RAID 10. Elle offre des performances supérieures au RAID 1 mais coûte beaucoup plus cher. En configuration RAID 1+0, les données sont mises en miroir, et chaque miroir fait l'objet d'une agrégation en bandes.

RAID 10
RAID 10

RAID 01 (RAID 0+1) : La configuration RAID 0+1 est très similaire au niveau RAID 1+0, à ceci près que la méthode d'organisation des données est légèrement différente. Plutôt que de créer un miroir qui fera ensuite l'objet d'une agrégation en bandes, la configuration RAID 0+1 crée d'abord un jeu de bandes qu'elle met ensuite en miroir.

RAID 03 (RAID 0+3 également connu sous le nom de RAID 53 ou RAID 5+3) : Cette configuration fait appel à l'agrégation en bandes (de type RAID 0) pour des blocs de disques virtuels RAID 3. Elle offre des performances supérieures à celles du RAID 3 mais pour un coût bien supérieur.

RAID 50 (RAID 5+0) : Cette configuration combine la parité distribuée du RAID 5 à l'agrégation en bandes du RAID 0 pour améliorer les performances du premier sans diminuer la protection des données.

Niveaux de RAID non standard

RAID 7 : Ce niveau de RAID repose sur les RAID 3 et 4, mais ajoute l'antémémorisation, ou mise en cache, à la combinaison. La configuration comprend un OS intégré qui fonctionne en temps réel en tant que contrôleur, une mise en cache opérant via un bus à haut débit, ainsi que d'autres caractéristiques que l'on retrouve sur un ordinateur autonome. Ce niveau de RAID non standard fait l'objet d'une marque commerciale, propriété de la société Storage Computer Corp. aujourd'hui disparue.

RAID adaptatif : Le RAID adaptatif permet au contrôleur RAID de décider du mode de stockage de la parité sur les disques. Entre RAID 3 et RAID 5, il choisit alors le type de jeu RAID le plus performant en fonction des données écrites sur les disques.

RAID S (connu également sous le nom de Parity RAID) : Cette méthode de remplacement propriétaire des solutions EMC Symmetrix permet de mettre en œuvre une batterie RAID à parité agrégée en bandes. Elle n'est plus utilisée sur des équipements actuels. Si le RAID S semble similaire au RAID 5, il présente certaines performances améliorées, notamment celles que procure la présence d'un cache de disque à haut débit sur la batterie.

Inconvénients de la technologie RAID

La mise en œuvre des niveaux de RAID imbriqués est plus coûteuse que celle des niveaux de RAID standard, car elle nécessite davantage de disques. Le coût du stockage par Go est également plus élevé avec le RAID imbriqué car une grande partie des disques est utilisée à des fins de redondance. Le RAID imbriqué gagne en popularité malgré son coût car il contribue à régler certains problèmes de fiabilité associés aux niveaux de RAID standard.

Au départ, tous les lecteurs d'une batterie RAID sont installés en même temps. Ainsi, les lecteurs d'une même génération sont soumis aux mêmes conditions d'exploitation et présentent la même usure. Toutefois, si un lecteur tombe en panne, il y a de fortes chances qu'un autre lecteur de la batterie subisse le même sort peu de temps après.

Certains niveaux de RAID (tels que les RAID 5 et RAID 1) peuvent uniquement supporter la défaillance d'un seul disque (bien que certaines mises en oeuvre RAID 1, constituées de plusieurs miroirs, acceptent plusieurs défaillances). Le problème tient à ce que la batterie RAID, et les données qu'elle renferme, restent vulnérables tant que le lecteur en panne n'est pas remplacé, et tant que les données ne sont pas enregistrées sur le nouveau disque.

Même si aucun autre disque ne tombe en panne pendant le remplacement du disque défaillant, il arrive que les disques restants contiennent des secteurs défectueux ou des données illisibles. Des erreurs de ce type peuvent rendre impossible la reconstitution intégrale de la batterie de lecteurs.

Les niveaux de RAID imbriqué résolvent ces problèmes en offrant un degré supérieur de redondance, diminuant ainsi considérablement les risques de défaillance à l'échelle de la batterie liés à une éventuelle panne simultanée de plusieurs lecteurs.

Cette définition a été mise à jour en juin 2016

Pour approfondir sur Administration du stockage