chokmoso - Fotolia

Conseil

Les 5 métriques à connaître pour comparer les baies de stockage

Cet article revient sur les notions de capacité, de débit, de latence, de durabilité, de format et sur la manière d’interpréter les chiffres indiqués par les fabricants d’équipements de stockage.

par

Stephen Pritchard
Yann Serra, LeMagIT

Publié le: 12 juil. 2021

Choisir une solution de stockage consiste à trouver le bon équilibre entre son coût, ses performances et sa capacité. Le problème est que les SSD, d’une part, et les services de stockage en ligne, d’autre part, ont dramatiquement complexifié l’analyse des offres.

Cet article se propose de faire le point sur les caractéristiques les plus utiles quand il s’agit de comparer les baies de stockage. Elles sont au nombre de cinq : la capacité, le débit en lecture/écriture, le nombre d’entrées/sorties par seconde (qui est lié à la latence), le temps moyen avant une panne (lié à la quantité d’écritures) et le format des disques (en rapport avec sa connectique).

Ces caractéristiques sont utiles pour évaluer le stockage sur site. Certaines s’appliquent également au cloud.

1/ Les métriques concernant la capacité de stockage

Tous les systèmes de stockage ont une capacité. Aujourd’hui, on l’exprime principalement en gigaoctets (Go) ou en téraoctets (To). On ne mesure plus guère en mégaoctets (Mo), sauf lorsque l’on parle de mémoire cache.

Un gigaoctet de stockage correspond à 1 000 Mo, et un téraoctet à 1 000 Go. Les pétaoctets (Po) contiennent 1 000 To de données et les grands systèmes de stockage sont souvent considérés comme « travaillant à l’échelle du pétaoctet ». Pour donner une image, un pétaoctet correspondrait à un morceau de musique dont la durée serait de 2 000 ans. L’échelle suivante est celle de l’exaoctet (Eo), soit 1 000 pétaoctets.

Anciennement, on comptait la capacité de stockage en puissance de deux : un kilooctet (Ko) correspondait à 1 024 octets, soit 2^10, et 1 Mo à 1 024 Ko. Dès lors que le marché a commencé à compter en téraoctet, il a été décidé que l’on ne parlerait plus que de puissances de 10. L’ancien système a été renommé kibioctet (Kio), mébioctet (Mio), gibioctet (Gio), tébioctet (Tio), pébioctet (Pio).

Un autre point à noter est que les caractéristiques de capacité sont souvent listées en anglais, où un octet se dit « byte » et s’exprime avec un B majuscule dans les unités de mesure : KB, MB, GB, TB, PB, etc. Attention à cette majuscule : lorsque les fournisseurs expriment des mesures en Kb, Mb, Gb, Tb, il ne s’agit plus d’octets, mais de bits, soit huit fois moins que des octets. Les mesures en bits, avec un b minuscule, s’utilisent normalement lorsque l’on parle de vitesse – en français on utilisera plutôt des Mbit/s, Gbit/s, etc.

Les capacités de stockage peuvent s’appliquer à des disques durs, à des SSD, à des baies de disques, à des volumes logiques, voire à l’ensemble du système, par exemple un NAS en cluster ou une offre de stockage en ligne.

2/ Les métriques liées au débit en lecture/écriture

Le débit mesure le nombre de bits – et non de « bytes » – qu’un système peut lire ou écrire par seconde. Les SSD, en particulier, auront une vitesse en lecture différente de leur vitesse en écriture, laquelle est généralement plus faible.

L’usage déterminera la mesure la plus importante des deux. Par exemple, un système d’enregistrement vidéo aura besoin d’un support de stockage avec des vitesses d’écriture rapides, tandis qu’une base de données archivées sera plus sensible aux vitesses de lecture.

Le problème est que les fournisseurs présentent des mesures qu’ils calculent selon des lectures ou des écritures effectuées sur des blocs de données d’une certaine taille. Cela peut être trompeur. Le calcul du débit (ou des IOPS, voir ci-dessous), basé sur une taille de bloc moyenne, ou petite, donnera un ensemble de résultats très différents de ceux atteints par le système en conditions d’utilisation réelles.

Les fabricants font également la distinction entre les vitesses de lectures/écritures aléatoires et de lectures/écritures séquentielles. La vitesse de lecture ou d’écriture séquentielle est la vitesse à laquelle un périphérique de stockage peut lire ou écrire une succession de blocs de données. C’est une mesure utile pour les gros fichiers, par exemple un flux vidéo ou une sauvegarde. La lecture et l’écriture aléatoires sont souvent un indice plus réaliste dans le cas du stockage quotidien sur un PC ou un serveur. C’est surtout sur les lectures/écritures aléatoires que les SSD sont supérieurs aux disques durs mécaniques.

3/ Les métriques IOPS, liées à la latence

La quantité d’opérations d’entrée/sortie par seconde (IOPS) est une autre mesure de vitesse. Plus l’IOPS est élevé, meilleures sont les performances du disque ou du système de stockage. Un disque rotatif typique a des IOPS de l’ordre de 50 à 200. Ce chiffre peut toutefois être amélioré de manière significative avec des dispositifs comme le RAID et la mémoire cache. Les SSD ont des IOPS au moins 1 000 fois plus élevés. Des IOPS plus élevés signifient toutefois des prix plus élevés.

Les IOPS varient également en fonction de la quantité de données successivement écrites ou lues, comme c’est le cas pour le débit.

La latence correspond au temps que prend une opération d’entrée/sortie pour s’exécuter. Certains analystes estiment que la latence est la mesure la plus importante pour estimer les performances d’un système de stockage dans des conditions réelles. La Storage Network Industry Association (SNIA) la décrit comme « le battement de cœur d’un SSD ».

La latence d’un disque dur doit être comprise entre 10 et 20 ms (millisecondes). Pour un SSD, elle ne devrait être que de quelques millisecondes.

Plus la latence est élevée, plus elle réduit le nombre d’IOPS. Plus elle est basse, plus le nombre d’IOPS augmente.

4/ MTBF et TBW

Le MTBF est le temps moyen entre les défaillances (Mean Time Between Failures). Il s’agit d’une métrique standard sur les équipements industriels. Concernant le stockage, le MTBF correspond au nombre d’heures en fonctionnement avant qu’une panne n’impose de remplacer le disque. Les systèmes de stockage comme les baies RAID ont un MTBF supérieur à celui des disques seuls, puisqu’elles continuent de fonctionner après la panne d’un disque et son remplacement par un autre.

Un disque dur a historiquement un MTBF de 300 000 heures. De nouvelles technologies permettent de grimper jusqu’à 1 200 000 heures, ou 120 ans de fonctionnement.

Certains fabricants prennent leur distance avec le MTBF. Seagate parle désormais du taux de défaillance à l’année (AFR, ou Annualized Failure Rate), qui consiste à prédire le pourcentage de disques qui tomberont en panne au cours d’une année en raison d’une « défaillance fournisseur ». L’AFR exclut de fait les problèmes côté clients, comme les dommages causés par une panne de courant.

Concernant les SSD, qui ont des caractéristiques physiques différentes, on parle plutôt d’espérance de vie. Elle est généralement exprimée en nombre total de téraoctets enregistrables, ou TWB (Total Terabytes written). On trouve aussi le DWPD, qui correspond au nombre d’écritures par jour (Drive Writes Per Day), et qui indique le nombre de fois qu’un SSD peut être réécrit tout au long de sa carrière. La durée de sa carrière est une moyenne définie par le constructeur. Les fabricants indiquent généralement ces mesures dans leurs garanties matérielles.

L’espérance de vie varie selon la génération de SSD. Les SSD avec des cellules à un seul niveau (SLC) sont généralement ceux qui durent le plus longtemps, tandis que les SSD avec des cellules à deux niveaux (MLC), à trois niveaux (TLC) et à quatre niveaux (QLC) concentrent davantage d’activités dans leurs cellules et troquent donc la durabilité contre la capacité. Cependant, des techniques de fabrication récentes ont amélioré la durabilité de tous les types de SSD, citons la conception de type eMLC (enterprise Multi-Level Cell).

5/ le format et la connectique

Bien qu’il ne s’agisse pas d’une caractéristique directement liée aux performances à proprement parler, les acheteurs d’une solution de stockage devront tenir compte de la manière dont les équipements se connectent au système hôte et partagent les données.

Le format typique sur les ordinateurs portables et qui est désormais aussi courant sur les baies de stockage est le SSD de 2,5 pouces. Les baies qui utilisent le format 3,5 pouces restent disponibles pour les disques durs.

Les disques durs utilisent l’interface Serial ATA (SATA) ou, quand il s’agit d’exécuter des applications en datacenter, l’interface SAS. Les SSD 2,5 pouces utilisent pour leur part des connecteurs U.2 qui peuvent tout autant servir à relier l’unité en SAS/SATA ou en PCIe. Il existe également un format M.2 qui correspond à un SSD sous la forme d’une mini-carte d’extension PCIe. De manière pratique, les SSD avec connecteur U.2 ont l’avantage d’être extractibles à chaud pour être remplacés sans avoir à redémarrer la machine hôte. Tandis que le format M.2 permet éventuellement d’assembler plus de SSD à l’intérieur de la machine.

Les SSD qui communiquent avec la machine hôte en PCIe plutôt qu’en SAS/SATA, sont dits NVMe. L’avantage d’un SSD NVMe est qu’il ne s’embarrasse pas des commandes typiques des disques durs : ses performances sont ainsi meilleures, car les données sont atteintes comme si elles étaient dans une zone mémoire.

Les 5 métriques à connaître pour comparer les baies de stockage

Cet article revient sur les notions de capacité, de débit, de latence, de durabilité, de format et sur la manière d’interpréter les chiffres indiqués par les fabricants d’équipements de stockage.

1/ Les métriques concernant la capacité de stockage

2/ Les métriques liées au débit en lecture/écriture

3/ Les métriques IOPS, liées à la latence

4/ MTBF et TBW

5/ le format et la connectique

Pour approfondir sur SAN et NAS

Stockage : Graid décline sa carte accélératrice aux stations de travail

Stockage : GRAID décuple les performances du RAID NVMe avec un… GPU

Stockage : comprendre ce que veulent dire les performances des SSD

Stockage dans le cloud : comment mesurer ses performances