La Flash en marche pour conquérir le stockage primaire et plus encore
Dans les datacenters, les systèmes de stockage 100 % Flash remplacent peu à peu les baies de stockage à base de disque et les baies de stockage hybrides pour le stockage primaire. Cette progression devrait bientôt s'étendre au stockage secondaire.
Petit à petit, les baies de stockage 100 % Flash supplantent les baies traditionnelles et les baies hybrides dans les datacenters. La progression est particulièrement visible dans les chiffres trimestriels des constructeurs. XtremIO comptait ainsi à la fin 2015 pour environ 10 % du CA d’EMC, contre 0 % au début 2013. Pure Storage de son côté ne réalisait que 6 M$ de CA en 2012 (année fiscale clôturée le 31 janvier 2013). La firme a terminé l’année 2015 avec un CA de 440 M$. Au rythme de progression actuel, le constructeur devrait approcher la barre des 800 M$ de revenus sur l’année 2016. Dernier exemple, NetApp a annoncé lors de son dernier trimestre fiscal que les ventes de systèmes 100 % Flash avaient représenté près de 30 % de son CA. Ce chiffre était nul en 2013.
Clairement, la technologies Flash est en train de bouleverser en profondeur le monde des baies de stockage primaire. Ses performances séduisent les entreprises, mais ce n’est pas le seul argument qui joue en sa faveur. L’un des corollaires de cette performance accrue est une plus grande simplicité d’administration du stockage. Les administrateurs n’ont plus à maîtriser les astuces d’optimisation les plus avancées pour délivrer le niveau de service attendu par les applications. Et le fait que les nouvelles baies Flash disposent d’interfaces de pilotage modernes facilite aussi grandement leur exploitation au quotidien.
La performance apportée par la Flash ouvre aussi la voie à une consolidation massive de certains environnements de stockage, puisqu’une seule et même baie Flash peut désormais remplir le rôle de multiples baies de disques plus lentes, tout en délivrant les niveaux de performances attendus. Enfin, le coût réel du gigaoctet stocké sur Flash est désormais équivalent ou inférieur à celui de la donnée stockée sur disque grâce, en partie, à la baisse du prix de la Flash, mais surtout du fait de la mise en œuvre systématique de techniques d’optimisation de données par les baies Flash, notamment, la compression et de la déduplication, mais aussi les snapshots ou le clonage.
Parmi les bénéfices des systèmes Flash, on peut aussi citer le support par un nombre croissant de fournisseurs des modes de déploiement scale-out (EMC XtremIO, NetApp AFF et SolidFire, IBM A9000, Kaminario, Nimble Storage AF, Tegile et bientôt Hitachi HFS A). Ce recours au scale-out permet de garantir une plus grande évolutivité et a aussi des bénéfices en matière de pérennité et de continuité d’exploitation. Par exemple, on peut ajouter un nœud de stockage plus moderne à un cluster existant, migrer les données de façon transparente depuis un vieux nœud, pui mettre ce dernier à la retraite sans aucune interruption de service ; ce qui est quasiment impossible avec une architecture traditionnelle.
La Flash : des caractéristiques de performance spectaculaires
Il ne faut pas se cacher derrière son petit doigt, le principal bénéfice des baies 100 % Flash est leur performance, car c’est d’elle que découlent la plupart des autres atouts de ces baies.
Si ce nouveau support de stockage a un tel impact, c’est que le nombre d’opérations par seconde délivré par les disques durs n’avait guère évolué au cours des 10 dernières années. Ainsi un disque d’entreprise à 10 000 tr/mn restait péniblement sous la barre des 150 IOPS (opérations d’entrées/sorties par seconde) en accès aléatoires, et un disque SATA peinait à franchir la barre des 70 à 80 IOPS. Pire la performance en IOPS ramenée au Go ne cessait de s’effondrer avec la montée en capacité des disques. Ainsi un disque SATA de 1 To moderne ne délivre que 0,08 IOPS par Go.
Ces chiffres font pâle figure face à ceux d’une carte Flash PCIe NVMe de dernière génération, qui peut délivrer jusqu’à 3,4 millions d’IOPS en lecture de blocs de 4 K (1,7 million avec 70 % de lecture et 30 % d’écritures). Ils sont aussi ridicules face à ceux d’un SSD de dernière génération comme le Z-Drive 6000 d’Hitachi, un disque Flash NVMe à deux ports, qui offre des performances en lecture de 700 000 IOPS. Et la comparaison est encore moins flatteuse en matière d’IOPS par gigaoctet, puisque la dernière génération de carte Flash NVMe délivre entre 340 et 1700 IOPS/Go et les derniers SSD plus de 200 IOPS/Go…
Pour mémoire, en 2011, il avait fallu à VMware et EMC, bâtir une configuration Symmetrix VMAX 20K à huit « moteurs », 960 disques durs 15K et 64 ports FC 8 Gbit pour délivrer un million d’IOPS en lecture depuis un unique serveur vSphere. Une seule carte Flash NVMe dans un serveur suffit aujourd’hui à délivrer cette performance.
La performance en IOPS n’est pas le seul bénéfice de la Flash. Un autre apport important de la technologie est l’abaissement de la latence. Celle des disques durs n’a que peu progressé au cours des 25 dernières années. Un disque d’entreprise avait un temps d’accès de 60 ms en 1987. Depuis, on est passé à environ 4 ms pour les disques d’entreprise à 15 000 tr/mn et à un peu moins de 10 ms pour un disque Nearline. Cette amélioration d’un facteur de 6 à 15 fois peut paraître impressionnante. Sauf que dans le même temps, la latence d’accès à la mémoire a été divisée par plus de 100 000 (pour passer sous la barre de la nanoseconde) et la performance unitaire des processeurs (mesurée en Flops) a été multipliée par un facteur de plusieurs dizaines de millions de fois. La mémoire flash permet au stockage de refaire une partie de son retard avec des latences ramenées entre 45 à 100 microsecondes selon le support utilisé. Et cette réduction de la latence devrait se poursuivre avec l’émergence de nouvelles technologies de stockage en mémoire comme la 3D Xpoint d’Intel et Micron ou comme la mémoire PCM.
Vers la fin des baies de stockage sur disque dur pour le stockage primaire
Les baies 100 % Flash ont dans un premier temps séduit les entreprises en quête d’une solution de stockage adaptée à leurs applications les plus exigeantes. Et leur émergence a eu un effet dévastateur sur les ventes des baies monolithiques historiques.
Pour extraire la quintessence de leurs baies de disques, les administrateurs de stockage des entreprises n’avaient eu historiquement d’autre choix que de recourir à des pratiques à la limite du vaudou, comme le « short stroking », qui consiste à ne stocker des données que sur les pistes les plus externes des disques durs afin d’en extraire le plus de performance possible (ce sont sur les pistes externes d’un disque dur que la vitesse linéaire est maximale — elle approche le mur du son — et donc les performances les plus élevées).
Problème, si le short-stroking dopait les performances, il se traduisait aussi par un colossal gaspillage de capacité, puisque l’ont n’utilisait que 10 à 20 % de l’espace pour maximiser les performances. L’avantage des baies haut de gamme est qu’elles pouvaient accueillir 2 000 à 3 000 disques durs et qu’elles étaient donc les seules à pouvoir approcher la barre du million d’IOPS. L’inconvénient est qu’il fallait mobiliser deux à trois racks complets d’équipements, payer — cher — un grand nombre de disques sous-utilisés et régler la facture d’électricité associée, pour obtenir les performances désirées.
Il n’est, dès lors, pas étonnant que les entreprises aient cédé à la tentation de remplacer ces mastodontes, par des baies de stockage Flash capables de délivrer la même performance dans 4 U et consommant 15 à 20 fois moins d’énergie. Seule exception, le marché du stockage pour les mainframes et les grands systèmes Unix critiques reste encore l’apanage des baies monolithique d’IBM (série DS88xx), EMC (VMAX) et Hitachi (VSP G1000).
Mais ces dernières sont elles aussi désormais disponibles en version 100 % Flash. EMC a lancé son VMAX-AF 100 % Flash en mars 2016, tandis qu’IBM a dévoilé le DS8888 100 % Flash en juin. Hitachi commercialisait quant à lui des versions 100 % Flash de son système depuis son lancement en 2014 (la version 100 % Flash délivre 2 millions d’IOPS au test SPC1 contre 200 000 pour la version à base de disques mécaniques). Avec ces systèmes, les trois constructeurs combinent les fonctions de résilience exceptionnelles de leurs systèmes de stockage historiques avec les avantages de la Flash en matière de performance. Encore faut-il en avoir besoin et avoir les poches profondes…
Le marché du stockage à haute performance n’est toutefois qu’une petite partie du marché des baies de stockage primaire. Et avec la baisse des prix de la mémoire NAND, le territoire de chasse favori des baies Flash est désormais celui occupé par les baies de stockage de milieu de gamme hybrides de type EMC VNX ou NetApp FAS. Là encore, les baies 100 % Flash misent sur leur plus grande simplicité de déploiement et d’exploitation. Elles mettent aussi en avant leur compacité et leur excellent coût au Gigaoctet. Enfin, plutôt que de miser sur la performance absolue, les constructeurs mettent l’accent sur la prédictibilité de leurs performances, ce qui n’était pas forcèment le cas des baies hybrides ou des baies à base de disques durs antérieures.
Comme nous l’expliquait récemment un client ayant remplacé une baie de disque par une baie 100 % Flash, « c’est la première fois depuis longtemps que des utilisateurs m’appellent pour me féliciter parce qu’ils n’ont plus de problèmes et perçoivent une vraie amélioration de la performance de leurs applications ».
Les constructeurs de baies 100 % Flash jouent la carte du TCO
Les fabricants de baies Flash ont d’ailleurs bien compris que le seul argument de la performance ne suffirait pas à séduire les utilisateurs et de plus en plus ils mettent en avant les autres atouts de leurs baies (simplicité, niveau de performance prédictible, gain d’espace et d’énergie…). Ils pointent aussi du doigt les gains de TCO rendus possibles par la mise en œuvre de leurs technologies. Le premier gain évident est celui de la réduction des coûts d’exploitation liée à la simplicité d’administration des baies. Il est désormais possible de délivrer la performance attendue par les utilisateurs sans avoir à recourir à l’expertise coûteuse de consultants spécialisés. Le second gain est plus difficile à quantifier, mais il est réel.
Du fait de la performance de la Flash, les serveurs ne sont plus limités par la latence élevée et les faibles IOPS des disques durs. Ils peuvent donc pleinement s’exprimer. Résultat, là où auparavant 4 serveurs de bases de données auraient été nécessaires pour une application, deux ou 3 peuvent désormais suffire, ce qui se traduit par de substantiels gains en matière de licences (rappelons qu’une licence Oracle SGBD en version entreprise pour un serveur bi-socket Xeon standard dépasse les 100 000 €, soit le prix d’une baie de stockage Flash plus que décente). Et ce qui est valide pour les bases de données l’est aussi pour la plupart des autres applications.
Cerise sur le gâteau, la licence OS délivrée avec les baies Flash inclut en général l’accès à l’ensemble des fonctions avancées de snapshot, de clonage, de réplication, etc. Ces fonctions étaient autrefois facturées chèrement par les constructeurs de baies de disques durs. Les contrats de maintenance incluent aussi en option la possibilité de faire évoluer gratuitement les contrôleurs après trois ans. Mais cette gratuité doit être prise avec une pincée de sel, puisque dans la pratique le prix des contrats de maintenance des baies Flash est plus élevé que celui des baies de disques, ce qui permet de financer cette mise à jour.
Vers le datacenter 100 % Flash ?
Les ambitions des spécialistes de la Flash ne se limitent toutefois pas au seul stockage primaire. Tous commencent désormais à rêver de datacenter 100 % Flash et travaillent sur des baies de stockage Flash pour le marché du stockage secondaire et du stockage capacitif. C’est ainsi que Pure Storage s’apprête à lancer la version définitive de son produit FlashBlade et qu’EMC travaille à une version 100 % Flash de sa technologie Isilon, tandis qu’IBM a noué un partenariat avec SanDisk autour de sa technologie InfiniFlash. La clé du succès de la Flash sur ce marché ne sera pas l’aspect performance, mais le coût au gigaoctet.
Pour l’instant, un disque de 15 To de Flash TLC est vendu environ 40 000 € par les constructeurs, ce qui, avec un taux de déduplication de 5:1, se traduit par un coût au Gigaoctet brut un peu supérieur à 50 centimes. Par comparaison, un disque de 8 To SATA entreprise est vendu par HPE environ 1000 €, soit un coût au gigaoctet brut de 12,5 centimes. Il faut donc encore des exigences particulières en matière de performances pour que cet écart se justifie. Mais selon Wikibon, le coût au gigaoctet de la Flash dans les baies de stockage devrait être encore divisé par plus de 12,8 dans les cinq prochaines années tandis que celui des disques durs sera divisé par 2,5. De quoi effacer la différence entre disques durs et Flash, y compris pour les applications de stockage secondaire. L’espérance de vie des disques durs au sein du datacenter risque alors de se réduire comme peau de chagrin et cette technologie vieille de plus de soixante ans pourrait bien être reléguée aux applications d’archivage en remplacement de la bande.