Vast Data prétend lancer la plus universelle des baies de stockage
La startup a mis au point un matériel à base de disques Flash QLC peu chers, où tous les problèmes de performance sont résolus grâce à des modules Optane. Et cela va bien au-delà du cache.
En lançant ces jours-ci la version 3 de son système, qui apporte le protocole SMB, la startup Vast Data atteint son objectif de proposer une baie de stockage universelle. Son matériel peut servir de solution d’archivage pour stocker sur le long terme des données froides, de NAS de production pour partager des documents vers les utilisateurs comme vers les applications, ainsi que de NAS hautes performances pour les hyperviseurs et les supercalculateurs.
Le détail technique, surtout, est qu’une baie de stockage Vast peut faire tout cela en même temps. La précision est importante : Dell EMC propose aussi désormais des baies capables de tout faire, mais une entreprise devra choisir quel cas d’usage elle leur attribue.
« Notre créneau est de proposer une baie de stockage 100 % Flash, parce que nous considérons que les disques durs sont trop lents, trop énergivores. Mais lorsque nous avons interrogé les entreprises, nous nous sommes aperçus que ce n’est finalement plus tellement les performances qui leur importent. Les performances des baies Flash du marché sont surdimensionnées dans 50 % des cas d’usage », explique Jeff Denworth, en charge des produits et cofondateur chez Vast Data.
« Ce que les entreprises souhaitent, c’est une baie de stockage versatile, sur laquelle elles puissent avoir des données qui servent aussi bien à la production, qu’à l’analytique », ajoute-t-il. Le MagIT a pu s’entretenir avec Jeff Denworth à l’occasion d’une session virtuelle organisée dans le cadre de l’IT Press Tour, un événement qui présente à la presse spécialisée les dernières innovations en matière de stockage.
Des serveurs frontaux qui ne ralentissent rien s’ils tombent en panne
Pour parvenir à proposer une baie de stockage qui serve tous les usages en même temps, Vast Data a mis au point une architecture originale. Sa solution repose sur des tiroirs de disques 2U comprenant chacun 18 To en modules Optane et 674 To en disques SSD QLC. Ces tiroirs sont reliés, en NVMe-over-RoCE (Ethernet) ou NVMe-over-Infiniband via des liens 100 Gbit/s, à des serveurs frontaux qui partagent chacun sur le réseau les contenus des disques dans un protocole en particulier : soit SMB, soit NFS, soit S3.
Vast Data propose des serveurs physiques 2U avec des contrôleurs réseau 100 Gbit/s prêts à l’emploi. Mais cette partie serveur tenant dans un container Docker, une entreprise peut choisir de ne pas acheter le matériel et d’installer le container sur un cluster Kubernetes déjà existant.
Il est possible de déployer jusqu’à 10 000 serveurs frontaux, le nombre dépendant de la quantité de requêtes auxquelles il faut répondre. Et l’on peut déployer jusqu’à 1 000 tiroirs de disques, selon la capacité que l’on souhaite atteindre. Notons qu’un dispositif de déduplication permet de démultiplier la capacité utile de chaque tiroir ; Vast Data évoque la fourchette de 1,2 à 12 Po.
La première originalité est que toute la logique de routage dépend des switches Ethernet ou Infiniband qui relient les serveurs frontaux aux tiroirs. « Dans notre solution, les serveurs frontaux ne se parlent pas. Ils ne partagent pas de cache. Ce sont finalement juste des proxys pour le namespace du stockage. Et si l’un d’eux tombe en panne, la solution continue de fonctionner, sans qu’il soit besoin de reconstruire un RAID ou quoi que ce soit d’équivalent », dit Jeff Denworth.
Résoudre les problèmes des SSD en formatant les blocs de données dans Optane
La seconde originalité est de faire fonctionner ensemble des Optane très rapides et très chers avec des SSD QLC, la catégorie de SSD la plus lente et la moins chère. « Ainsi, les serveurs frontaux lisent et écrivent vers les tiroirs 100 fois plus rapidement que s’il s’agissait de disques durs classiques, mais notre solution coûte 80 % moins cher qu’une baie All-Flash », assure le responsable des produits.
Selon lui, pour 1 Po de capacité brute, une baie All-Flash coûterait 2 millions de dollars, contre 400 000 dollars dans le cas d’une baie Vast. Il ajoute qu’une baie hybride classique, mélangeant 20 % de SSD MLC et 80 % de disques durs mécaniques, serait moins performante que ces deux solutions et coûterait 760 000 dollars.
Jeff DenworthChief Marketing Officer et cofondateur, Vast Data.
Évidemment, la mémoire Optane sert ici de cache pour compenser la lenteur des SSD QLC en écriture, mais pas seulement. « L’intérêt des disques QLC est qu’ils sont les moins chers des SSD. Mais cet avantage vient avec de grands inconvénients. SI leurs écritures sont lentes, ce n’est que pour compenser la fragmentation importante de leurs données, laquelle sert elle-même à compenser le vieillissement prématuré de leurs composants NAND. Nous avons développé des algorithmes pour résoudre ces trois problèmes au niveau des modules Optane qui conjuguent la rapidité de la RAM avec la capacité du Flash », explique Jeff Denworth.
Explications. Sur des composants NAND QLC, 4 bits sont écrits en même temps dans chaque cellule, ce qui représente 16 combinaisons possibles, soit 16 voltages différents, au lieu de 8 pour les SSD TLC (3 bits par cellule) et 4 pour les SSD MLC (2 bits par cellule). Augmenter le voltage signifie déplacer plus d’électrons à chaque écriture et, donc, un vieillissement prématuré des composants NAND sur ces SSD.
Ensuite, sur ces SSD, le bloc minimum que l’électronique peut écrire pèse 64 Ko, soit 16 fois plus que les 4 Ko d’un bloc tel que le conçoit un système de fichiers. Pour éviter de multiplier les réécritures qui font vieillir les cellules, toutes les données de moins de 64 Ko sont d’abord écrites dans un nouveau bloc de 64 Ko.
Au bout de 3 200 blocs écrits ainsi (soit l’équivalent de 200 Mo de capacité dans lesquels il peut n’y avoir que 12,5 Mo de données), le firmware du SSD considère qu’il a suffisamment gâché d’espace, et entreprend de rassembler tous les blocs de données en blocs de 64 Ko pleins. Sauf que cette opération prend un certain temps qui pénalise la vitesse d’écriture, car il faut discerner les données utiles des espaces vides, tout recopier dans de nouveaux blocs, effacer les anciens, etc.
Une déduplication plus granulaire
« Toutes ces raisons font que, d’ordinaire, les SSD QLC ne sont utilisés que pour l’archivage. Pour profiter de leur prix bas, y compris en production et sur des applications nécessitant de la haute performance, nous attendons d’avoir rempli des tranches de 200 Mo au niveau des modules Optane avant d’écrire sur les SSD QLC ; ce qui évite à ces derniers toutes les opérations chronophages de maintenance interne », argumente Jeff Denworth.
Jeff DenworthVast Data
Mieux : le système de Vast Data n’écrit que des données dédupliquées, ce qui évite encore une autre réécriture. Au final, le constructeur prétend que ses SSD QLC peuvent durer 10 ans, alors qu’ils sont donnés pour trois ans habituellement.
« Dernier avantage de notre système de gestion des blocs, la déduplication est plus efficace sur nos baies, car contrairement à nos concurrents, nous ne cherchons pas de doublons dans des blocs de 64 ko, nous sommes plus granulaires », conclut Jeff Denworth. Il avance qu’une baie Vast pourrait réduire trois fois mieux la taille d’un fichier vidéo comparativement à la déduplication pratiquée sur les baies Isilon de Dell EMC.