ludodesign - Fotolia
Datrium propose une architecture de stockage originale
La start-up, qui a débuté la commercialisation de sa technologie DVX il y a quelques mois, propose une architecture originale tirant partie des SSD locaux des hôtes VMware pour décharger sa baie de stockage et doper ses performances.
À l’occasion d’une visite dans la Silicon Valley, LeMagIT a pu s’entretenir avec les dirigeants de Datrium une start-up qui propose de découpler le stockage physique des contrôleurs permettant l’accès à ce stockage.
De l’avis de Brian Biles, le CEO et cofondateur de la firme (il a précédemment cofondé Data Domain), l’architecture actuelle des baies de stockage n’est plus adaptée pour tirer pleinement parti de la performance des nouveaux supports de stockage comme la Flash ou les futurs systèmes de stockage à base de 3D Xpoint.
Selon lui, utiliser de la Flash sur une baie centralisée ne permet pas d’en tirer le plein potentiel. La seule façon d’extraire le maximum de la Flash est de l’installer directement sur les serveurs et de la marier à un stockage centralisé économique dont le rôle est d’assurer la protection rapide des écritures, la persistance sécurisée des données et l’alimentation des caches sur les serveurs. De cette façon, la quasi-totalité des opérations de lectures sont traitées en local, tandis que les opérations d’écritures sont acquittées rapidement par une couche de mémoire NVRAM dans la baie.
Dans la pratique, Datrium se fait l’avocat d’une architecture découplée, dans laquelle les serveurs, dopés de cache Flash massifs, jouent le rôle contrôleurs de stockage locaux, et dans laquelle la baie centralisée réduite à sa plus simple expression, permet de persister les données à bas coûts (via l’utilisation de disques SATA) et d’alimenter de façon intelligente les caches flash des serveurs.
Une architecture « découplée »
Pour qu’une telle architecture fonctionne, Datrium a déplacé une large partie des fonctions habituellement délivrées par les contrôleurs des baies dans une couche logicielle tournant sur l’hyperviseur VMware ESXi (voir schéma ci-dessus). Cette couche logicielle, que la firme présente comme un hyperviseur de stockage, est baptisée DVX Hyperdriver. Elle s’installe sur chacun des hôtes ESXI connectés à la baie et assure une large partie des services habituellement délivrés par un contrôleur.
C’est elle qui accepte les opérations d’entrées/sorties provenant d’ESXi. DVX Hyperdriver s’appuie sur un système de fichiers à base de log. Les opérations écritures sont systématiquement répliquées dans la NVRAM de la baie afin d’être acquittées de façon sécurisée le plus rapidement possible. L’hyperviseur de stockage peut alors « prendre son temps » pour réorganiser les données et les dédupliquer avant de les écrire de façon sécurisée sur les disques. Pour cela, le logiciel s’appuie sur un algorithme d’erasure coding afin de persister les données sur les disques durs de la baie, tout en maintenant les données actives dans le cache local Flash du serveur.
Le stockage présenté par l’hyperdriver apparaît aux VM comme un unique datastore NFS. Hyperdriver s’approprie en standard 20% des ressources physique du serveur et se comporte comme un contrôleur de stockage local à très hautes performances. En s’appuyant sur le stockage Flash local et 20% des ressources d’un serveur moderne, Datrium nous a montré qu’il était possible de délivrer plus de 60 000 IOPS par serveur. En utilisant le mode dit « insane » qui accapare 40% des ressources CPU, on peut même délivrer plus de 100 000 IOPS par serveur.
Jusqu'à un million d'IOPS en lecture sur un cluster de 32 noeuds
Selon Datrium, les serveurs doivent disposer au minimum de 8 cœurs et il est possible d’attacher jusqu’à 32 hôtes à une unique baie DVX Netshelf. Sur chaque hôte, l’hyperviseur DVX Hyperdriver consomme 5 Go de RAM plus 2,5 Go de RAM par To de Flash utilisé en cache local. Au total, Datrium estime qu’un cluster de serveurs équipés de l’hyperviseur DVX et connectés à une baie DVX NetShelf peut délivrer jusqu’à 1 million d’IOPS en lecture (bloc de 4K). Aucun chiffre n’est toutefois fourni par la firme sur la performance en écriture.
En combinant des SSD de grande capacité sur les serveurs avec sa baie de disque à bas coût, Datrium estime pouvoir délivrer des performances meilleures que celles d’une baie 100% Flash à un tiers du coût (un prix qui inclut celui des SSD locaux). La raison est que la firme recommande d’acheter des SSD serveurs habituellement vendus bien moins cher que les SSD utilisés dans les baies de stockage.
La baie DVX NetShelf elle-même est une baie de stockage bi-contrôleur avec 12 disques de 4 To qui après protection (et spare) offre une capacité utile de 29 To (soit entre 60 et 180 To de capacité utile après compression et déduplication selon les profils de workloads). Pour l’instant, il n’est pas possible d’étendre sa capacité ou d’ajouter des nœuds de stockage, même si une telle évolution est prévue pour de futures versions de la technologie. Le prix d’une baie NetShelf est de 125000 $ et inclut les licenses pour 32 hyperviseurs de stockage DVX Hyperdriver sans aucune limite sur la taille des caches SSD locaux. A ce prix il faut ajouter celui des serveurs et des SSD locaux pour une configuration complète. Datrium estime qu'une solution complète est environ un tiers moins chère qu'une solution Flash concurrente pour des performances comparables. La commercialisation de la baie a débuté aux Etats-Unis et devrait commencer à l'international dans la seconde moitié de 2016.