Bits and Splits - stock.adobe.co
DAOS, le système de fichiers qui tire parti d’Optane
Sur les traces de Lustre, Intel a mis en Open source un système de fichiers qui utilise spécifiquement les modules Optane pour stocker les métadonnées et accélérer les accès aux disques.
Intel a son propre système de fichiers pour exploiter les capacités de ses unités de stockage Optane. Second au palmarès IO500 qui mesure les performances des solutions de stockage dans le cadre du supercalcul, DAOS – Distributed Application Object Storage – est un système conçu dès 2015 pour exploiter la faible latence des NVRAM, à savoir des barrettes de DRAM doublées de composants Flash pour offrir à la fois la plus grande vitesse d’accès possible et la persistance du stockage.
Intel présente DAOS comme un successeur de Lustre, son précédent système de fichiers qu’il a revendu à DDN en 2018. Dans l’édition de novembre 2019 du palmarès IO500, Lustre arrive en troisième place avec un score de 453,68, tandis que DAOS est second avec un score de 933,64, juste derrière la plus haute place du podium, occupée par le système Matrix de WekaIO.
Des nœuds de stockage avec barrettes et SSD Optane
Le test IO500 mesure la bande passante et la rapidité à retrouver des éléments parmi les fichiers, entre un nœud de calcul pris au hasard et un nœud de stockage. Mais dans tous les cas, les fichiers sont répartis sur plusieurs nœuds de stockage et accessibles depuis plusieurs nœuds de calcul.
Dans la configuration proposée par Intel, les nœuds de stockage sont dotés de barrettes Optane DCPMM doublées, en NVMe, de disques qui sont tantôt des SSD Optane DC, tantôt des SSD à base de NAND 3D. Du côté des nœuds de calcul, on trouve une bibliothèque DAOS qui transfère les requêtes POSIX, HDFS, Apache Spark ou encore MPI-I/O vers les nœuds de stockage.
Notons que, pour des applications plus conventionnelles de décisionnel ou de Machine Learning, la bibliothèque DAOS supporte également les accès des couches applicatives VeloC, TensorFlow, NoSQL ou encore Amazon S3.
Un système de fichiers de classe objet qui consomme plus de ressources
DAOS est un système de fichiers Open source accompagné d’une base de métadonnées qui en fait, en pratique, un système de stockage objet élastique. Il fonctionne sur Linux en mode user-space, ce qui signifie qu’il contourne le goulet d’étranglement du noyau Linux et qu’il est possible de le mettre à jour sans redémarrer les serveurs sur lesquels il fonctionne.
Les métadonnées sont stockées sur les modules Optane, lesquels servent aussi de cache pour les accès aux SSD conventionnels. Pour maximiser la vitesse des accès, DAOS ne propose aucun dispositif de réplication des données déjà enregistrées ni d’erasure coding. Il se veut néanmoins résistant aux incidents en écrivant sur plusieurs nœuds à la fois les mêmes données. Selon les observateurs, DAOS serait, in fine, le système de fichiers le plus consommateur de ressources matérielles – et donc le plus cher – parmi les solutions de stockage pour clusters.
Notons enfin que, pour l’heure, Intel n’a pas réécrit spécifiquement de pilotes pour adresser les différents types d’accès disponibles depuis Linux. Pour les accès Posix, par exemple, DAOS repose en réalité sur les pilotes de Lustre.