Stockage : Panasas décline ses solutions HPC en bolides pour les entreprises
Le fournisseur de NAS parallélisés pour supercalculateurs veut élargir sa clientèle aux banques et au secteur des médias. Ses solutions condensent dans 4U soit des SSD très rapides, soit des disques très capacitifs.
Panasas, le fournisseur historique de NAS pour supercalculateurs, commercialise ces jours-ci deux nouveaux modèles de baies ActiveStor qu’il avait discrètement annoncées en mai dernier. L’ActiveStor Flash « all-NVMe » offre ainsi jusqu’à 48 SSD NVMe pour une capacité maximale de 368 To bruts (avec des SSD 2,5 pouces de 7,67 To) dans un châssis 4U. L’ActiveStor Ultra XL propose, dans le même format, 24 disques durs 3,5 pouces pour une capacité maximale de 640 To bruts (soit 26,7 To par disque dur).
« Précédemment, nous proposions l’ActiveStor Ultra qui mélange des SSD et des disques durs traditionnels pour répondre aux différents besoins du supercalcul. Avec ces nouvelles baies, nous élargissons nos cas d’usage à l’analytique, que ce soit pour les traitements d’IA très rapides à base de GPU, avec la version Flash, ou pour les algorithmes qui ont besoin de croiser et/ou diffuser un très grand nombre de données, avec la version Ultra XL », explique Jeff Whitaker, le responsable marketing de Panasas, lors d’une rencontre avec la presse.
L’enjeu du fournisseur est de mettre la rapidité de ses solutions, éprouvée dans les supercalculateurs, au service des entreprises. Jusqu’à présent, ses clients étaient constitués d’industriels de l’énergie et de laboratoires de recherche. Désormais, Panasas veut s’adresser aux banques et aux acteurs des médias.
Le stockage d’un côté, les requêtes de l’autre
Les solutions de Panasas reviennent en pratique à des châssis dans lesquels sont enfichées des lames. Chacune contient un contrôleur et plusieurs disques. Sur l’ActiveStor Flash, on dénombre ainsi huit demi-lames 1U (quatre superposées à gauche, quatre autres à droite) offrant chacune six SSD en façade (soit 46 To par lame).
Mais au-delà de ces unités NVMe extractibles à chaud, la performance de ces nœuds est à chercher sur le contrôleur de la lame. Ici, chaque carte dispose de 64 Go de RAM, dont une majeure partie sert de cache pour les lectures et les écritures. On y trouve aussi une barrette de mémoire non volatile NVDIMM de 16 Go. Presque aussi rapide que de la DRAM conventionnelle, cette partie du stockage héberge les métadonnées (utilisateurs, fréquences d’utilisation des fichiers, droits d’accès, etc.) qui contribuent à accélérer les accès.
Jeff WhitakerResponsable marketing, Panasas
Enfin, deux ports Ethernet 25 Gbit/s servent à communiquer avec le réseau, tandis qu’un SSD NVMe au format M.2, de 3,84 To, contient le système d’exploitation.
Sur l’ActiveStor Ultra XL, le châssis 4U contient pour sa part quatre demi-lames 2U de six disques durs (soit 160 To par lame). Le contrôleur à l’arrière est le même que celui d’une lame ActiveStor Flash, si ce n’est que le cache dépend ici d’une RAM de 32 Go.
Néanmoins, ces baies ne sont qu’une partie du NAS. Le principe de fonctionnement des baies de Panasas est que les machines du réseau envoient toutes leurs requêtes NFS/SMB à un module externe, l’ActiveStor Director, appelé ici « Control plane ». Celui-ci identifie l’emplacement des fichiers demandés sur tel ou tel nœud des châssis ActiveStore (appelés le « Data plane ») et commande au contrôleur de la lame concernée d’envoyer ses données directement à la machine qui a émis la requête.
Ainsi, les files d’attente des machines du réseau ne peuvent se créer qu’au niveau du Director. En l’occurrence, ces files d’attente sont infimes, car les requêtes sont extrêmement légères. Le chargement des fichiers des baies de stockage jusqu’aux machines du réseau est, lui, parallélisé et ne souffre donc d’aucun engorgement. Sur un NAS conventionnel, où Control Plane et Data Plane sont confondus, un client doit attendre que le réseau soit libre pour obtenir ses données depuis les disques.
L’ActiveStor Director est lui-même un châssis 2U de quatre lames. Ces lames sont les mêmes que celles de l’ActiveStor Flash, les six SSD NVMe de stockage compris. Ceux-ci ne servent ici qu’à stocker les métadonnées du système. En l’occurrence, l’emplacement des fichiers et celui de leurs doublons, pour paralléliser les accès même quand plusieurs machines veulent lire le même contenu. Seule différence notable, chaque lame de l’ActiveStor Director contient ici 96 Go de RAM.
« Il y a une importante étape de design qui précède chaque déploiement chez nos clients. Selon ses besoins, nous déterminons à chaque fois combien de modules ActiveStor Director, Flash et Ultra il faut précisément installer, et comment activer les redondances entre ces nœuds pour parer à toute défaillance », précise Jeff Whitaker.
PanFS, un système de fichiers parallélisé
Le fonctionnement de la solution de Panasas est animé par le système de fichiers PanFS, désormais en version 9.2, dont une copie est exécutée sur chaque lame du cluster. Ce système présente au réseau des partages conventionnels, mais se charge en interne de découper les fichiers en fragments et de les répartir entre plusieurs disques et plusieurs lames. Ceci afin de maximiser les accès parallèles et, accessoirement, pour protéger les données contre la panne d’un élément matériel.
Pour fonctionner, il tient à jour une importante base de métadonnées qui répertorie tous les fragments. Son travail consiste aussi à mettre à jour les différents caches à intervalles réguliers pour qu’ils soient les plus efficaces possible dans le choix des données à relire en priorité. Enfin PanFS gère aussi les interruptions et les goulets d’étranglement sur le réseau. Il peut par exemple réorienter une machine cliente vers un autre nœud en cours de route s’il détecte une congestion.
Dernier composant logiciel de la solution, un agent DirectFlow est à installer sur chaque machine cliente du réseau afin qu’elle sache depuis quelle source récupérer les données.
En option, Panasas propose d’équiper chaque machine cliente et chaque lame présente dans le Data plane d’une carte Infiniband. Ainsi, les machines font leurs requêtes vers le Control plane, comme dans le cas d’un NAS traditionnel, mais chargent les données en mode bloc à pleine vitesse, de la même manière que si elles étaient sur leurs propres disques durs. Panasas ne propose pas pour l’heure un tel fonctionnement en NVMe/TCP ou NVMe/RoCE, qui serait plus adapté et moins cher, au moins pour les châssis ActiveStor Flash.