tonda55 - Fotolia
Excelero dévoile sa technologie hyperconvergée NVMe
La startup californienne Excelero a dévoilé la semaine dernière sa technologie de stockage hyperconvergée NVMesh qui permet de créer des clusters de stockage Flash NVMe reliés par une fabric Ethernet RDMA.
La startup Excelero qui a fait ses débuts publics la semaine dernière a présenté une architecture hyperconvergée à hautes performances baptisée NVMesh Server SAN, s’appuyant sur des disques NVMe et une pile logicielle maison.
NVMesh Server SAN est une technologie logicielle, qui permet de créer des pools de stockage en unifiant les multiples disques SSD NVMe présents sur les serveurs d’un cluster. Dans la pratique, Excelero installe un pilote en mode bloc propriétaire sur chacune des machines Linux d’un cluster. Ce pilote permet à chaque machine d’être serveur ou client de stockage ou les deux en même temps. « Nous vous permettons de partager des disques NVMe à l’échelle de votre datacenter », explique le CTO de la firme Yaniv Romem. « Une application tournant sur un serveur A peut consommer du stockage sur les serveurs B,C et D ».
Un accès à des disques NVMe distants via un protocole propriétaire sur RDMA
Des datacenters utilisent la technologie d’Excelero à grande échelle pour assembler des environnements de type SAN à partir de serveurs standards, de cartes réseau RDMA et de disques NVMe. Parmi les premiers clients de la firme figure la division Predix de General Electric, Hulu, la NASA et PayPal.
NVMesh Server SAN s’appuie sur une technologie maison baptisée RDDA (Remote Direct Drive Access) pour permettre à tout serveur de lire et écrire sur n’importe quel disque NVMe. RDDA s’appuie sur une « fabric » Ethernet RDMA (Remote Direct Memory Access) et permet de transmettre des commandes RDMA au-dessus d’un réseau sans impact sur la performance processeur. Selon la firme, cela lui permet de supporter la montée en charge de façon linéaire.
RDDA s’appuie sur RoCE (RDMA over converged Ethernet) pour relier tous les disques d’un cluster. « La technologie fait croire aux cartes réseau qu’elles écrivent en mémoire alors qu’elles écrivent en fait sur un disque NVMe », explique Romem. Selon Excelero, RDDA permet des communications directes en mode point à point entre le serveur « client » et les disques cibles sur les autres noeuds. Ce faisant, RDDA contourne la pile NVMe over fabrics et permet l’économie de quelques dizaines de nanosecondes de latence. D’après la firme, la différence entre un accès disque local NVMe et un accès distant à un disque NVMe via RDDA n’implique qu’une pénalité quelques nanosecondes, en fait la latence du réseau entre les deux nœuds.
NVMesh Server SAN met aussi en œuvre une séparation claire entre plan de contrôle et plan de données. Le plan de contrôle, ou Topology Manager (TOMA) est implémenté de façon distribuée, en parallèle aux pilotes installés sur chaque serveur. Il s’exécute sous la forme d’un module tournant en mode user space afin de minimiser la latence des communications. Ce plan de contrôle permet de détecter les anomalies (perte de lien ou de disque) et de contourner les éventuelles défaillances.
NVMesh peut fonctionner en mode convergé, désagrégé ou en mode hybride. Le produit supporte aussi les SSD SAS et SATA, mais sans les bénéfices de performance liés à l’usage de NVMe. Côté protection de données, NVMesh supporte les modes Raid 0 (agrégation par bande), Raid 1 (mirroir) et Raid 10 (agrégation de grappes de disques répliquées). Les données sont distribuées entre de multiples SSD sur de multiples serveurs. L’architecture détecte des pannes à l’échelle des serveurs et du rack.
Excelero cible pour l’instant les clients ayant des besoins de stockage à haute performance à l’échelle d’un cluster de serveur. La technologie peut être combinée avec des systèmes de fichiers comme Lustre, Spectrum Scale ou Hadoop et elle peut aussi être mise en œuvre de façon sous-jacente à des applications Big Data ou à des clusters Docker ou à des bases de données comme Oracle.