Stockage : la solution de Lightbits de plus en plus promue par Intel
Le système LightOS sert à bâtir des clusters de stockage SAN à base de connectique NVMe/TCP. Grâce aux cartes réseau d’Intel, il serait aussi rapide et 5 fois moins cher qu’une solution NVMe/RoCE.
Lightbits, l’inventeur des baies de stockage connectées en NVMe/TCP, se présente de plus en plus que comme le partenaire essentiel d’Intel pour concrétiser ses innovations. Lors d’une rencontre avec la presse, la startup a ainsi montré que son système LightOS configuré sur un cluster de trois nœuds, chacun équipé d’une carte Ethernet E810-CQDA2 d’Intel (deux ports 100 Gbit/s), atteignait des performances similaires à des configurations en NVMe/FC ou en NVMe/RoCE qui coûteraient cinq fois plus cher.
Les solutions de stockage en NVMe/TCP fonctionnent sur un réseau Ethernet standard, avec des switches et des cartes contrôleurs dans les serveurs tout ce qu’il y a de plus classique. Les solutions NVMe/FC et NVMe/RoCE nécessitent, elles, des équipements particuliers dont les tarifs sont bien plus élevés, mais elles promettent des transferts plus rapides. Leur meilleure performance est due à l’absence du protocole TCP, qui est typique des réseaux d’entreprises, mais qui consomme à lui seul beaucoup de temps de calcul pour être décodé et, donc, ralentit les accès. L’intérêt des cartes Ethernet Intel est qu’elles décodent elles-mêmes une partie de ce protocole, annulant l’effet de ralentissement.
Kam EshghiResponsable stratégie, Lightbits
« Notre promesse est de vous offrir un SAN très performant sur du matériel de base, qui ne coûte pas cher. Nous ne vous vendons pas des appliances propriétaires, qui nécessitent des équipements propriétaires autour. Nous vous proposons un système que vous installez sur le tout venant des serveurs disponibles dans le commerce et qui fonctionne sur votre réseau », argumente Kam Eshghi, le chef de la stratégie chez Lightbits (en photo plus haut).
Une solution de stockage peu chère pour les clouds privés
La démonstration consistait à connecter au cluster de stockage vingt-quatre serveurs Linux équipés chacun d’une carte Ethernet de deux ports en 25 Gbit/s. Chaque serveur Linux accédait à dix volumes répartis sur le cluster. Les mesures observées au niveau du cluster de stockage étaient de 14 millions d’IOPS et 53 Go/s en lecture seule, 6 millions d’IOPS et 23 Go/s en écriture seule, ou encore 8,4 millions d’IOPS et 32 Go/s quand les accès mélangent lectures et écritures.
Selon Kam Eshghi, ces performances sont similaires à celles de SSD NVMe qui auraient été directement installés dans les serveurs. Seule différence, la latence d’un SSD interne est de 100 microsecondes contre 200 à 300 microsecondes sur le cluster LightOS. « À cette échelle, la différence est négligeable. L’important pour une application est d’avoir une latence en dessous de la milliseconde », promet le responsable.
Outre la connectique peu chère, LightOS a le mérite de proposer des fonctions dignes d’une baie de stockage de grande marque. Citons la gestion des SSD présents dans tous les nœuds comme un seul pool de stockage, la possibilité d’ajouter ou de retirer à chaud des SSD, une répartition intelligente des données qui ralentit l’usure des SSD et des réplications à la volée pour éviter la perte de données en cas d’incident.
« LightOS permet d’assembler jusqu’à 16 nœuds dans un cluster de stockage. Il y gère un maximum de 64 000 volumes logiques pour autant de serveurs en amont. Pour présenter notre cluster comme un SAN aux serveurs, nous fournissons un plug-in pour vCenter, un pilote Cinder pour OpenStack ou encore un pilote CSI pour Kubernetes », complète Abel Gordon, l’architecte système de Lightbits. Selon lui, ces caractéristiques équivalent à celles des SAN propriétaires de même gamme.
« Nous ne supportons pas encore les serveurs Windows. Le but de notre solution est plutôt d’être une alternative économique aux solutions de stockage dans le secteur des hébergeurs de cloud privés ou publics, qui commercialisent des machines virtuelles et des containers », ajoute-t-il.
À ce titre, LightOS s’accompagne d’une console d’administration permettant d’allouer des quotas de performances et de capacités à différents utilisateurs, ou plus exactement à différentes entreprises clientes d’un service de cloud. On y trouve également une console de monitoring basée sur Prometheus et Grafana, qui sert à surveiller la consommation de chacun et livre des informations de maintenance.
Développé conjointement avec Intel
Autre comparaison. Cette fois-ci avec un cluster de stockage similaire au niveau matériel, mais équipé du système de stockage Open source Ceph qui n’est pas optimisé pour les cartes réseau Intel. Dans cette démonstration, douze serveurs Linux équipés de Kubernetes exécutent chacun huit containers qui accèdent simultanément au cluster de stockage. Lors des accès qui mélangent lectures et écritures, la version Ceph atteint invariablement un débit d’environ 4 Go/s, contre près de 20 Go/s sur la version Lightbits quand les SSD sont des TLC (plus rapides) et plus de 15 Go/s quand ce sont des QLC (plus capacitifs).
Ceph est le système de stockage que préconise Red Hat pour bâtir des clouds privés.
Gary McCulleyResponsable division Data Storage Technology Business, Intel
« Le grand intérêt de Lightbits est sa proximité avec Intel, qui lui permet de développer son système LightOS très en amont, pour qu’il soit optimisé avec les toutes dernières versions des produits Intel. De fait, si vous installez le système sur des serveurs de dernière génération, vous avez automatiquement de meilleures performances qu’avec des baies de disques récentes qui, elles, reposent sur des processeurs et des puces de génération précédente », argumente un certain Gary McCulley présent lors de la présentation.
Vérification faite, ce monsieur qui semble très au courant des efforts de développement de LightOS ne travaille pas chez Lightbits. Il n’est autre que l’un des responsables de la division Data Storage Technology Business… d’Intel.
En l’occurrence, Intel promeut ses derniers composants auprès des intégrateurs avec des concepts clés en main. L’un d’eux est un serveur 1U contenant 10 SSD NVMe extractibles à chaud, deux processeurs Xeon de dernière génération et une carte Ethernet de sa nouvelle série 800. Pour prouver l’intérêt de ce design dans le cadre de solutions de stockage, Intel a choisi de le faire fonctionner sous LightOS.
On remarquera cependant que la carte Ethernet de série 800 d’Intel n’intègre pas complètement le décodage à la volée des protocoles réseau, comme le fait la carte SmartNIC 5000X d’Intel, à base de FPGA, ou ses futures cartes réseau « Mount Evans » qui reposent sur une puce accélératrice de type DPU (qu’Intel appelle IPU).
Sur la série 800, le contrôleur se contente d’accélérer le tri entre les paquets, de sorte à éviter un embouteillage entre les accès de chaque serveur. Intel appelle cette technologie, pré-IPU, l’ADQ (Application Device Queues).
Pour autant, Gary McCulley promet que l’intégration de LighOS avec des cartes réseau équipées d’un IPU est bien dans les cartons. Il s’agira néanmoins peut-être plus d’une preuve de concept que d’un produit de série : Intel semble en effet plutôt vouloir commercialiser ses cartes réseau à base d’IPU comme des cartes NVMe/RoCE. Donc pour des solutions plus chères que celles promues par Lightbits.
De manière plus ironique, le serveur de stockage présenté par Intel comportait des barrettes de mémoire Optane PMM. Cette présentation a eu lieu plus tôt cet été, avant qu’Intel n’annonce l’abandon d’Optane. L’utilisation de barrettes Optane n’est pas obligatoire pour le fonctionnement de LightOS.