xiaoliangge - Fotolia
Stockage : Pure Storage investit dans l’Ultra Ethernet
100 % compatible IP, au contraire d’InfiniBand et de RoCE, ce nouveau protocole doit permettre d’accélérer les communications entre des NAS standards et des serveurs de calcul.
Dans un contexte de besoin de meilleure bande passante entre les serveurs de calcul et les baies de stockage dédiés à l’IA, le fabricant Pure Storage annonce rejoindre le consortium Ultra Ethernet (UEC). Subordonné à la fondation Linux, ce consortium vise à standardiser un nouveau protocole réseau de bas niveau pour succéder à l’actuel Ethernet. Il a été créé il y a tout juste un an.
« Ethernet est un protocole générique, ce qui signifie qu’il est conçu pour supporter le plus grand nombre possible de cas d’usage du réseau. Et si sa conception a permis son omniprésence, elle a également réduit les possibilités de l’améliorer au fil du temps. À l’exception de l’accélération de sa vitesse physique, qui atteint aujourd’hui 800 Gbit/s. Le but de l’UEC est d’augmenter encore le débit utile, mais sans changer la partie physique des réseaux déjà installés dans les datacenters », écrit Don Poorman, porte-parole des questions technologiques pour Pure Storage dans un billet de blog.
Accélérer les réseaux Ethernet existants, peu chers
Dans les faits, l’accélération s’est faite au fil des décennies, en augmentant la fréquence de l’envoi des signaux sur des fils de cuivre ou des fibres optiques. C’est-à-dire en augmentant simplement la fréquence de la puce qui génère et écoute ces signaux dans la carte contrôleur. Pour le reste, rien n’a changé dans le fonctionnement d’Ethernet, lequel repose sur la communication de nombreux signaux fonctionnels parmi les signaux qui correspondent aux données utiles.
L’intérêt de ces signaux fonctionnels est de garantir la fiabilité des communications. Le protocole Ethernet est ainsi capable de détecter les communications qui échouent (parce que le destinataire n’est pas prêt, parce qu’un câble a été arraché ou dysfonctionne…) et de calculer quand les relancer. C’est essentiel dans un datacenter où les éléments sont interconnectés via une toile d’araignée de câbles et où les embouteillages de transmission sont fréquents.
En revanche, toutes ces précautions sont inutiles dans un cluster où chaque nœud de calcul passe la majorité de son temps à avaler les données que lui envoie une unité de stockage à l’autre bout d’une fibre dédiée.
« Historiquement, les supercalculateurs ont préféré utiliser le protocole InfiniBand pour atteindre un débit meilleur, avec moins de latence et qui était plus adapté qu’Ethernet pour connecter les serveurs à leur stockage. Plus récemment, le protocole RoCE (RDMA over Converged Ethernet) a été introduit pour permettre une communication plus directe entre le calcul et le stockage. Les efforts de l’UEC se focalisent sur une alternative plus évoluée », raconte Don Poorman.
En l’état, Infiniband et RoCE utilisent les mêmes débits physiques que les réseaux Ethernet traditionnels, soit le plus souvent entre 25 et 200 Gbit/s. En revanche, la quantité de Go utiles transportés peut augmenter de 30 %, du simple fait que ces protocoles n’utilisent pas TCP/IP pour contrôler la logique des paquets.
Pour fonctionner, InfiniBand et RoCE nécessitent des contrôleurs spéciaux, plus chers. L’Ultra Ethernet consiste juste à alléger le protocole de base pour qu’il fasse moins de vérifications, en conservant les mêmes contrôleurs que l’on trouve dans le commun des équipements Ethernet. « Voyez un réseau Ethernet comme une route avec des feux rouges et un réseau Ultra Ethernet comme la même route, mais avec moins de feux rouges », résume le porte-parole de Pure Storage.
Il précise que l’enjeu est de permettre aux entreprises de gagner en vitesse sans dépenser plus, c’est-à-dire sans investir dans de nouveaux switches et contrôleurs et sans changer les systèmes qui les pilotent. En l’occurrence, Ultra Ethernet implémente son propre protocole de transport, Ultra Ethernet Transport, qui se veut compatible avec UDP et TCP et qui se greffe à un fonctionnement IP traditionnel.
Ainsi, un simple NAS continuera de partager ses fichiers avec les serveurs de calcul, de la même manière, mais plus rapidement.
L’enjeu d’incarner un acteur de pointe
Cette annonce arrive dans un contexte où Pure Storage mise beaucoup sur une image de savoir-faire de pointe, dans le but de revendre ses technologies aux hébergeurs de cloud. Ces derniers, les plus gros consommateurs de produits informatiques, préfèrent généralement fabriquer eux-mêmes leurs serveurs, baies de stockage et équipements réseau, plutôt qu’acheter les produits prêts à l’emploi que les fournisseurs conçoivent pour les entreprises. Pour autant, Pure Storage dispose d’une technologie suffisamment originale en matière de SSD pour répondre aux besoins d’économie d’échelle des hyperscalers.
En substance, ses baies de disques ont la particularité de contrôler elles-mêmes les cellules de mémoire NAND où les données sont enregistrées, ce qui permet à ses modules de stockage Flash DFM de contenir 2 à 2,5 fois plus de circuits NAND que des SSD traditionnels. Cela revient à diviser d’autant les dépenses électriques et le volume occupé dans un datacenter pour une capacité de stockage donnée.
Mais, en matière de supercalcul et d’IA, avoir un stockage plus dense n’est utile que si le stockage est plus rapide. Les données qui servent à l’entraînement ayant une taille finie, il serait contre-productif d’en mettre plus par port réseau physique si ces ports réseau ne peuvent pas en transmettre plus. D’où l’intérêt d’un protocole comme Ultra Ethernet.
Parallèlement à son adhésion à l’UEC, Pure Storage vient d’investir dans la startup allemande Cerabyte qui planche sur un système d’archivage des données ultra dense dans de simples plaquettes de verre.