Stockage : Graid décline sa carte accélératrice aux stations de travail
Véritable carte graphique RTX T400 de Nvidia, la nouvelle SupremeRAID SR-1001 multiplie les débits d’un pool de huit SSD NVMe par deux ou trois, comparativement aux contrôleurs de stockage dédiés.
Graid, la startup qui accélère le RAID entre les SSD dans les serveurs et les baies de stockage, grâce à des cartes graphiques Nvidia pour PC, décline son offre aux machines d’appoint, en tour.
« Nous proposions jusque-là d’accélérer des RAID des 32 SSD dans des serveurs en rack, avec des cartes Nvidia RTX T1000 (PCIe 3.0) et A2000 (PCIe 4). Mais en réalité, le besoin va au-delà du datacenter. L’un de nos clients voulait une solution pour ses stations de travail. Nous avons donc décliné un modèle de carte graphique T400 (PCIe 3) qui permet d’accélérer un RAID de 8 SSDs NVMe dans une machine de bureau », explique Thomas Paquette, le directeur général de Graid, lors d’un événement IT Press Tour organisé fin janvier et consacré aux startups qui innovent dans la Silicon Valley.
Selon les benchmarks réalisés par Graid, la nouvelle carte pour station de travail, baptisée SupremeRAID SR-1001, permet d’atteindre 6 millions d’IOPS en lecture, avec un débit de 80 Go/s, et 500 000 IOPS en écriture avec un débit de 30 Go/s.
Comparativement, une machine qui confie son RAID à son processeur principal plafonne à 2 millions d’IOPS en lecture, avec un débit de 59 Go/s, et à 200 000 IOPS en écriture, avec un débit de seulement 2 Go/s. Pire, un RAID logiciel peut consommer jusqu’à 87 % de la puissance CPU, ne laissant quasiment plus rien à l’exécution des applications principales.
Il existe une alternative aux cartes SupremeRAID de Graid : les contrôleurs de stockage Broadcom. Sur une station de travail, un contrôleur de type Broadcom 95xx fait à peine mieux qu’un RAID logiciel : 3,5 millions d’IOPS en lecture, avec un débit étonnamment nul de 13,5 Go/s, et 180 000 IOPS en écriture, avec un débit de 4 Go/s.
Un pilotage des bus PCIe plutôt qu’un mode passerelle
Mais c’est aussi lorsqu’un incident survient et que le RAID est saturé de travail pour reconstruire les données perdues sur un nouveau SSD, que la carte SupremeRAID donne toute la mesure de sa puissance : elle parvient à maintenir des quantités d’accès de l’ordre de 1 million d’IOPS en lecture et 350 000 IOPS en écriture, alors qu’un RAID logiciel s’écroule à 186 000 et 150 000 IOPS respectivement et qu’un contrôleur Broadcom 95xx ne parvient pas à dépasser 36000 et 18000 IOPS.
« Les performances peu réjouissantes des contrôleurs Broadcom s’expliquent par une pure équation mathématique : chaque SSD NVMe utilise quatre canaux PCIe, soit 32 canaux en tout pour huit SSD dans une station de travail. Un contrôleur Broadcom fonctionne comme une passerelle : il récupère tous les flux de stockage et les délivre aux SSD par son propre bus, via un switch PCIe supplémentaire. Mais comme le contrôleur Broadcom est une carte PCIe 16 canaux, vous perdez de base 50 % de la puissance possible. »
« Dans notre solution, la carte SupremeRAID n’est pas une passerelle. Elle sert juste à dire au bus PCIe comment router les données au travers des différents canaux. Il n’y a aucun goulet d’étranglement », indique Thomas Paquette.
Évidemment, sur les versions en serveurs rack où elles pilotent 32 SSD, les performances des cartes de Graid font d’autant plus de miracles. La version SR-1010, en PCIe 4.0 atteint 28 millions d’IOPS en lecture, avec un débit de 260 Go/s, et 2 millions d’IOPS en écriture, avec un débit de 100 Go/s. La SR-1000, en PCIe 3.0, affiche 16 millions d’IOPS en lecture, avec un débit de 220 Go/s, et 820 000 IOPS en écriture, avec un débit 90 Go/s.
En face, un contrôleur Broadcom 96xx pour serveurs rack ne dépasse pas 6,9 millions d’IOPS en lecture, avec un débit de 28,2 Go/s, et 651 000 IOPS en écriture, avec un débit de 10,4 Go/s.
Pas de support de VMware ESXi
En matière de compatibilité, les cartes de Graid disposent de pilotes pour toutes les versions courantes de Linux et pour les deux dernières générations de systèmes Windows, qu’il s’agisse des versions serveur (2019, 2022) comme des versions PC (10, 11). Ces pilotes fonctionnent sur des machines x86, mais également ARM. Et toutes les marques de SSD NVMe sont compatibles.
En revanche, la compatibilité avec les couches de virtualisation est plus surprenante. Les cartes de Graid sont supportées par Hyper-V de Microsoft, par KVM (l’hyperviseur Open source des distributions Linux), par OpenVZ (un hyperviseur Linux qui virtualise aussi les containers) et par Proxmox VE (comme OpenVZ, mais en se basant sur le code de KVM). Mais elles ne sont pas prises en charge par ESXi de VMware. En même temps, VMware a été racheté par le fabricant de puces Broadcom, que Graid concurrence.
Thomas Paquette se défend en expliquant qu’ESXi n’est plus une priorité : « nous supportons tout de même les versions Workstations de VMware. Pour le reste, les gens sont inquiets avec le rachat de VMware par Broadcom. Ils cherchent des alternatives. Et ça tombe bien, nous sommes compatibles avec les alternatives… Cela dit, la virtualisation crée elle-même un goulet d’étranglement. Elle réduit le gain de performances que nous apportons. »
À ce stade, Thomas Paquette s’est retrouvé à devoir expliquer quelle était la stratégie de Graid vis-à-vis des hébergeurs de cloud, qui constitueraient une clientèle importante pour la startup, à condition que les cartes SupremeRAID supportent leurs infrastructures systématiquement virtualisées : « C’est bien simple. Nous n’avons aucun contrat avec les hyperscalers. Cependant, s’ils s’intéressaient à notre solution, nous mettrions les bouchées doubles pour optimiser notre solution à leur virtualisation. Mais chaque chose en son temps. Nous sommes une petite équipe. Nous développons avec nos moyens », argumente-t-il.
Bientôt des partenariats avec de grands noms de l’infrastructure ?
En fait, Graid a surtout occupé ses derniers mois à adapter ses solutions pour qu’elles fonctionnent avec des déploiements de type NVMe-over-Fabrics, c’est-à-dire pour que ses cartes puissent piloter un RAID sur un tiroir de disques externe, connecté en FC, RoCE, TCP ou Infiniband.
« Le point intéressant de ce développement est que notre solution fonctionne à présent aussi bien en tant qu’initiateur, c’est-à-dire depuis le serveur, qu’en tant que cible, c’est-à-dire en plaçant la carte SupremeRAID directement dans la baie de disques externe. Je ne peux pas en dire plus pour l’instant, mais nous nous sommes concentrés sur cet aspect à la demande d’un fabricant d’infrastructure », lance Thomas Paquette, sans préciser s’il s’agit d’un fabricant de baies de stockage ou d’un fournisseur de serveurs.
Selon ses dires, Graid serait très sollicité par les fabricants de matériels, plus que par les éditeurs de systèmes ou les hébergeurs de cloud. Notamment, des concurrents de NVidia le presseraient pour qu’il décline ses cartes avec des modèles basés sur leurs puces.
« Attendez encore quelques semaines pour que je puisse vous révéler qui sont ces grands acteurs des semiconducteurs qui cherchent des solutions pour révolutionner le stockage et qui pensent que nous sommes leur réponse », conclut le directeur général de Graid.
Graid n’est pas le seul à avoir eu l’idée d’utiliser des GPU pour accélérer le RAID. Il existe aussi la solution de Nyriad. Toutefois, celle-ci est conçue pour les disques durs et non pour les SSD NVMe.