Stockage : Simplyblock veut équiper tous les petits hébergeurs
La startup allemande vient de mettre au point un SDS qui coûterait aux hébergeurs dix fois moins cher que les baies de disques qu’ils achètent aujourd’hui à NetApp ou Pure Storage.
66,9 millions d’IOPS et une latence de seulement 0,062 milliseconde sur un cluster hyperconvergé de 8 nœuds, contre 0,768 million d’IOPS et 3,35 millisecondes pour la même configuration sous Ceph. Telles sont les bonnes performances de Simplyblock, un SDS mis au point par une startup allemande éponyme avec l’ambition d’équiper les hébergeurs de cloud privé.
« Notre propos est de fournir un système de stockage aux hébergeurs de services en cloud qui n’ont pas les moyens de développer leur propre technologie. Le plus souvent, il s’agit d’hébergeurs de proximité, qui sont choisis par les PME pour une relation à taille humaine. Par exemple, OVHcloud, qui est un fournisseur local de cloud en Europe, est trop important pour nous. Notre cible est plus modeste », précise Rob Pankow, le PDG de la startup (en photo ci-dessus).
Couche sans doute la plus complexe de l’infrastructure, le stockage est généralement incarné chez les petits hébergeurs par des baies de disques ou de SSDs achetées clés en main aux habituels équipementiers du datacenter.
« Les hébergeurs les plus technophiles vont entreprendre de déployer eux-mêmes le système Open Source Ceph sur des serveurs génériques. Mais, dans la grande majorité, les solutions que nous voyons le plus souvent déployées sont des baies de SSD de Pure Storage ou NetApp. Ce sont des produits excessivement chers. Nous proposons une alternative qui coûtera dix fois moins cher », argumente-t-il.
Rob PankowPDG de Simplyblock
Et pourquoi pas un SDS pour toutes les entreprises ? Manifestement, Simplyblock ne se sent pas encore de taille à rivaliser avec les fonctions de haut niveau que proposent les fabricants de baies de stockage aux entreprises. La cible est résolument celle des équipes qui osent envisager le déploiement de Ceph, une solution notoirement compliquée.
Une architecture en containers, optimisée pour le NVMe
LeMagIT a rencontré l’équipe de Simplyblock au début de l’été, à l’occasion d’un événement IT Press Tour organisé à Berlin et consacré aux acteurs européens qui innovent en matière de stockage. Durant cette rencontre, il n’a pas été possible de déterminer précisément si le SDS de Simplyblock était un développement original qui mime les caractéristiques de Ceph, ou s’il s’agissait d’une version personnalisée de Ceph, optimisée pour des caractéristiques précises.
« Ceph est un système Open source qui peut tout faire sur tout type d’équipement, à partir du moment où vous parvenez à le configurer. Simplyblock reprend ses avantages avec un code optimisé pour des SSD NVMe et pour des nœuds de stockage qui sont reliés aux serveurs via un protocole NVMe/TCP », essaie d’expliquer Michael Schmidt, le directeur technique de la startup.
Il ajoute que son système utilise les pilotes NVMe et NVMe/TCP de Linux, ceux livrés en Open source. Mais l’optimisation du code en 64 bits et un algorithme inédit pour assurer la redondance des blocs entre les nœuds de stockage (technique dite d’Erasure Coding, soit une sorte de RAID à l’échelle d’un cluster) seraient clés afin d’obtenir un million d’IOPS par cœur x86 présent dans le cluster.
« Nous pouvons mettre dans notre cluster jusqu’à 255 nœuds, chacun participant au calcul de l’Erasure coding et au partage en mode bloc, grâce à ses cœurs x86, et chacun disposant de SSDs internes pour la capacité de stockage. Notre cluster est accessible en mode bloc à des dizaines de milliers VMs simultanément », argumente-t-il.
Selon une documentation fournie par la startup, chaque serveur applicatif doit disposer d’un pilote Simplyblock pour communiquer en mode bloc avec le cluster. Ou, plus exactement, avec l’un des nœuds du cluster, chacun étant, semble-t-il, choisi à tour de rôle.
Au sein des nœuds du cluster, le SDS Simplyblock est découpé sous la forme de containers Docker. On dénombre au moins un container pour gérer la répartition des blocs en Erasure coding, un autre pour gérer les lectures/écritures sur les SSD internes et, surtout, un container Management Domain pour indexer les volumes logiques présents dans le cluster. Plus exactement, le container Management Domain indexe les autres containers, tous ceux présents dans le cluster, et répartit la charge entre eux. Tous les containers communiquent entre eux via une API.
La startup indique qu’un cluster peut fonctionner avec seulement deux nœuds, mais recommande d’en déployer au moins cinq – tous avec des SSDs NVMe similaires – pour bénéficier de meilleures performances par rapport à Ceph. Les résultats indiqués au tout début de cet article ont ainsi été obtenus sur un cluster de huit nœuds. Chaque nœud était équipé de deux Intel Xeon 6126 (12 cœurs chacun) à 2,6 GHz, 512 Go de RAM, dix SSDs NVMe de 7,68 To chacun en PCIe 4.0 et deux connexions Ethernet 100 Gbit/s.
Demain, l’interconnexion cloud, la réduction, les modes fichier et objet
Simplyblock n’en est encore qu’à ses débuts. De sa carrière commerciale, tout d’abord : « nous n’avons pas encore de clients, mais nous sommes en phase de test chez plusieurs hébergeurs allemands et autrichiens », indique Rob Pankow.
Mais aussi de ses possibilités techniques. D’ici à la fin de l’année, il sera doté de la possibilité de s’interfacer avec des clusters Simplyblock virtuels hébergés chez AWS ou sur une infrastructure OpenStack. Possibilité qui devrait être étendue à Azure et GCP d’ici au début de l’année 2024. Dans ce cas de figure, il s’agit juste d’installer les containers fonctionnels sur une machine virtuelle.
« Nous avons déjà testé notre système en version hébergée sur des VMs EC2 d’AWS. Et il est intéressant de comparer les performances d’un tel déploiement par rapport à EBS, le service de stockage en mode bloc d’AWS. Nous obtenons les mêmes performances que sur le service haut de gamme EBS io2 Block Express [réservé généralement aux bases de données SQL, N.D.R.], soit 1 000 IOPS par Go et 4 Go/s de débit par volume. Un service EBS de base n’offre que 50 IOPS par Go et 1 Go/s », dit le PDG.
Ensuite, vers le milieu de l’année 2024, Simpliblock devrait profiter d’une fonction de réduction des données qui pourrait diviser la taille des contenus par trois. À la rentrée 2024 arriveront des services de stockage en mode fichier et en mode objet, chaque service devant être exécuté au sein de nouveaux containers. Ces services devraient s’accompagner d’un pilote CSI qui les rendra utilisables sur un cluster Kubernetes.
Enfin, fin 2024, Simplyblock devrait implémenter un dispositif de snapshot qui permettra de restaurer rapidement les dernières données saines en cas de cyberattaque. À ce moment-là, peut-être que Simplyblock élargira son public aux entreprises.