BillionPhotos.com - stock.adobe.

WekaIO, la startup de tous les records pour les NAS

Benchmarks à l’appui, le système Matrix se veut dix fois plus rapide que les NAS Scale-Out de NetApp ou Dell EMC Isilon.

De toutes les startups qui innovent en matière de stockage, WekaIO est certainement la plus scientifique. Éditrice du système de fichiers distribué Matrix, qui a battu en juin dernier huit records de vitesse aux tests de performance STAC-M3, elle vient de voir son inventivité en matière de congestion des données couronnée par la certification de trois nouveaux brevets. C’est-à-dire en plus des dix brevets dont elle avait déjà obtenu la paternité, et en attendant que les 41 autres qu’elle a déposés soient à leur tour validés.

« Nvidia, Mellanox, HPE, WDC, Seagate, Qualcomm et d’autres ont investi plus de 66 millions de dollars dans notre entreprise pour que nous concrétisions le système de fichiers le plus rapide pour les supercalculateurs comme pour les clusters qui exécutent des algorithmes de Machine Learning », a indiqué le PDG de la startup, Liran Zvibel, lors d’une récente visite du MagIT dans la Silicon Valley en quête des technologies les plus susceptibles de moderniser les solutions de stockage.

Des records de performances pour l’analytique et l’IA

Parmi ses autres faits d’armes récents, en août, WekaIO a obtenu le prix de la meilleure solution de stockage, conjointement avec Micron et décerné par leurs pairs lors du récent événement Flash Memory Summit 2019. Le système WekaFS, la partie de Matrix qui s’exécute localement sur chaque nœud, allié à des disques 9300 NVMe SSD de Micron venaient en effet de gagner la première place aux benchmarks SPEC SFS 2014, lesquels font figure de standard en matière de tests de performance lors de traitements analytiques. Deux mois plus tôt, c’est le consortium international AI Breakthrough, dédié aux innovations en matière d’intelligence artificielle, qui lui attribuait le premier prix dans la catégorie « plateforme pour le Deep Learning ». 

Depuis 2017, WelaIO s’est en effet particulièrement illustré dans des configurations clés en main de Machine Learning, en étant préinstallé tantôt sur des serveurs HPE, tantôt sur des baies de stockage ActiveScale de Western Digital.  

« Tous ces tests montrent que nous sommes dix fois plus rapides que les solutions des autres fournisseurs de NAS Scale-Out », nous dit Liran Zvibel, en faisant plus particulièrement référence aux gammes FAS de NetAPP et Isilon de Dell EMC.

Désormais en NVMe-over-Fabrics, en PRA et pour les entreprises traditionnelles

La dernière fois que nous en avions parlé, WekaIO se présentait comme une solution NAS distribuée qui combine des ressources de stockage Flash sur site, pour offrir un maximum de performances aux données chaudes, et des espaces de stockage objet en cloud (AWS S3, Openstack Swift) pour déverser automatiquement les données froides. La startup avait déjà obtenu d’être sur la marketplace d’AWS.

Entretemps, la startup a amélioré la partie locale en concevant son propre protocole NVMe-over-Fabrics qui dispose d’un gestionnaire de mémoire maison. Celui-ci lui permet de communiquer directement avec les unités de stockage d’un serveur, sans passer par le noyau du système d’exploitation et, selon Liran Zvibel, au profit de réduire les temps de latence dont tous les autres systèmes de NVMe-over-Fabrics souffrent. Ce module prend la forme d’un pilote Linux, appelé WekaIO VFS.

« Nous avons pris le parti de paralléliser l’accès aux répertoires et aux métadonnées en divisant les requêtes des serveurs en des lots plus petits. »
Liran ZvibelPDG WekaIO

« Les autres systèmes de partage en NFS fonctionnent de manière à traiter les accès en série. Nous avons pris le parti de paralléliser l’accès aux répertoires et aux métadonnées en divisant les requêtes des serveurs en des lots plus petits. Cela nous permet d’atteindre des vitesses d’accès au NAS qui sont même supérieures à la vitesse du système de fichiers interne au serveur », explique Liran Zvibel.

Depuis la version 3.5, Matrix est par ailleurs capable d’utiliser le stockage en cloud comme un espace de PRA. Il produit des snapshots complets des données qui peuvent être restaurés en ligne pour être utilisés avec des machines virtuelles déployées sur AWS.

Enfin, en juin dernier, WekaIO a ajouté le support des fonctions de contrôle d’accès et de chiffrement des annuaires LDAP. Cet enrichissement a pour but de faire sortir Matrix du giron scientifique pour équiper les entreprises plus traditionnelles.

À terme, WekaIO prévoit d’étendre son stockage en cloud public à Azure et Google GCP. Liran Zvibel indique que l’effort actuel à fournir pour y parvenir n’est plus technique, mais relève uniquement d’accords commerciaux qui n’ont pas encore été trouvés.

Pour approfondir sur SAN et NAS