Gunnar Assmy - stock.adobe.com
Les acteurs français du stockage : l’essentiel sur Rozo Systems
Il n’y a pas que les fournisseurs américains dans la vie. LeMagIT vous propose un tour d’horizon des solutions des six principaux acteurs français du stockage de données. Aujourd’hui nous poursuivons notre série par l’offre de Rozo Systems.
Rozo Systems est une start-up française, née à l’origine dans la région nantaise sous le nom de Fizians. Elle propose une solution de stockage NAS distribuée à haute performance 100 % logicielle, qui a déjà séduit plusieurs grands utilisateurs dans le monde du calcul à hautes performances et des médias. RozoFS est ainsi utilisé par le CEO, l’institut Mario Negri à Milan ou par UMedia, l’une des grandes sociétés de production cinématographique européenne. La technologie est aussi mise en œuvre par plusieurs acteurs des effets spéciaux comme FuseFX ou Muse VFX, deux sociétés qui ont travaillé sur les séries les plus récentes produites par Hollywood.
La technologie de Rozo Systems, actuellement en version 3.x, permet de constituer un système de stockage NAS massivement distribué (à la Isilon) pouvant agréger jusqu’à un maximum de 1024 nœuds de stockage. Ces nœuds peuvent être « hyperconvergés » et délivrer à la fois des services de stockage et de calcul, ou être dédiés au stockage, auquel cas ils délivrent des services NAS NFS et SMB à hautes performances, mais à un coût raisonnable.
Un algorithme d’erasure coding unique : la Mojette
La technologie différenciante de RozoFS est un algorithme de code à effacement (erasure coding) basé sur la transformée Mojette (du nom d’un haricot blanc lingot populaire en Vendée et dans l’Ouest de la France).
Conçue à l’origine au sein du laboratoire CNRS IRCCyN de l’École Centrale de Nantes, cette transformation mathématique est une application discrète exacte de la transformée de Radon. Appliquée aux systèmes de stockage, elle offre plusieurs atouts majeurs selon Rozo Systems. Le premier est celui de garantir une très haute intégrité des données sans impact majeur sur la capacité utilisée. Ainsi, d’après Pierre Evenou, on peut stocker cinq copies de la même information sur un cluster en ne consommant qu’une fois et demie la capacité de l’information originale.
L’autre bénéfice de la Mojette est sa performance. Les algorithmes de code à effacement du marché s’appuient sur des variantes de codes Reed Solomon qui nécessitent des opérations d’inversion de matrices gourmandes en cycles CPU. La Mojette ne nécessite pas d’opérations complexes de multiplication et de division, mais de simples additions et soustractions et est donc deux à trois fois moins gourmande en CPU que l’un des codes d’erasure coding les plus optimisés du marché, l’ISA-L d’Intel. Selon Rozo Systems sa technologie d’erasure coding affiche des performances environ 3 fois meilleures que celles d’Intel et jusqu’à 10 fois meilleures que celle d’un système de stockage objet comme Scality.
Selon la firme, la version 3 de RozoFS, lancée à l’automne 2017, apporte des performances en hausse de 60 % par rapport aux versions antérieures grâce notamment à des améliorations dans les communications réseau entre nœuds (support de RDMA over Ethernet) et à une optimisation du protocole SMB. Rozo Systems a aussi accéléré les recherches de fichiers dans de grands systèmes de fichiers grâce à la mise à disposition d’une API spécifique.
Séparément, Rozo a noué des partenariats avec Dell EMC, HPE, Lenovo et QCT pour supporter sa technologie sur les serveurs de ces constructeurs.
RozoFS est disponible dans une version communautaire gratuite téléchargeable sur GitHub sous licence GPL v2. L’alorithme d’erasure coding de cette mouture n’est toutefois pas optimisé, ce qui impacte les performances. La version commerciale, proposée par Rozo Systems et ses partenaires intègre quant à elle une version optimisée de l’algorithme et est pleinement supportée par l’éditeur.