Woody - Fotolia
Rozo Systems dévoile la version 2.0 de sa technologie NAS distribuée
A l'occasion du lancement de la version 2.0 de son OS de stockage NAS distribué à San Francisco, le français Rozo Systems est revenu sur les avantages uniques de sa technologie.
Rozo Systems, une start-up française, née à l’origine dans la région nantaise sous le nom de Fizians, a levé le voile la semaine dernière à San Francisco sur la version 2.0 de RozoFS, sa solution logicielle de stockage NAS distribuée et sur sa stratégie de développement à l’international. La firme, qui a récemment levé 700 000 € auprès d'investisseurs français, a ouvert des bureaux à San Mateo, dans la Silicon Valley, et entend lever de nouveaux fonds pour accélérer le développement et la promotion de sa technologie qui repose sur une innovation créée au sein d'un des laboratoires de Centrale Nantes.
RozoFS, une solution NAS distribuée à hautes performances
Comme l’explique Pierre Evenou, son fondateur et CEO, le logiciel de la firme s’installe sur des serveurs x86 traditionnels équipés d’un grand nombre de disques (et/ou SSD) et permet de constituer un système de stockage NAS distribué en cluster (à la Isilon). Par rapport à ses concurrents, RozoFS combine les avantages d’une solution NAS à hautes performances avec ceux d’une solution de stockage massivement distribuée. Deux caractéristiques généralement antinomiques dans les systèmes de stockage et qui en font une solution adaptée aux applications de calcul à hautes performances, au stockage de données audiovisuelles et aux applications de stockage d’entreprise nécessitant performance et faible coût de stockage.
Un algorithme d’Erasure Coding unique : la Mojette
La technologie au cœur de la solution de Rozo Systems, est un algorithme de code à effacement (erasure coding) basé sur la transformée de Mojette (du nom d’un haricot blanc lingot populaire en Vendée et dans l’Ouest de la France).
Développée à l’origine au sein du laboratoire CNRS IRCCyN de l’École Centrale de Nantes, cette transformation mathématique est une application discrète exacte de la transformée de Radon. Appliquée aux systèmes de stockage, elle offre plusieurs atouts majeurs selon Rozo Systems. Le premier est celui de garantir une très haute intégrité des données sans impact majeur sur la capacité utilisée. Ainsi, d’après Pierre Evenou, on peut stocker cinq copies de la même information sur un cluster en ne consommant qu’une fois et demie la capacité de l’information originale.
L’autre bénéfice de la Mojette est sa performance. Les algorithmes de code à effacement du marché s’appuient sur des variantes de codes Reed Solomon qui nécessitent des opérations d’inversion de matrices gourmandes en cycles CPU. La Mojette ne nécessite pas d’opérations complexes de multiplication et de division, mais de simples additions et soustractions et est donc deux à trois fois moins gourmande en CPU que le code d’Erasure Coding le plus optimisé du marché, l’ISA-L d’Intel. Selon Rozo Systems sa technologie d’erasure coding affiche des performances environ 3 fois meilleures que celles d’Intel et jusqu’à 10 fois meilleures que celle d’un système de stockage objet comme Scality.
Et ses bénéfices ne s’arrêtent pas à la protection des données. L’algorithme est aussi utilisé pour distribuer massivement les données sur les disques du cluster (on obtient ainsi une architecture de type RAIN à hautes performances débarrassée des inconvénients inhérents aux calculs de type XOR pour le RAID traditionnel).
Rozo Systems met en avant ses performances face à Isilon et NetApp
Michel Courtoy, le COO de la firme, explique que les caractéristiques uniques de l’algorithme d’erasure coding de RozoFS sont la clé de ses performances face à ses concurrents tels qu’Isilon ou NetApp : « Dans le monde dans lequel nous évoluons, un système comme Isilon n’est pas rapide. On voit certains clients qui ont un problème majeur de performances avec Isilon, notamment s’ils doivent traiter de grandes quantités de petits fichiers. (…) Parmi nos clients et prospects on trouve des clients d’Isilon qui veulent bien plus de performances et des clients NetApp qui veulent bien plus de ‘scalabilité’. Ce n’est pas un secret qu’Isilon et NetApp sont les principaux fournisseurs de ce marché, mais leurs systèmes ont de vraies limitations ».
Par rapport à des systèmes distribués plus « techniques » comme Spectrum Scale d’IBM (ex-GPFS), Rozo Systems estime également être meilleur en gestion de métadonnées et tout aussi rapide en terme d’IOPS, tout en fournissant un niveau supérieur de protection de données. Rozo Systems revendique aussi des performances IOPS supérieures à celles d’un file system en cluster comme BeeGFS. Sans prétendre supplanter Lustre dans les très grands centres de calcul, Rozo Systems estime également avoir toutes les caractéristiques pour fournir le stockage des clusters de management de ces centres.
Côté scalabilité, RozoFS supporte jusqu’à 1023 systèmes de fichiers (avec 255 volumes et 2 puissance 59 fichiers par file system). La taille maximale d’un file system est de 16 exaoctets, une taille jugée largement suffisante par Pierre Evenou qui indique que les clients préfèrent souvent gérer des systèmes de fichiers de taille plus raisonnable.
Les performances de RozoFS sont impressionnantes : chaque nœud RozoFS peut délivrer 3,5 Go/s de bande passante soutenue (contre 1,2 Go/s pour un nœud Isilon X410) et un cluster de 4 nœuds (ce qui est loin d’être la limite de déploiement de RozoFS) délivre plus de 10 Go/s de bande passante agrégée. La firme a d’ailleurs noué un partenariat avec Mellanox dont les commutateurs 56 Gbit/s sont idéalement adaptés à de telles performances.
Une version 2.0 enrichie et une roadmap pour les versions futures
Lors de notre rencontre à San Francisco, la firme a levé le voile sur la version 2.0 de son logiciel, qui apporte des performances encore optimisées ainsi que plusieurs fonctions attendues comme la géoréplicaiton.
L’algorithme d’erasure coding a notamment été optimisé en 128 bit pour tirer parti des unités de calcul AVX 128bit des processeurs modernes. Rozo Systems a aussi implémenté des mécanismes de quota utilisateurs et groupes et ajouté des fonctions de contrôle d’intégrité des données. Enfin, Rozo Systems a ajouté à RozoFS des fonctions de géoréplication.
La version 2.1 attendue au premier semestre 2016 apportera aussi des fonctions d’indexation rapide des fichiers stockés sur le cluster, des fonctions d’effacement rapide de fichiers ainsi qu’un mécanisme de gestion de versions (versioning) permettant de revenir très rapidement à une version antérieure d’un fichier ou d’un répertoire. Cette dernière fonction est considérée comme essentielle par la firme dans l’attente de l’inclusion de fonctions de snapshots.
Pour la version 2.2, attendue en principe fin 2016, Rozo Systems entend apporter le support des snapshots (par répertoire) et la gestion de la qualité de service.
RozoFS est disponible dans un modèle « Freemium ». Une version communautaire gratuite et non optimisée est téléchargeable sur GitHub sous licence GPL v2. La firme commercialise aussi,en direct et via ses partenaires, une version optimisée, dont les performances sont plus de deux fois supérieures à cette mouture.