Scanrail - Fotolia

Elastifile : un système de fichiers distribué optimisé pour la flash

La start-up israelienne Elastifile débutera la commercialisation de son système de fichiers distribué au mois de juin. Elle promet une scalabilité linéaire et une latence de l'ordre de la milliseconde

Elastifile a récemment dévoilé une solution de stockage NAS distribuée 100 % logicielle tirant parti des capacités de performances de la Flash. Elle prévoit de débuter la commercialisation de son Elastifile Cloud File System (ECFS) en juin, quatre ans après le début de son développement.

Basée à Herzliya en Israël, la jeune pousse a levé plus de 50 M$ auprès des fonds d’investissement LightSpeed Venture Partners t Battery Ventures, et d’investisseurs stratégiques tels que Cisco et Western Digital. Parmi ses fondateurs, on trouve notamment Shahar Frank — le cofondateur et « chief scientist » de XtreamIO et ex-architecte en chef d’Exanet (qui a servi de base au Fluid File System de Dell) — et Roni Luxenburg, l’ex-directeur de l’ingénierie de Qumranet (créateur de l’hyperviseur KVM). L’équipe comprend également Avraham Poza Meir, l’ex-CTO d’Anobit (racheté par Apple) et VP ingénierie de SanDisk.

ECFS est un système de gestion de fichiers distribué qui s’installe sur des serveurs x86 banalisés équipés de disques SSD. Le système de fichiers permet d’agréger la capacité disponible sur les nœuds en un pool de stockage sécurisé accessible via un espace de nommage unique

Comme l’explique Andy Fenselau, le vice-président du marketing de la société, le défi pour les systèmes de fichiers distribués a historiquement été de maintenir leur performance une fois déployés sur un grand nombre de nœuds. Selon lui, ECFS peut s’installer sur des milliers de nœuds et sa performance évolue linéairement avec le nombre de serveurs raccordés au cluster tout en maintenant une latence de l’ordre de deux milliseconde, même dans des environnements complexes. Le système de fichier est compatible avec la sémantique POSIX.

Un système de métadonné distribué basé sur un algorithme maison

Pour parvenir à ce résultat, Elastifile a développé un modèle original de gestion des métadonnées s’appuyant sur un algorithme de consensus maison baptisé Bizur. Bizur est utilisé par Elastifile pour assurer le consensus entre les différents nœuds du cluster, en lieu et place des habituels Paxos ou Raft. Selon ses créateurs, il a l’avantage de ne pas être basé sur un mécanisme de log distribué, ce qui permet de maintenir la latence à un niveau très bas même en cas d’augmentation des requêtes ou de défaillance de nœuds.

Elastifile peut être déployé en mode standard (le cluster apparaît comme un NAS distribué accessible via NFS v3). Il est aussi possible de mettre en oeuvre la technologie en mode hyperconvergée. Enfin, un mode hybride mixant nœuds de stockage et nœuds hyperconvergés est aussi possible.

Du fait de sa nature purement logicielle, la technologie d’Elastifile peut être déployée sur des serveurs physiques sous Linux, sous forme de VM au-dessus d’un cluster VMware ou sur des instances Amazon EC2 utilisant le stockage Flash EBS (Elastic Block Store). L’éditeur devrait prochainement ajouter le support des instances Microsoft Azure.

Côté services, Elastifile met en œuvre un mécanisme de déduplication globale, et un mécanisme de compression de données afin d’optimiser l’usage des SSD. Par défaut, chaque donnée écrite est répliquée deux fois sur le cluster afin d’assurer la disponibilité des données. Le système de fichier met aussi en œuvre un mécanisme de gestion de la QoS ainsi qu’un système de tiering baptisé CloudConnect. Ce dernier permet de transférer les données peu utilisées hors du file System distribué pour les stocker sur un service ou un système de stockage objet (compatible S3) afin d’abaisser le coût des données dormantes. De façon intéressante, Cloud Connect ne s’appuie pas sur un format de donnée propriétaire, ce qui fait que les données écrites sur le système objet peuvent être accédées de façon transparente via le protocole S3.

Le logiciel d’Elastifile est vendu par abonnement à partir de deux cents par gigaoctet et par mois. Selon Fenselau, Elastifile devrait offrir deux packages tarifaires, l’un pour les déploiements on-premises, l’autre pour les déploiements combinant on-premises et usage du cloud via CloudConnect. Au coût du logiciel, il faut ajouter celui des serveurs et des SSD.

Elastifile est un concurrent possible pour des acteurs émergents comme Hedvig, Qumulo ou Weka.io, mais aussi pour des sociétés comme NetApp ou Dell EMC Isilon.

 

Pour approfondir sur Disques durs, SSD et Unités de stockage