Maxim_Kazmin - Fotolia
Versity veut s'imposer sur le marché de l'archivage
La jeune start-up a développé une solution d'archivage dérivée de SAM-QFS d'Oracle. Elle a déjà séduit une vingtaine de grands comptes et noué un partenariat avec Cray pour concurrencer les géants historiques du secteur.
Le marché des systèmes d’archivage est historiquement dominé par quelques grands acteurs historiques de l’IT dont IBM (avec TSM et sa solution de gestion du stockage hiérarchique HPSS), Oracle (avec l’offre SAM-QFS / ORACLE HSM, héritée de Sun Microsystems et de LSC), SGI (avec sa solution de gestion du stockage hiérarchique DMF) et Quantum (avec StoreNext). Bruce Gilpin et Harriett Coverston, les deux cofondateurs de Versity entendent y mettre un terme.
Harriett Coverston, est plus connue pour avoir cofondé LSC (large Storage Configurations) une société acquise par Sun, qui a développé le système de fichiers QFS (Quick File System), qui couplé au système d’archivage SAM (Storage and Archive Manager) de Sun est devenu SAM-QFS, l’un des systèmes de HSM et d’archivage les plus utilisés au monde. Le code de SAM QFS a été mis à l’open source par Sun sous licence CDDL en 2008 dans le cadre du projet Open Solaris, avant qu’Oracle ne reprenne la main en 2010 et ne ferme le projet.
Une solution d'archivage dérivée du code open source de SAM-QFS
En s’appuyant sur le code de SAM-QFS, Versity a développé en 2014 son propre système d’archivage baptisé VSM, dont le cœur est lui aussi open-source. Versity a en quelque sorte capitalisé sur l’historique de SAM-QFS et a choisi de le faire évoluer pour proposer une solution d’archivage moderne à même de rivaliser avec celles proposées par les géants du secteur.
Comme l’explique Gilpin, le pari a payé puisque la firme a signé avec ses premiers grands clients en 2014 et est rentable depuis cette date. Cette rentabilité a permis à Versity de ne pas avoir à faire appel à des fonds d’investissement, ce qui selon Gilpin permet à la firme de contrôler sa destinée et de privilégier le service rendu à ses clients. Selon lui, le problème des solutions du marché est que les grands acteurs se sont endormis et considèrent leurs clients comme des vaches à lait : « le service rendu à leurs clients est catastrophique ».
Pour Gilpin, la force de Versity est que sa technologie est purement logicielle et déployable sur des serveurs banalisés. Elle s’appuie d’une part sur un système de fichiers distribué POSIX supportant plusieurs milliers de nœuds et conçu pour répondre aux besoins spécifiques de performances de l’archivage et d’autre part sur un gestionnaire d’archivage. Ce dernier gère l’archivage automatique des données en fonction des règles définies par l’administrateur ou par le gestionnaire de l’application et supporte le tiering des données sur le support le plus adapté, en fonction des critères de performances et de coûts spécifiés. La solution est conçue pour gérer des archives comprenant quelques Pétaoctets à plusieurs dizaines voir centaines de Pétaoctets. Versity propose un modèle de licence original pour le secteur puisqu’il n’y a pas de licence perpétuelle mais une redevance similaire à celle proposée par les acteurs de l’open source. Versity s’appuie sur un format de données open source et garantit à ses utilisateurs qu’ils pourront relire en toutes circonstances les données archivées via sa plate-forme.
Ce modèle a intéressé Cray, le champion des systèmes HPC, qui a non seulement noué un accord commercial avec Versity mais a également investi dans la jeune société. La relation avec Cray est intéressante, explique Gilpin, car elle ouvre à Versity l’accès au marché fédéral américain et aux principaux clients HPC dans le monde, des clients qui sont de gros consommateurs de solutions d’archivage à hautes performances.
Versity va publier le code de son système de fichiers distribué optimisé pour l'archivage
Versity n’entend pas s’arrêter en si bon chemin. Face à l’explosion des besoins d’archivage, la firme est convaincue que le stockage objet, trop lent, n’est pas la réponse et qu’il faut développer un nouveau système de fichiers POSIX adapté à l’archivage. Dans les mois à venir, l’éditeur devrait publier sous licence GPL, le code source d’un nouveau système de fichiers POSIX optimisé pour les besoins de l’archivage et à même de gérer un billion de fichiers avec jusqu’à un milliard de fichiers par répertoire. Ce système sera totalement distribué et n’aura pas de serveur de métadonnées centralisé. Il s’appuiera sur un mécanisme de verrous optimiste afin d’offrir des performances très élevées. L’idée est que si le système de fichier détecte un comportement d’archivage, il ne verrouillera pas par défaut les fichiers en cours d’écriture (dopant ainsi les performances). Si en revanche, un comportement transactionnel est détecté, un mécanisme de verrouillage plus traditionnel sera mis en œuvre (au détriment toutefois des performances). Le principe rappelle d’une certaine façon, celui mis en œuvre par les mécanismes de gestion transactionnelle de la mémoire incorporés dans les dernières puces Xeon afin d’optimiser les mécanismes de verrouillage de page mémoire des processeurs. Le nouveau système de fichiers devrait être présenté dans la seconde moitié de l’année 2016.
Un support de S3 pour l'archivage de données dans le cloud
En attendant ce nouveau système de fichiers, Versity a récemment ajouté à son produit une interface S3 permettant à ses clients de verser des données dans le cloud public d’Amazon AWS ou sur tout type de stockage objet « on premises » compatible avec le protocole S3. L’ajout du support de S3 correspond de facto à la gestion d’une classe de stockage supplémentaire pour le système d’archivage de Versity.
Versity compte déjà une vingtaine de grands clients dont une poignée en Europe et une grande banque en France. Son plus grand client à ce jour est l’Université des sciences et technologies du roi Abdullah (King Abdullah University of Science and Technology) en Arabie Saoudite, dans le cadre d’un contrat massif signé avec Cray et incluant 18 Po de stockage primaire et le système d’archivage Cray TAS (Tiered Adaptative Storage) motorisé par la solution de Versity.