Primary Data lève 40 M$ de plus et dévoile la version 2.0 de DataSphere
La firme fondée par d'ex- responsables de Fusion-IO continue d'enrichir sa plate-forme de virtualisation de données avec des fonctions avancées de migration et de mouvement de données. Elle renforce ses capacités analytiques et supporte désormais le stockage en cloud.
Primary Data, un éditeur de logiciels de gestion du stockage vient de dévoiler la version 2.0 de sa plate-forme de virtualisation et d’administration du stockage, DataSphere 2.0. La firme a également annoncé une levée de fonds additionnelle de 40 M$ (20 M$ en capital et 20 M$ en ligne de crédit) pour accélérer son développement, ce qui porte à près de 100 M$ les fonds levés à ce jour. La société a été fondée en 2013 par d’anciens dirigeants de Fusion-IO. Son CEO est Lance Smith, l’ex-COO de Fusion-IO, son CTO est David Flynn, l’ex CEO de Fusion-IO, tandis que le Chief Scientist n’est autre que Steve Wozniak, cofondateur d’Apple et exChief Scientist de Fusion-IO.
À l’origine conçue comme une plate-forme de virtualisation du stockage en mode « out-of band » — la plate-forme sépare la gestion des métadonnées de l’accès même aux données et n’est donc pas dans le chemin de données — DataSphere a évolué en profondeur pour s’enrichir de fonctions avancées d’analyse et de mouvement automatisé de données.
L’objectif de Primary Data est à la fois de simplifier la gestion du stockage dans les entreprises, mais aussi de fournir des mécanismes sophistiqués de mouvement de données. Au passage, la firme a également ajouté le support de certains services de stockage en cloud ainsi que des services de déplacement automatisés de données vers le cloud.
De la virtualisation à la gestion de données
La version 1.0 de DataSphere se présentait avant tout comme une plate-forme holistique de virtualisation de données, mais la version 2.0 entend mettre l’accent sur les services avancés rendus possibles par cette virtualisation des données.
L’objectif est que chaque donnée, qu’elle soit stockée sur un serveur local sur une baie NAS ou sur un stockage objet puisse être virtualisée par la plate-forme (le stockage SAN est aussi supporté depuis les serveurs ESX). À cette fin, DataSphere met en œuvre sur une couche distribuée de gestion des métadonnées séparée des données qui agit comme un plan de contrôle séparé du stockage même des données. Cela permet à la firme de mettre en œuvre ses services de données sans affecter l’accès même aux données (il est par exemple possible de déplacer des données de façon transparente sans interruption de service).
Du côté des serveurs, aucun client spécifique n’est requis sous Linux. Le noyau des distributions récentes intègre déjà le support du protocole NFS 4.2 utilisé par DataSphere — Primary Data est le principal contributeur de code à NFS depuis 2013 —, ainsi que les fonctions de télémétrie nécessaire aux fonctions avancées de mouvement de données. Primary Data propose aussi des clients spécifiques pour Windows, Mac OS, Unix, ESXi et les distributions BSD.
Les protocoles d’accès client supportés par la plate-forme sont NFS 3.x et 4.2, ainsi que SMB 2.1 et 3.x. Côté stockage, les données peuvent résider sur tout type de baie NAS NFS, sur du stockage local, sur des stockages objet compatibles S3 et, dans le cas particulier de VMware vSphere ESXi, sur des baies SAN.
Des fonctions sophistiquées de tiering et de mouvement de données
Une fois la plate-forme installée, la première chose à faire est « d’assimiler » le stockage existant. Dans la version 2.0 de DataSphere, l’assimilation d’un stockage NFS existant se fait sans interruption de service et ne prend que quelques minutes. L’assimilation d’autres types de stockage requiert une interruption courte de service. Une fois les données et les ressources de stockage sous le contrôle de DataSphere, ces ressources sont gérées comme un global namespace sur lequel les données peuvent être déplacées de façon transparente. Chaque opération d’entrées/sorties est supervisée et la plate-forme collecte des informations de télémétrie toutes les 15 secondes.
L’ensemble des métadonnées et des informations collectées par le moteur analytique intégré permet à la plate-forme d’appliquer automatiquement les politiques de placement de données définies par l’administrateur. Datasphere DSX (DataSphere Extended Services) permet par exemple de déplacer des données en fonction de contraintes de performance ou de coût. Il est aussi possible de créer des règles de migration de données en fonction de l’âge des données, de leur fréquence d’accès, de leur taille, de leur nom, etc.. Des données inactives pourront ainsi être déplacées vers un plus lent ou vers un stockage S3, puis rapatriées vers un stockage plus performant si elles redeviennent actives.
Selon la société, DataSphere 2.0 peut gérer des milliards d’objets et de fichiers et permet aussi d’avoir une visibilité sans égal sur la performance et la santé de son stockage. La version 2.0 ajoute aussi de nouvelles fonctions comme l’assimilation des snapshots des baies ce qui permet par exemple de les sauvegarder dans le cloud à des fins de reprise après sinistre. Primary Data a aussi ajouté le support d’Active Directory et des ACL Windows. Ces fonctions s’ajoutent à d’autres capacités existantes comme le support natif des Vvols par DataSphere (même si le stockage sous-jacent ne le supporte pas). Il est à noter que le nouvel accent mis sur la gestion des données fait de la firme un concurrent potentiel d'acteurs spécialisés dans la gestion et les mouvements de données tels qu'Aptare, Komprise ou StrongBox.