imageteam - Fotolia
Data Dynamics, cet inconnu qui peut sauver les migrations de données
Dans le cadre d’un tour dans la Silicon Valley en quête des prochaines pépites de l’IT, LeMagIT a rencontré cette jeune entreprise qui réédite un logiciel de stockage lancé il y a 17 ans.
On pourrait le comparer aux solutions de Varonis. StorageX, le logiciel édité par Data Dynamics, répertorie, identifie, classe tous les contenus éparpillés sur le réseau d’une entreprise. Sauf qu’il ne s’agit pas simplement ici de découvrir ce qui entre dans le cadre du RGPD ou quels fichiers sont orphelins. StorageX sert, en amont d’une migration, à déterminer quelles données doivent aller sur quel type de stockage.
« Sans StorageX, les entreprises restent bloquées avec leurs vieux NAS car elles ne savent pas si toutes leurs données pourraient aller en cloud sans violer des réglementations, ni si elles supporteraient des baies de stockage avec une qualité de service différente », explique Piyush Mehta, le CEO de Data Dynamics.
« Et cela se traduit par de véritables pertes financières pour les professionnels tenus de remplacer leur stockage en fin de vie ou, pire, pour ceux chez qui les silos de données se multiplient après le rachat d’un concurrent. »
Il cite l’exemple d’un client qui a récemment utilisé sa solution. « Stocker 4 Po de données sur ses NAS historiques lui coûtait 1,2 millions de dollars par mois. En faisant analyser ses données par StorageX, il a pu déplacer 10 % de celles-ci sur un NAS plus moderne et 15 % en cloud, ce qui lui a permis d’atteindre une facture mensuelle de 960.000 dollars, soit une économie annuelle de 2,9 millions de dollars. »
Analyser sur site, migrer, archiver en cloud, puis donner un accès global
StorageX se compose de quatre modules. Le premier, dit d’Analyse, s’interface avec des collecteurs UDE (Universal Data Engine) à installer sur le réseau pour générer des métadonnées à propos de tout ce qui se trouve dans les systèmes de fichiers. Ces informations sont emmagasinées dans la base de données du module d’analyse qui présente des rapports, voire s’interface avec des logiciels comme Elasticsearch pour mieux présenter les découvertes. L’interface du module permet déjà de déplacer manuellement les fichiers vers de nouveaux espaces de stockage.
Un module dit de Migration et un autre appelé Archive, automatisent quant à eux le déplacement des données selon des règles que l’utilisateur peut définir.
Le dernier, enfin, est le module Distributed File System. A la manière d’un SDS, il consiste à créer un NAS virtuel qui permet d’accéder à tous les fichiers depuis un espace de nom unique (« namespace »), alors que ceux-ci peuvent se trouver sur différents types de stockage, sur site ou en ligne.
« Nous nous voyons comme le pont entre les datacenters des entreprises et les espaces en cloud auxquels elles pourraient souscrire. Nous sommes des artisans du cloud hybride », lance Piyush Mehta.
Les trois premiers modules sont facturés annuellement au To traité. Le dernier est simplement facturé par compte-client.
Des prochaines versions de plus en plus autonomes
Initialement développé en 2002 par un éditeur qui s’appelait alors NuView, StorageX a été racheté par Brocade Communications en 2006, lequel n’en a d’abord pas fait grand-chose, puis l’a tout simplement abandonné en 2010. Il faudra attendre 2013 pour que des anciens de NuView fondent Data Dynamics et rachètent la propriété intellectuelle du produit.
Quasiment inconnu en Europe, sauf - paraît-il - auprès de deux grandes banques françaises, StorageX a depuis connu un succès d’estime aux USA, notamment par l’intermédiaire de NetApp qui en a revendu des licences en marque blanche. A date, le logiciel aurait permis d’optimiser le stockage de 160 Po de données et fait économiser à ses clients un total de 80 millions de dollars.
Désormais, StorageX connaît une mise à jour tous les six mois. La prochaine version à paraître d’ici à décembre, la 8.2, devrait signer le passage du logiciel au format container – ses modules sont jusqu’ici livrés sous la forme de machines virtuelles – afin d’occuper moins de place. En 2020, un moteur de Machine learning fera son apparition pour déterminer automatiquement le meilleur type de règles à attribuer à chaque document. Cette fonction pourrait, dans un second temps, servir à ouvrir les documents et à les modifier, typiquement pour effacer les données à caractère privé sans intervention humaine.
« Notre activité est devenue essentielle car les données durent désormais bien plus longtemps que le support physique qui les héberge », conclut Piyush Mehta.