Stockage : Komprise sait à présent étiqueter les contenus
Avant, la solution de la startup ne servait qu’à identifier les vieux fichiers pour mieux les ranger. Désormais, elle décrypte leurs contenus et confie automatiquement leur traitement à des applications tierces.
Komprise passe d’une simple solution d’inventaire des fichiers à une véritable tour de contrôle de la gouvernance des données. Le tableau de bord de sa solution SaaS servait jusqu’ici à identifier quels fichiers mériteraient d’être stockés en cloud et quels autres devraient rester sur site. Il se pare désormais d’un système d’étiquetage, d’un moteur de recherche et d’un dispositif capable d’exécuter des processus automatiques selon les étiquettes ou les résultats des recherches.
« Notre promesse était auparavant de vous faire économiser jusqu’à 60 % sur vos coûts de stockage. À présent, nous vous proposons de gagner de l’argent avec vos données », lance Krishna Subramanian, la cofondatrice de Komprise. « Grâce à notre système, vous pouvez extraire automatiquement les données qui répondent à un domaine d’activité en particulier et les injecter par exemple dans un moteur d’analytique, lequel vous dira comment en tirer parti, vous servira à produire des audits ou encore vous permettra de mieux vous organiser. »
Krishna SubramanianCofondatrice de Komprise.
La solution de Komprise, désormais appelée Global File Index, indexe les contenus de tous les NAS et tous les stockages objet, quelle que soit leur marque, ainsi que de tous les services de stockage en ligne auxquels une entreprise a souscrit. Cet index est ensuite interrogé par un moteur de recherche qui repose sur le logiciel Open source Elasticsearch. Fourmillant d’API, celui-ci peut insérer le résultat de ses recherches dans des scripts Python qui pilotent des logiciels tiers, lesquels peuvent à leur tour produire des fichiers.
« Par exemple, vous pouvez récupérer certaines images et, selon leur nature, demander à un logiciel de traitement graphique qu’il les manipule d’une certaine manière. Les fichiers qui en résulteront seront également indexés dans notre solution », poursuit Krishna Subramanian.
Elle cite des clients qui auraient déjà utilisé les nouvelles fonctions de Komprise. Les laboratoires Pfizer, qui avaient initialement acheté la solution de Komprise pour réduire de 75 % le coût de leurs baies de disque, auraient utilisé le nouveau moteur de recherche pour accélérer leurs analyses. Une police européenne se servirait du moteur de recherche pour réinjecter en production les éléments d’une enquête après qu’ils ont été collectés dans une base d’archives.
Étiqueter les contenus pour faire des recherches métier
Sur le plan technique, Elastic Data Migration, le module d’origine qui sert à migrer les fichiers entre NAS et services cloud selon leur utilité, n’est pas étendu par Global File Index : il repose à présent dessus. Auparavant, le moteur de recherche d’Elastic Data Migration ne s’appuyait que sur la liste des paramètres indiqués par les systèmes de fichier présents dans une entreprise. Désormais, ces renseignements sont complétés par des étiquettes qui ont plus de sens pour les métiers.
Tout l’intérêt de Global File Index est de savoir s’interfacer avec des services qui génèrent ces étiquettes. Komprise donne l’exemple du service Comprehend d’AWS, un moteur d’analyse capable de comprendre le sens d’un contenu textuel ou audio et d’en tirer des mots clés.
Il devient ainsi trivial de passer d’un stockage dit « non structuré » avec des millions ou des milliards de fichiers éparpillés sur des quantités astronomiques de baies de disques, sans que l’on sache vraiment à quoi ils correspondent, à une base parfaitement documentée. Il suffit d’indiquer l’adresse de chaque ressource de stockage dans Global File Index et de lancer un script Python de moins de dix lignes qui interroge AWS Comprehend.
Avant l’opération, le moteur de recherche ne servait qu’à lister des fichiers dont le nom, la date, l’emplacement, le type ou l’utilisateur correspond à la recherche. Après l’opération, ce moteur permet d’extraire tous les fichiers qui correspondent à un thème, à une activité, à un client. Et, ce, de manière transversale, y compris quand une partie d’un contrat est traitée au siège et une autre dans une filiale à l’étranger. Selon Krishna Subramanian, il n’aura jamais été aussi simple de faire un audit.
Parmi les vertus de cette analyse, Komprise avance qu’elle permet de faire un ménage plus efficace. La solution de la startup savait auparavant lister les fichiers qui n’étaient plus ouverts depuis des lustres et n’avaient donc aucune raison de résider sur du stockage qui coûte cher. Désormais, elle sait aussi lister les e-mails qui n’ont plus aucun intérêt. Mieux : elle sait les effacer directement avec un script Python.
C’est d’ailleurs l’autre intérêt de cette nouvelle version. Auparavant, il s’agissait essentiellement d’une console graphique que les administrateurs du stockage devaient manipuler à chaque action. Désormais, il n’est même plus nécessaire de passer par l’interface d’Elastic Data Migration : l’entreprise peut mettre en place des scripts Python qui s’exécutent tous seuls à intervalles réguliers, où lorsque certaines conditions sont réunies (par exemple un quota de nouveaux fichiers créés).
En croissance en Europe, chez les fournisseurs de stockage
Selon Ben Conneely, le directeur des ventes pour la région EMEA de Komprise, la solution connaît une croissance commerciale tout à fait honorable. Les souscriptions auraient augmenté sur sa zone de 115 % en un an. IBM, Pure Storage, HPE, AWS et (c’est tout nouveau) Azure se bousculeraient pour revendre la solution qu’ils présentent comme une option de migration et de gouvernance au-dessus de leurs solutions de stockage. Concernant HPE, Komprise est présenté avec les solutions Cloudian, Scality et Qumulo qu’il revend.
« Mises à part nos nouvelles fonctions, nos partenaires apprécient que notre solution soit techniquement à côté des données et pas devant. Contrairement à d’autres startup du stockage, nous ne sommes pas là pour mettre une porte d’accès devant vos données : vos applications continuent d’utiliser leurs fichiers depuis leurs NAS d’origine. Il n’y a aucun risque de ralentissement à utiliser la solution de Komprise », dit Kumar Goswami, le PDG de Komprise.
Interrogé par LeMagIT pour savoir à qui il pensait exactement, Ben Conneely cite Hammerspace, dont la solution englobe aussi tous les NAS dans un seul système de fichiers transversal, afin d’accéder plus directement aux données situées dans d’autres succursales, mais qui aurait le défaut d’englober aussi dans la latence de son fonctionnement les NAS se trouvant juste à côté.