Patrick Daxenbichler - Fotolia
Cohesity fait basculer les sauvegardes dans l’ère de l’IA générative
L’éditeur dote sa solution d’un nouveau chatbot d’assistance qui évite aux clients de lancer une procédure de ticketing en cas de problème. Il espère sur cette base construire d’autres applications d’IA.
Cohesity, l’éditeur de solutions de sauvegarde en SaaS, enrichit sa console en ligne d’un assistant virtuel, basé sur son moteur d’intelligence artificielle Turing AI. Son but est de dépanner les clients de la solution sans qu’ils aient besoin de faire appel à un support supplémentaire.
Le nouveau support virtuel de Cohesity, désormais disponible gratuitement pour tous les clients, permet d’accéder à un chatbot qui interprète les questions des administrateurs des sauvegardes, diagnostique tout seul les problèmes et résume les articles techniques qui permettent de les résoudre.
Le chatbot évite par ailleurs aux clients d’avoir à remplir un ticket de support. Les questions posées par les administrateurs sont automatiquement classées dans une file d’attente de ticketing, pour une mise en relation avec un agent de support humain dans les plus brefs délais.
Uma Challa, analyste chez Gartner, applaudit l’effort de Cohesity. « Même dans Microsoft Office, vous disposez à présent d’assistants virtuels basés sur une intelligence artificielle. Le fait que les agents d’IA éliminent la recherche de panne et résument les procédures techniques permet aux collaborateurs de reprendre plus rapidement le cours normal de leur travail. Se servir des chatbots pour augmenter la productivité est une tendance très importante », dit-il.
Il pondère toutefois par une remarque : « au fil du temps, ces assistants d’IA ne feront qu’augmenter leur disponibilité et leur facilité d’utilisation. Mais s’assurer que les données sont exemptes d’erreurs pour éviter les hallucinations ou les informations erronées restera longtemps un défi. »
L’enjeu de bâtir des applications d’IA à partir des sauvegardes
Au-delà de l’intérêt pratique de cet assistant, Cohesity veut montrer à ses clients qu’il dispose d’une technologie pour entraîner des moteurs de Machine learning à partir des sauvegardes. Technologie qui correspond en l’occurrence à la présence de fonctions de formatage des données et de connexions logicielles vers les moteurs d’IA les plus courants.
« Notre objectif premier est d’aider nos clients à réduire le temps de résolution des problèmes. Mais il ne s’agit pas d’une simple fonctionnalité. Notre volonté est de pouvoir bâtir de véritables applications analytiques à partir de notre socle Turing AI », commente Greg Statton, le directeur technique de Cohesity.
En ce sens, l’éditeur a annoncé plus tôt cette année des partenariats d’IA générative avec Microsoft Azure et Google GCP, les hyperscalers qui hébergent sa solution. L’enjeu est de doter sa plateforme SaaS Cohesity Data Cloud de capacités d’IA supplémentaires à l’aide de connexions API et d’outils disponibles chez ces hyperscalers.
Reste à savoir si les sauvegardes constituent de bons candidats pour un tel travail. Plusieurs experts en stockage et en IA en doutent.
« Les données utilisées pour former les modèles d’IA ont tendance à nécessiter un filtrage et une catégorisation, généralement effectués dans un lac de données, c’est-à-dire sur des données à plat, et non des données empaquetées dans des sauvegardes, qui plus est dans le format de sauvegarde d’un fournisseur en particulier. Des métadonnées et d’autres métriques devront être appliquées aux sauvegardes, ce qui ralentira le débit de l’entraînement », estime ainsi Randy Kerns, analyste pour le cabinet de conseil Futurum Group.
Les sauvegardes, une source trop complexe pour le Machine learning ?
Greg Statton répond que la plateforme Cohesity Data Cloud stocke et fournit déjà une vue d’ensemble des données clients et prend en charge les besoins standards des moteurs d’entraînement. Il cite le marquage des métadonnées, le contrôle de l’accès par rôle pour limiter les interférences des utilisateurs et la recherche de données cloisonnées.
« Ce qui compte, ce sont les données », dit-il. « Nous proposons une solution pour que les données dont dispose une entreprise puissent être utilisées en toute sécurité dans des modèles d’IA. Ces modèles vont devenir des produits de consommation courante. Il est urgent que les entreprises aient les leurs. »
« Oui, mais la mise en place de contrôles appropriés pour des entrepôts de données comme Dremio ou Databricks pourrait complexifier le travail des ingénieurs de données », rétorque Randy Kerns.
Selon lui, les ingénieurs de l’analytique auraient besoin de données qui sont activement utilisées, parce que cela rendrait les modèles d’IA plus faciles à entraîner et plus réactifs lorsqu’ils sont utilisés par les clients. Il faudrait aussi que la source de données garantisse une attribution, une validation et un crédit corrects. Ainsi, les données de sauvegarde, qui datent potentiellement de plusieurs années, n’offrent pas nécessairement un tel niveau d’information.
« S’il est question de données de sauvegarde, il ne s’agit pas de la source de données d’origine. Or, si vous introduisez un grand nombre de sources différentes qui ont des schémas et des variables différents, cela rend la tâche beaucoup plus difficile pour les ingénieurs de données », estime Randy Kerns.