idspopd - Fotolia
Gérer les données non structurées, l’étape cruciale d’une stratégie IA
Les données non structurées représentent une grosse portion des informations stockées par la plupart des entreprises. Avec l’émergence de systèmes d’intelligence artificielle, il n’a jamais été aussi crucial d’ordonner les data lakes et les data warehouses.
Pour l’opérateur télécom américain CenturyLink, les sondages auprès des consommateurs jouent un rôle important dans la compréhension de l’expérience client. Mais, par le passé, sans la capacité à analyser les données non structurées en provenance de ces enquêtes, les services clientèle ne pouvaient pas décortiquer la nature et les caractéristiques des problèmes.
« Utiliser des données non structurées est très important pour nous parce que c’est là que se cachent les détails », déclare Bert Ard, vice-présidente de l’expérience client chez CenturyLink. « Par exemple, quand vous faites du scoring, sans elles vous n’obtenez pas d’indicateurs pour opérer les changements nécessaires ».
Les données non structurées, une richesse inexploitée
La plupart des pipelines analytiques d’entreprise requièrent des données structurées, mais les sociétés gèrent de plus en plus d’informations qui ne le sont pas. Celles-ci correspondent à des mails, des historiques de conversations, des fichiers audio et vidéo, ou encore des postes sur les réseaux sociaux.
Selon un sondage de Deloitte publié en juin dernier, les données structurées représentent 80 à 90 % de toutes celles collectées par les entreprises. Mais seulement 18 % des sociétés les exploitent comme il se doit.
Il y a donc une course à l’extraction de la valeur dans ces fichiers au format divers qui ont dû mal à se synchroniser avec les systèmes relationnels et opérationnels existants. Pour ce faire, les acteurs intéressés se tournent vers les éditeurs de plateformes hébergées dans le cloud.
Pas moins de 39 % des entreprises adoptent des technologies d’analytique avancée en tant que service, contrairement à 15 % d’entre elles qui choisissent des logiciels on premise. Le marché de l’IA as a Service croît de 48,2 % par an, toujours selon le cabinet.
« Les logiciels cloud natives disposent de l’évolutivité, de la flexibilité, de l’agilité nécessaires pour gérer toutes les données et les analyses dont nous avons besoin pour recueillir des KPI et agir rapidement », affirme Bert Ard.
L’exemple de Qualtrics et du Natural Language Processing
Pour résoudre ce problème de manque de retour de la part de ses clients, la responsable de CenturyLink et son équipe ont adopté l’analyse textuelle. En appliquant le traitement du langage naturel (NLP), elle aurait mieux compris les problèmes rencontrés par ses clients.
Mais le NLP n’est pas uniquement utilisé sur un seul canal selon Bert Ard. Les ut posent souvent une question par mail, qui peut déboucher sur une conversation en ligne avec un employé du telco, et cela peut éventuellement se terminer sur un échange téléphonique.
Cette approche multicanal était importante pour CenturyLink, mais l’opérateur voulait utiliser une seule plateforme.
Bert Ard affirme que son entreprise a décidé de déployer Qualtrics, un outil de gestion de l’expérience racheté pour 8 milliards de dollars par SAP.
Traditionnellement, les données non structurées concernant les interactions commerciales sont traitées par des employés qui lisent les mails et les conversations en ligne et écoutent les enregistrements audio.
Cependant, un responsable chargé de consulter des centaines d’avis publiés il y a plus de six mois n’obtiendra pas une vision complète des sentiments des clients, selon Sahil Sethi, responsable produit marketing chez Qualtrics.
Ces données seront trop anciennes pour fournir une analyse pertinente. De plus, elles seront trop peu nombreuses pour disposer d’un échantillon représentatif. Pour autant, analyser de gros data sets amène son lot de problèmes.
« La plupart des entreprises manquent des ressources ou des outils pour décortiquer ces données non structurées », déclare Sahil Sethi. « Nous parlons ici de traitement massif ». Qualtrics propose un moteur de Natural Language Processing pour lire les commentaires des clients et possiblement en tirer de la valeur automatiquement.
Pour entraîner des systèmes d’intelligence artificielle comme celui de Qualtrics, les éditeurs commencent généralement par établir un échantillon de données. Des data scientists sélectionnent un ensemble de mails et les catégorisent suivant les remarques bonnes, mauvaises ou autres des utilisateurs d’un service. L’apprentissage supervisé permet à l’algorithme de différencier les futurs retours des clients en fonction des caractéristiques enseignées par l’homme.
Des systèmes IT encore trop rigides
Alors que l’IA se démocratise en entreprise et que les sociétés conçoivent leurs propres modèles, le besoin de créer une forme de structure au sein des données non structurées grandit, selon Praful Krishna, PDG de Coseer, un consultant en informatique cognitive.
« Pour former les algorithmes de deep learning, les informations doivent être annotées et étiquetées », déclare-t-il. « Et ce n’est pas un processus qui se fait en une seule fois,et qui peut être mis sur le côté », ajoute-t-il.
« Il est très tentant de prendre le taureau par les cornes le plut tôt possible et d’imposer une structure sur les informations les plus pertinentes de l’entreprise. Cependant, toute structure est esclave d’une problématique - chaque questionnement implique des réglages différents », affirme Praful Krishna.
« Heureusement, l’intelligence artificielle permet potentiellement de gérer les données non structurées », assure-t-il.
« Les progrès récents dans l’IA ont facilité une recherche très granulaire sur n’importe quel type d’information non structurée », dit-il. « Il est possible de répondre à des questions très spécifiques et, grâce à cette fonctionnalité, de remplir automatiquement des modèles ou des tableaux ordonnés ».
Cette approche de ce type de données pourrait mettre les entreprises à l’abri du temps et sensibiliser les technologies à nos besoins, selon Praful Krishna.
« Nos systèmes informatiques sont la rigidité même. Il “s’exprime” par le biais de zéros et des uns. Mais la pensée humaine est tout sauf structurée. C’est notre nature de travailler de manière fluide et associative sans qu’il y ait un chemin précis entre un point A et B d’un raisonnement », conclut-il.