Bien comprendre l'intérêt de la Data Discovery
Les outils de découverte de données (Data Discovery) visualisent et contextualisent les données pour les utilisateurs métier. Ils sont essentiels à la prise de décisions des métiers.
Les données ne servent à rien si elles ne fournissent pas d'informations utiles pour prendre de meilleures décisions. Un bon outil de découverte de données se montre de plus en plus essentiel pour fournir ces informations.
Il existe des outils de Data Discovery qui offrent des fonctionnalités très variées et complètes, mais vous aurez tout de même certainement besoin d'outils complémentaires dédiés à la préparation des données, à la DataViz et à l'analytique avancé. Tous ces outils font partie de la catégorie de la Business Intelligence, qui regroupent les logiciels qui permettent de rechercher des tendances, des schémas récurrents ou des éléments précis dans les jeux de données qu'elles recueillent auprès de diverses sources.
La Data Discovery utilise généralement des présentations visuelles, comme les cartes géographiques, les tableaux de bord, des graphiques, ou des rapports synthétiques.
Avec les applications BI historiques, la visualisation se faisait au moyen de représentations graphiques, d'indicateurs de performance clés ou d'autres méthodes assez limitées en standard. Mais la BI a évolué, en mettant l'accent sur l'analyse et la découverte de données par les utilisateurs. Elle offre aujourd'hui la possibilité de créer en natif des présentations plus poussées.
Qui a besoin d'outils de découverte de données ?
Les entreprises ont besoin de Data Discovery pour tirer la véritable valeur de leurs données. Notamment parce que ces outils mettent l'analytique à la portée des utilisateurs métiers qui peuvent dès lors prendre des décisions plus éclairées. Par exemple, les analystes marketing peuvent utiliser ces outils pour identifier les tendances et les relations importantes qui pourraient aider à peaufiner une campagne.
La Data Discovery peut également contribuer à réduire les risques. Par exemple, les analystes métiers d'une banque ou d'une compagnie d'assurance peuvent l'utiliser pour mieux déterminer quels clients sont les plus à risque d'un point de vue financier, en se basant sur la stabilité financière, les dossiers de remboursement et les dépôts d'assurance.
Elle peut également jouer un rôle dans la mise en conformité réglementaire. Dans le cadre du RGPD les entreprises peuvent utiliser des outils de découvertes des données pour trouver les informations des clients disséminées dans les mails, les présentations et d'autres endroits de l'organisation.
Un avantage de la Data Discovery est qu'elle offre des aperçus personnalisés en fonction des métiers. Chaque entreprise a des objectifs et des priorités spécifiques et les individus ont chacun leurs propres intérêts. Les utilisateurs peuvent souvent personnaliser ces outils pour répondre à leurs besoins propres. La personnalisation passe par un paramétrage assez simple et par la modification de l'affichage des données.
Besoins limités en IT
L'un des plus grands avantages d'un outil de découverte de données est qu'il permet d'avoir une meilleure vue d'ensemble, le tout avec un support informatique limité. Bon nombre de ces outils et de leurs fonctions sont en libre-service.
La tendance de la BI en libre-service a ouvert de nouvelles opportunités pour les entreprises, leur permettant de tirer plus rapidement profit des données et de gagner en agilité. Les décideurs opérationnels peuvent agir sur l'information assez rapidement pour ne pas rater des opportunités s'ils avaient eu un besoin d'une intervention du service informatique.
Mais besoin de l'IT tout de même
Les avantages de la Data Discovery s'accompagnent de plusieurs défis qu'il faudra relever. Les capacités libre-service offrent certes une plus grande efficacité mais elles peuvent également créer des risques. Sans la participation et l'intervention de la DSI, des questions liées à la gouvernance des données se posent.
Il s'agit notamment des questions liées à la qualité des données. Leur mauvaise qualité a coûté en moyenne 15 millions de dollars aux entreprises en 2017, selon une étude de Gartner (Data Quality Market Survey). La mauvaise qualité des données peut aller jusqu'à entraîner l'échec d'un projet. L'informatique peut donc avoir à intervenir pour assurer leur exactitude et leur cohérence.
Le défi de la sécurité et de la protection de la vie privée est également lié à la gouvernance des données. Comment les organisations peuvent-elles s'assurer que les données sont protégées et utilisées de manière responsable, en particulier lorsque les utilisateurs professionnels ont une grande latitude ? C'est une préoccupation légitime, compte tenu de l'augmentation des atteintes à la protection des données et de la quantité de renseignements personnels identifiables que les entreprises recueillent.
Dans toutes ces problématiques, c'est au service informatique qu'il convient d'assurer une sécurité et une gouvernance adéquates.
Conclusion
Malgré les défis à relever, les outils de Data Discovery deviennent clairement des composantes essentielles des stratégies analytiques dans de nombreuses organisations. Et la tendance risque de s'amplifier si l'on considère que les développements futurs leur ajouteront encore plus de capacités.
Par exemple, l'Intelligence Artificielle (IA) et l'apprentissage statistique (Machine Learning) permettront à la Data Discovery d'être « plus intelligente ». Dans un rapport publié en 2017, Gartner soulignait déjà la montée en puissance de « l'analytique augmentée ». Cette approche - qui automatise les interprétations de données grâce au Machine Learning et au cognitif (comme le NLG et le NLP) pour exprimer des demandes en langage naturel - marque la prochaine vague du marché de la BI.
Ce n'est pas pour après-demain. C'est pour demain. Vous avez donc tout intérêt à vous préparer dès aujourd'hui à accueillir ses outils d'analyse « intelligents », pour que vos métiers adoptent leurs fonctionnalités au fur et à mesure qu'elles mûrissent.