Data Discovery : quels critères évaluer pour bien choisir sa solution ?
Voici cinq points clefs spécifiques à ne pas oublier dans votre processus d'évaluation et d'achat d'une solution de découverte de données. Ils s'ajoutent à ceux plus classiques : prix, cloud vs sur site, scalabilité ou mobilité.
Grâce aux représentations visuelles, à l'analytique et à d'autres fonctionnalités clefs, les solutions de Data Discovery aident à tirer profit des données en en extrayant des enseignements même sans avoir des compétences de Data Scientist. Quelle est la meilleure plateforme ? Vos objectifs opérationnels détermineront grandement la réponse.
Mais en plus de vos besoins spécifiques, vous devrez, en tant qu'acheteur, tenir compte de plusieurs critères incontournables pour faire une évaluation complète. Voici les plus importants.
Types d'analytiques
La première question clé à se poser est de savoir quel type d'analyse le produit permet.
Par exemple, permet-il de faire des analyses poussées, ou du prédictif, avec du Machine Learning pour les rendre abordables aux utilisateurs métier ?
Grâce au prédictif, les entreprises peuvent analyser les tendances, les activités actuelles et leurs historiques pour en tirer des prévisions sur des événements futurs, par exemple déterminer si un produit ou un service se vendra bien sur un marché donné.
Concrètement, l'analytique prédictive identifie des schémas récurrents dans des données historiques et transactionnelles pour identifier des opportunités ou des risques. Les modèles prédictifs peuvent également détecter des relations et des corrélations entre de multiples facteurs, ce qui permet aux analystes métiers de prendre des décisions plus éclairées.
Certains produits de découverte de données sont aussi dotés de mécanismes d'auto-apprentissage qui fournissent par eux-mêmes des recommandations et des prévisions fondées sur des données provenant de sources multiples.
Par exemple, les données des réseaux sociaux peuvent donner des indications sur des sujets d'actualité, des marchés particuliers ou sur les sentiments des clients (les gens partagent-ils des messages positifs ou négatifs sur une entreprise ou un produit). Cela permet de tirer des informations précieuses pour le marketing et les directions commerciales.
Les organisations qui doivent faire face à des scénarios complexes et sensibles au facteur temps se demanderont si les outils de découverte des données peuvent faire du In-Memory. L'analyse In-Memory réduit les temps de réponse aux requêtes, ce qui permet de faire de la BI en self-service en quasi temps réel.
Types de visualisations
La deuxième question est de savoir comment les données peuvent être représentées visuellement par la solution de Data Discovery ?
La visualisation des données (ou Data Viz), tant pour les utilisateurs IT que pour les utilisateurs métiers, est un facteur clé à considérer lors de l'achat.
Les graphiques, cartes, tableaux et autres représentations peuvent, quand ils sont bien faits, rendre une information complexe beaucoup plus facile à comprendre.
Mais peut-être que vos utilisateurs métiers préfèreront des représentations plus avancées comme des visualisations interactives (visualisation géo-spatiale, tableaux croisés dynamiques - qui résument les données d'autres tableaux pour les trier, ou faire des calculs comme une moyenne ou un total - ou des cartes thermiques - qui représentent graphiquement les données dans une matrice en couleur).
Facteurs IT
La Data Discovery s'adresse principalement aux non experts. De fait, cette forme de BI en self-service est utilisée par des personnes à des postes, des hiérarchies et des endroits différents (bureau, maison, déplacement, etc.), y compris dans des bureaux régionaux partout dans le monde. L'entreprise s'expose ainsi à des risques qu'elle doit prendre en considération lorsqu'elle évalue les options.
La première est la gouvernance des données. La plate-forme de Data Discovery devra fournir un moyen de superviser et de gérer de manière centralisée des dizaines de milliers d'utilisateurs potentiels (avec une gestion par rôles et des permissions).
Assurer la sécurité des données et leur confidentialité est un autre aspect important de la gouvernance. Demandez-vous quels sont les contrôles d'authentification et d'accès des utilisateurs fournis par la plate-forme de découverte de données.
N'oubliez pas que les entreprises doivent protéger les données non seulement contre les menaces externes - comme les pirates et les cybercriminels - mais aussi contre les menaces internes - comme la négligence des utilisateurs.
Le contrôle de version est un autre impératif que gèrera l'IT. La gestion des différentes versions des documents et des modèles est essentielle pour s'assurer que les données et les visualisations apportent le maximum de valeur.
Intégration et préparation des données
Il y a des données pertinentes partout, elles peuvent venir aussi bien de sources internes qu'externes (interactions clients, sites Web, médias sociaux, applications mobiles ou rapports de recherche).
Pour être efficaces, les outils d'exploration de données doivent supporter cette variété de sources. La facilité et l'efficacité avec lesquelles l'outil ingère les différentes sources sont une considération importante.
La plate-forme de Data Discovery peut-elle se connecter aux systèmes centraux de l'entreprise et en extraire des données ? De manière simple et fluide ? Prend-elle en charge les données structurées, semi-structurées, non structurées ? Et les données des systèmes cloud aussi bien que sur site ?
Certains outils ont des capacités de préparation de données plus adaptées que d'autres. Ils peuvent trier les sources, éliminer « le bruit », et trouver des informations les plus pertinentes en fonction d'un projet ou d'un rapport particulier. En tout état de cause, de bonnes données sont indispensables pour avoir de bonnes interprétations. Or toutes les sources ne sont pas utiles, certaines peuvent même être nuisibles. Donc n'oubliez pas de regarder les fonctions d'exploration, de préparation, et de gestion de la qualité des données des différents outils que vous allez sélectionner.
Caractéristiques pour la conformité réglementaire
Les outils de Data Discovery peuvent également aider à se conformer aux réglementations et aux contraintes légales, comme par exemple le Règlement général sur la protection des données (RGPD). De nombreuses entreprises utilisent ces outils pour trouver des données personnelles de clients disséminées dans les e-mails, les présentations et autres supports.
Si c'est un des cas d'usage que vous envisagez, il vous faudra donc aussi regarder comment les outils de votre « short list » permettent l'identification, la classification, le monitoring, le suivi des données, ainsi que la recherche dans les contenus textuels.
Penchez-vous aussi sur les capacités de gestion des métadonnées. Les métadonnées peuvent être un élément clé de la conformité réglementaire.
Conclusion
Ce ne sont là que quelques considérations pour évaluer les outils de Data Discovery. D'autres sont assez évidentes : comme le coût total, l'évolutivité et l'intégration avec les plates-formes existantes ou encore la prise en charge de la mobilité (responsive design ou app mobile).
Le choix d'une solution cloud vs une solution sur site est un autre facteur déterminant.
Enfin, au-delà de la dimension purement technologique et métier, une bonne pratique consiste à faire intervenir tous les intervenants clés dans le choix. Leur implication dans cette phase amont garantit (presque à coup sûr) que la plate-forme de découverte de données sera adoptée en aval et qu'elle apportera bien toute la valeur qu'elle peut offrir.