Les outils de gouvernance de données facilitent la gouvernance, mais ne font pas tout…
Pour mettre en œuvre un projet de gouvernance de données réussi, on recommande généralement d’agir à la fois sur les hommes, les processus et les technologies. L’idée consiste, en partie, à éviter d’accorder une confiance aveugle aux outils de gouvernance de données lorsqu’il s’agit de concrétiser les objectifs du projet, ce qui implique de se concentrer sur une définition claire des rôles, responsabilités, politiques et procédures à appliquer.
Pour mettre en œuvre un projet de gouvernance de données réussi, on recommande généralement d’agir à la fois sur les hommes, les processus et les technologies. L’idée consiste, en partie, à éviter d’accorder une confiance aveugle aux outils de gouvernance de données lorsqu’il s’agit de concrétiser les objectifs du projet, ce qui implique de se concentrer sur une définition claire des rôles, responsabilités, politiques et procédures à appliquer.
La majorité des entreprises voit nombre de complexités organisationnelles, techniques et systémiques faire obstacle à la réutilisation/réorientation des données que des efforts de gouvernance bien ordonnée tentent, quant à eux, de préserver, en établissant une cohérence des informations et des règles d’usage. Examiner les opérations de traitement de données de bout en bout met en lumière de nombreuses difficultés d’administration profondément enracinées, telles que des écarts dans les modèles de données, une rigidité dans les structures de données existantes, ou encore des incohérences majeures dans la terminologie métier.
Pour aller au-delà des intérêts souvent divergents des différentes directions métier, et au-delà du foisonnement des applications métier et des plates-formes et approches de l’administration des données, qui sont monnaie courante dans les entreprises, et pour avoir la main sur les actifs de données organisationnelles, il faut commencer par associer des procédures d’intendance des données à des bonnes pratiques correctement documentées, afin de créer et d’utiliser les données et les technologies appropriées. C’est ainsi que l’on apportera le terreau fertile à une gestion et une gouvernance collaboratives de données, et ce, à des étapes telles que la définition et la mise en application de normes de données en interne, l’harmonisation de la sémantique métier des données d’entreprise, l’incorporation de contrôles de validation aux routines d’intégration, ou encore le développement de jeux de règles de données partagés qui reflètent les besoins des utilisateurs métier à l’échelle de l’organisation.
Les logiciels de gouvernance de données et la technologie connexe doivent venir compléter des méthodes par lesquelles les politiques définies par un conseil de gouvernance de données, ou par un groupe moins formel de représentants de l’activité, sont traduites en exigences relatives aux informations et en règles métier correspondantes. Différents types d’outils sont disponibles pour prendre en charge des processus d’amélioration de la gouvernance des données et de supervision des informations. Détaillons-en quelques-uns.
Les modèles de gouvernance de données - Outils précieux souvent négligés, les modèles standardisés peuvent contribuer à organiser les priorités, les tâches et les résultats d’un projet de gouvernance de données. Ainsi, un modèle de politique de gouvernance de données aide le conseil de gouvernance d’une entreprise à définir correctement une politique, son périmètre, ses indicateurs de performances et un processus de remontée des problèmes à des niveaux supérieurs, le cas échéant. Autre exemple : un modèle d’échéancier détaillera pas à pas les questions de gouvernance de données, les propositions, les normes et autres sujets devant être débattus lors des réunions du conseil.
Outils de modélisation des données - Pour résoudre les problèmes de gouvernance d’une entreprise liés aux incohérences et aux écarts entre les modèles de données, la solution consiste à rationaliser et normaliser différents aspects du processus de modélisation de données. Cela passera par différentes étapes : définir des types d’entités de données et des structures de données communes, assurer l’intégrité du référentiel et pérenniser les hiérarchies de classes de données. Les outils de modélisations de données permettent, entre autres, ces améliorations, et contribuent par ailleurs à aligner les modèles de données sur l’architecture globale de l’entreprise, et à préserver l’homogénéité des données.
Logiciel de profilage de données - L’exploitabilité des données dépend de la gravité des problèmes de données. Elle ne peut exister sans un outil d’analyse et d’évaluation de la qualité des données qui s’intégrera au cadre de la gouvernance de données. Cet outil devra comporter un profilage des données (couvrant jeux de données, enregistrements, éléments et valeurs), et permettre l’analyse statistique et l’évaluation des modèles de données. Ces technologies contribuent à détecter les anomalies, à déterminer leurs effets potentiels sur l’activité, et à élaborer des dimensions pour mesurer le niveau de qualité de données.
Logiciel de gestion de la qualité des données - L’un des objectifs fondamentaux d’une stratégie de gouvernance de données consistera à garantir leur précision, leur homogénéité et leur exhaustivité. De toute évidence, les outils de qualité de données — logiciels d’analyse (parsing), de standardisation, d’amélioration et de nettoyage — ont un rôle à jouer dans la mise en œuvre d’un modèle de gouvernance de données.
Outils de gestion des métadonnées - Ces outils seront utiles pour créer et gérer des glossaires partagés de terminologie métier, des définitions d’éléments de données, et des standards internes en architecture de données, modélisation de données, conventions de dénomination et méthodologie d’échanges de données. Ils peuvent également contribuer à améliorer la visibilité dans les flux d’informations des systèmes d’entreprise. Parallèlement, les outils de gestion des métadonnées sémantiques peuvent être déployés en tant que plate-forme centrale offrant des vues des structures de données à l’échelle de l’entreprise, ainsi qu’une base de connaissances sur les définitions de données.
Gestion de données de référence, ou MDM (Master Data Management) - La gestion des données de référence, MDM, est souvent considérée comme une activité autonome. Il existe pourtant des aspects de gouvernance et de gestion de données transverses, susceptibles de dépendre de certaines capacités de résolution d’identité et de gestion en référentiel de données fondamentales, souvent intégrées aux suites logicielles MDM.
Pas de doute, ces technologies peuvent constituer un pan important d’une stratégie globale d’intendance et de gouvernance de données. Toutefois, inutile de se faire des illusions : tout cela ne saurait suffire à votre réussite. Pour tirer toute la substantifique moelle des outils de gouvernance de données et des logiciels qui les sous-tendent, on ne pourra faire l’économie de politiques et de processus de gouvernance de données bien pensés, menés par une équipe dédiée bien structurée, qui veillera à leur déploiement effectif, et saura, au sein de l’organisation, utiliser les technologies qui contribuent à l’adoption des bonnes pratiques en matière de gouvernance de données.
L’auteur
David Loshin est président de Knowledge Integrity Inc., une entreprise de consultance, de formation et de services qui travaille avec ses clients sur des projets dans les domaines du Big data, de la qualité des données, de la gouvernance de données, de la gestion de données de référence et de l’intelligence décisionnelle. Il est également l’auteur de quatre ouvrages, dont The Practitioner's Guide to Data Quality Improvement (Guide pratique pour améliorer la qualité des données) et Master Data Management (la gestion de données de référence).