Tribune : Gouvernance de données et systèmes d’information durables, pourquoi maintenant ?
De la même façon qu’il a fallu agir pour maîtriser la prolifération des déchets en milieu urbain, il faut mettre en place les dispositifs dédiés et transverses pour gérer l’information. Avec l’explosion du volume de données en entreprise, la question devient pressante et implique d’entrer rapidement dans une logique de gouvernance des informations.
1 - Gouvernance de données et systèmes d’information durables : quels liens ?
Pendant près de mille ans, la nature seule était responsable de digérer les déchets que les hommes produisaient. Cependant la concentration d’êtres humains en ville a imposé de nouvelles organisations, infrastructures et disciplines. A Paris, par exemple, c’est à Philippe Auguste, au XIème siècle, que l’on doit les premières rues pavées et les canaux, tandis qu’en 1884, le décret Poubelle obligeait la population parisienne à utiliser un récipient dédié pour déposer ses déchets, afin qu’ils soient « proprement » ramassés par les services municipaux.
Puis, l’enjeu est devenu non plus de détruire ces déchets, mais de les recycler chaque fois que possible. Ainsi anoblis, les déchets sont redevenus matières premières, notre graal étant que notre économie ressemble à notre biosphère, apte à s’auto-régénérer. Le recyclage des déchets est aussi devenu une économie en tant que telle, qui, rien qu’aux Etats Unis, représente 236 milliards de dollars, 1,1 million de salariés et 56 000 entreprises
La gestion de l’information dans l’entreprise suit une logique très similaire. Pendant de nombreuses années, l’information n’était pas surabondante dans l’entreprise donc nul besoin de dispositifs sophistiqués pour en gérer la qualité, pour en organiser la distribution, la protection et la certification : chaque système d’information ou activité était responsable du traitement et retraitement de ses propres informations. Puis, les systèmes sont devenus plus complexes et interdépendants, les processus plus transverses, les acteurs impliqués plus nombreux et plus gourmands en information, la vitesse d’exécution plus rapide. De la même façon qu’il a fallu agir pour maîtriser la prolifération des déchets en milieu urbain, il faut mettre en place les dispositifs dédiés et transverses pour gérer l’information. Et à l’instar du principe du recyclage des déchets, certains processus de gestion de l’information devront être repensés en profondeur en tant que cycle : pourquoi, par exemple, tant de sites web imposent au client, dans son parcours, la saisie de ses coordonnées via un formulaire, sans chercher à savoir si les coordonnées dudit client ne sont pas déjà en possession de l’entreprise ? N’est-ce pas là introduire une source de pollution de plus dans un système pourtant déjà alourdi par la masse d’informations qu’il doit gérer ? Et n’est-ce pas aussi encourager ainsi le client/prospect, las de devoir renseigner sans cesse ses coordonnées, à augmenter ce phénomène de pollution en s’identifiant sous de faux noms, avec des adresses mails « poubelles » auxquelles il n’accède jamais… Le tout avec un effet dévastateur sur l’efficacité des opérations de générations de leads entrants, pourtant critiques pour le marketing.
Comme pour le traitement des déchets où les usines de traitement ne constituent qu’un des maillons du dispositif, on aurait tort de croire que les systèmes d’information sont à même de résoudre seuls le problème : la mise en place d’outils de Master Data Management (MDM), de gestion de qualité de données est donc sans doute nécessaire, mais en aucun cas suffisante. Il faut pouvoir compter sur d’autres Philippe Auguste (les sponsors) pour en faire un enjeu d’entreprise, d’autres Préfet Poubelle (les législateurs, comme par exemple l’audit interne, le contrôle de gestion…) pour mettre en place les dispositifs, institutionnaliser les règles et organiser leur mise en application ; il faut aussi mettre en place une « économie en tant que telle » pour traiter le sujet de manière permanente dans l’entreprise : choisir des outils adaptés, affecter des ressources dédiées, entretenir les savoir-faire…
Enfin et surtout, il faut mobiliser chacun, obtenir son engagement personnel et gérer le changement pour y parvenir. Au même titre que l’efficacité de toute une filière de recyclage dépend de la volonté de celui qui est en début de chaîne, qui remplit la bonne poubelle avec le bon déchet, il faut du temps et de l’énergie pour que les données soient correctement renseignées et mises à jour en temps voulu dans les systèmes d’information d’entreprise. Et que chacun se sente responsable de la bonne gestion de l’information dont il maîtrise les contenus.
C’est cela que l’on dénomme gouvernance de l’information. De toute évidence, sa mise en place est un important chantier, d’autant plus d’actualité que l’information devient facile à produire et à diffuser très largement, et donc surabondante. Il faut alors certifier sa pertinence, la classifier et la filtrer, garantir la traçabilité, son partage de plus en plus large et sa protection de plus en plus fine. L’enjeu est celui d’un système d’information durable, qui ne se limite pas à produire de l’information mais à gérer tout son cycle de vie, indépendamment des applications qui la consomment.
La dimension du problème fait certes un peu peur, et c’est sans doute la raison pour laquelle les entreprises hésitent à engager des initiatives de type MDM ou de gouvernance des données. Pendant ces phases d’hésitation, la question continue à prendre de l’ampleur. L’enjeu est donc d’avancer pas à pas, d’apprendre en marchant, et, comme ce que nous devons faire actuellement pour les problématiques de développement durable, d’engager une dynamique de progrès en ajustant en permanence le dispositif à la dimension du problème.
2 - Quelques principes fondateurs d’une démarche de gouvernance des données
a) Définir le cadre : le principe de l’agenda 21
Au même titre qu’une stratégie de développement durable urbain met progressivement en place des politiques de tris sélectifs et de recyclage par filière, une démarche de gouvernance de données doit se décliner en un ensemble de sous-initiatives dont les objectifs sont atteignables dans un délai court, sur un domaine bien défini, puis qu’on peut faire évoluer de manière itérative.
Un des principaux écueils à éviter est celui d’une couverture trop globale visant à atteindre « l’unique version de la vérité ». L’enjeu, et c’est là où l’analogie avec l’agenda 21 des politiques de développement durable prend tout son sens, est de s’appuyer sur un cadre défini au niveau global, mais de l’appliquer localement afin de donner à chacun les moyens, dans son périmètre de responsabilités, de définir « son » projet stratégique. Les caractéristiques de l’agenda 21, dont on peut s’inspirer pour mettre en place une politique de gouvernance de données, sont principalement :
- Un agenda 21 se traduit par un plan d'actions concrètes pour faire du développement durable une réalité sur un territoire. C’est à la fois un outil stratégique qui oriente vers un schéma directeur à long terme et un outil opérationnel à court terme qui fixe des objectifs précis et permet de les suivre.
- Son cadre permet de définir clairement les responsabilités de chacun pour la phase d’exécution.
- Il peut s’appliquer à tout type d’organisation. Une organisation qui l’adopte peut orchestrer sa mise en application en parallèle dans ses sous-ensembles.
- Il est élaboré en concertation avec les parties prenantes : pour une collectivité, il s'agit des habitants des autres collectivités, des associations, des services de l'Etat, des entreprises, des syndicats, etc. Pour la gouvernance de données, il s’agira des responsables informatiques de chaque application de l’entreprise, des services en charge du contrôle, de l’audit ou de l’administration d’une fonction ou d’une activité (contrôle de gestion, administration des ventes, qualité…), de ceux qui saisissent les données ou qui vont les utiliser…
Un des pré-requis pour la mise en place de cet agenda 21 dans l’entreprise, sera de définir le « découpage des circonscriptions », c'est-à-dire d’identifier l’ensemble des initiatives à mener et surtout de préciser leurs périmètres respectifs. Si le périmètre est trop limité, le risque est de renforcer les silos, alors que s’il est trop large, l’engagement de chacun devient plus difficile à obtenir et les responsabilités sont plus floues. Le périmètre des initiatives est par ailleurs appelé à évoluer dans le temps. On peut par exemple s’intéresser dans un premier temps au marketing dont la pertinence de la base de données s’érode avec le temps. Puis, dans un second temps, l’initiative peut élargir son périmètre, en recherchant plus de cohérence dans la gestion des informations clients au travers de canaux de communication et/ou des activités de l’entreprise.
Sur la base d’un périmètre défini, il faut cartographier un certain nombre de données ; il faudra ensuite définir les glossaires, les modèles et identifier les sources de données à considérer. Enfin et surtout, l’initiative permettra de définir les rôles et les organisations à mettre en place pour les étapes suivantes, les actions à mener, les systèmes sources et les usages à considérer.
b) Mettre en place un plan curatif : le principe de la « station d’épuration »
Selon l’Ademe, « une station d’épuration rassemble une succession de dispositifs, empruntés tour à tour par les eaux usées. Chaque dispositif est conçu pour extraire au fur et à mesure les différents polluants contenus dans les eaux. La succession des dispositifs est bien entendu calculée en fonction de la nature des eaux usées recueillies sur le réseau et des types de pollutions à traiter ».
Appliqué à la gouvernance de données, ce principe consiste à mettre en place une politique de gestion de la qualité des données en utilisant les outils adéquats pour nettoyer les données, mieux les intégrer et les dé-dupliquer sur la base de règles de gestion bien définies. Tout commence par l’analyse de la nature « des eaux usées » pour découvrir, « mapper » et auditer les données sources, leur qualité et leur conformité. Ceci permet de déterminer l’ampleur de la tâche à entreprendre par la suite pour en gérer la qualité. Si les enjeux métier sont clairement établis, cette démarche de découverte permet aussi de définir plus précisément les "business cases" sur la base d’une vision claire de la situation actuelle et d’objectifs de progrès clairement formalisés. Par exemple, concernant les risques de crédit clients dans la banque, elle mettra en exergue le lien entre la qualité des données relatives à l’activité d’une entreprise ou son pays d’appartenance et le rating du risque, lui-même à la base de la juste attribution des fonds propres de la banque. L’étape permettra également de voir jusqu’où aller dans le traitement de la qualité de manière à ajuster les moyens à l’enjeu.
Puis, une fois évaluée la nature des « données usées », il faut construire la station d’épuration proprement dite. Le datawarehouse, s’il a été mis en place dans l’entreprise, paraît le lieu le mieux adapté pour l’héberger. Le traitement de la qualité des données y est du reste souvent déjà mené de manière plus ou moins artisanale. La démarche de gouvernance de données permet de l’institutionnaliser, d’en mesurer l’efficacité et les apports et surtout de responsabiliser les métiers sur le contenu des données que les systèmes d’information permettent, gérent et distribuent dans l’entreprise. Ainsi mise en place, la « station d’épuration » permet non seulement de purifier les données, mais elle est aussi un observatoire qui met en lumière les données qui soulèvent des problèmes pour certains métiers, charge à eux de définir les règles et les processus pour les résoudre. Cette station d’épuration peut permettre soit de réalimenter le système avec des données « plus propres », soit d’alimenter un nouveau réseau avec des données « potables » : le système décisionnel, bien sûr, mais aussi de nouvelles applications nécessitant des données dont la qualité est certifiée en amont selon un processus bien défini. Les applications de gestion des risques et des conformités sont les premières concernées.
A noter pour finir que cette station d’épuration ne se limite pas à traiter de la qualité des données, mais plus généralement de les rendre consommables (notamment en documentant leur sens en fonction des différents contextes de consommation), accessibles par tous ceux qui ont en ont le droit… La sécurité et la traçabilité des accès y est d’ailleurs de plus en plus fondamentale, comme le montrent aujourd’hui tous les débats largement médiatisés sur la confidentialité des données et le respect de la vie privée.
c) Mettre en place un plan préventif : limiter la pollution à la source
Selon Ekopedia, « un grand nombre de polluants chimiques ne sont ni mesurés, ni traités par la station d’épuration qui réalimente le milieu naturel. Aussi pour protéger l’environnement et la ressource en eau, il convient que chacun agisse en amont pour réduire la pollution rejetée dans les eaux usées : ne pas jeter les médicaments ou les peintures dans les circuits d’eaux usées […] ne pas laver sa voiture dans la rue, utiliser des savons biodégradables, etc. » On connait aussi l’importance du travail en amont avec différentes filières qui sont à la source de certaines formes de pollution, comme l’agriculture intensive pour les pesticides ou les nitrates.
La métaphore fonctionne parfaitement dans la gouvernance de données : le modèle curatif ne peut être efficace à 100 %, et il coûte d’autant plus cher et mobilise d’autant plus de ressources que les données d’origine sont « usées ». Il faut donc, tôt ou tard, s’attaquer au problème à la source. Pour reprendre l’exemple de la gestion d’une demande entrante sur Internet, déjà citée, il conviendra par exemple de remplacer le formulaire de saisie des coordonnées sur Internet pensé pour un utilisateur anonyme par une procédure qui considère par défaut que l’internaute est connu de l’entreprise et ne lui demande de saisir ses coordonnées que dans le cas contraire.
Cette démarche n’est pas triviale, car elle peut avoir un impact sur les processus opérationnels en amont et nécessite une coordination plus forte entre différents métiers. Elle n’est pas sans rappeler les démarches « six sigma » que mènent les entreprises autour de la qualité, et qui nécessitent de mobiliser et de coordonner plusieurs profils d’acteurs, comme les back belts, ou ceintures noires, complètement dédiés aux projets d’amélioration, ou encore les green belts, ou ceintures vertes, qui sont des opérationnels dont les objectifs sont partiellement destinés à la conduite de ces mêmes projets.
d) Exploiter de nouvelles sources
Gérer le cycle de l’eau, c’est aussi exploiter toutes les sources. Aujourd’hui, l’eau qui est exploitée pour être consommée est principalement de l’eau non salée, soit seulement 3 % de l’eau à disposition sur notre planète. Exploiter l’eau salée est de toute évidence un enjeu majeur pour l’avenir de l’humanité, sachant que la moitié des villes de plus d’un million d’habitants qui manquent d’eau sont situées au bord de la mer.
Même si l’information, contrairement à l’eau, existe en quantité infinie et n’est donc pas sujette à la pénurie, la métaphore s’applique malgré tout assez bien : l’information qui est sous contrôle des systèmes d’information ne représente qu’une petite partie de l’information disponible. De nombreuses informations précieuses se situent hors de leur contrôle : données non structurées qui circulent dans l’entreprise dans les messageries électroniques, documents stockés dans les répertoires personnels, partagés ou dans les intranets ; informations circulant à l’extérieur de l’entreprise, sur Internet ou dans les systèmes d’informations des partenaires…
Toute cette richesse est aujourd’hui inexploitée. La gouvernance de données, c’est donc aussi développer un savoir-faire pour aller « sourcer » de nouvelles informations pertinentes. L’exemple des recommandations dans les catalogues produits électroniques des commerçants est à ce titre éloquent : en encourageant les consommateurs à donner leur opinion sur les produits, certains distributeurs ont créé un avantage compétitif. L’opinion d’autres utilisateurs sur le produit devient ainsi parfois, aux yeux de l’acheteur potentiel, bien plus importante que les caractéristiques factuelles des produits décrites dans le catalogue électronique.
Introduire de l’eau salée dans le cycle de traitement des eaux n’est cependant pas chose facile. Le procédé fonctionne, et ceux qui en ont le plus besoin maîtrisent déjà le procédé. Mais, il a encore pas mal d’inconvénients, si bien que seulement 1,5 % de la consommation d’eau provient de ce procédé. Il n’est donc pas encore suffisamment mature pour se généraliser. Il est en de même pour l’informatique d’entreprise. On sait depuis longtemps qu’il faut introduire de nouvelles sources, mais on hésite à ouvrir les vannes, car on ne maîtrise pas le processus de création des contenus considérés. Néanmoins, quand leur valeur ajoutée le mérite, comme dans l’exemple des recommandations, il faut les considérer dès maintenant.
Ces nouvelles sources de données permettent, par exemple, de mieux connaître les clients, en enrichissant les données internes avec des données externes pour une meilleure segmentation, une meilleure gestion des risques d’impayés ou de fraude… On peut aussi imaginer des services qui permettent d’identifier l’utilisateur d’un réseau social comme Facebook, Linkedin ou Twitter, en tant que client, établissant ainsi un trait d’union entre les réseaux sociaux et le CRM d’une entreprise. Ainsi, la gouvernance d’information devient un service à valeur ajoutée, un facilitateur et pas seulement un régulateur et un contrôleur.