kentoh - Fotolia
La multiplication des sources de données compliquent les projets de MDM
Avec la collecte des données clients qui s’accélère et l’agrégation multi-sources d’informations, les opérations liées aux données de référence (MDM) deviennent de plus en plus complexes.
Dans le monde de la gestion de données, il est des tensions inaltérables : celles entre les données opérationnelles et l’analytique. Et cette tension est d’autant plus forte aujourd’hui, avec le nombre grandissant de sources de données utilisées par les entreprises. Cela a pour effet d’accroître la complexité des processus de MDM (Master Data Management), et particulièrement celui qui traite des données clients.
Et apprendre à classer les données opérationnelles à des fins de cohérence analytique est le royaume du MDM. Il y a plus de 10 ans, un certain nombre d’outils sont arrivés sur le marché pour faire office de hubs de produits, de fournisseurs ou encore de sites et les projets de MDM liés aux clients tentaient de mettre de l’ordre dans les données générées par les différents systèmes transactionnels.
Ces systèmes se destinent avant tout à traiter les transactions, comme les ordres de vente. Les entreprises ayant automatisé leurs processus opérationnels, chaque système fonctionnait parfaitement de façon isolée. Toutefois, à toute transaction sont rattachées nombre de données contextuelles.
Si, par exemple, vous vous rendez dans un super marché pour acheter une canette de soda, une grande quantité de données est produite – quel produit a été acheté, à quel prix, cela était-il compris dans une offre promotionnelle, l’achat a-t-il été réalisé en cash ou par carte ?
Un marketeur souhaite quant à lui avoir une vision périphérique des transactions : quels produits se vendent mieux que d’autres dans telle boutique ou telle région et à quelle période de l’année ? Les promotions fonctionnent-elles ? Les clients sont-ils plus sensibles au prix dans telle ou telle région ? Les réponses à ces questions ont un impact important dans les stratégies marketing ou de ventes.
MDM : avoir confiance dans les données
Toutefois, pour avoir les réponses les plus précises en matière de comportement clients, les marketeurs doivent aussi avoir confiance dans la qualité des données et dans la façon dont elles sont classées. Par exemple, tout produit identique doit être classé de la même façon pour pouvoir obtenir une vraie comparaison.
Une canette de soda peut ainsi être classée comme une boisson gazeuse par une unité opérationnelle dans une région. Si une autre classe la canette selon une autre méthode – pétillante par exemple -, cela complique la tâche du bureau central qui aura du mal à obtenir une vue globale des boissons gazeuses.
Dans les hubs MDM, les données captées dans les systèmes transactionnels sont agrégées, et toutes les incohérences sont ôtées. Dans notre exemple, gazeuse et pétillante sont considérées comme identiques après matching. Ces données de référence validées et de grande qualité, également appelée « golden copy », permettent d’effectuer des analyses fiables, sans confusion possible.
Il est désormais communément admis que cette approche – agréger les données de référence de plusieurs systèmes, les blender et les valider pour produire une donnée propre – est la bonne méthode en matière de MDM. Toutefois, elle semble aujourd’hui remise en cause.
Atteindre ce niveau de donnée de référence a toujours été difficile, mais avec une bonne gouvernance et de détermination politique, cela reste possible. Au moins si l’entreprise a le contrôle des données de référence en question. Cela était le cas au début du MDM, car le MDM principal d’une entreprise résidait généralement dans son ERP, dans ses systèmes CRM pour de gestion de la supply chain.
Toutefois, les choses se sont compliquées. En plus de données tierces en provenance d’autres entreprises, il faut aussi prendre en compte une kyrielle de sources de données qui peuvent elles-mêmes comporter des données de référence.
Dans le cas d’un projet de MDM client, les données pertinentes sur les interactions peuvent être collectées sur le téléphone, l’email, un site de e-commerce, des chats, des études, par exemple. Ces clients peuvent également publier leurs propres opinions sur une entreprise ou une marque sur les réseaux sociaux.
Les données de référence, plus difficiles à cerner
Avec cette pléthore de nouvelles sources de données, les données de référence ne sont plus centralisées au sein d’un MDM d’entreprise. Les données clients se cachent dans de nouveaux endroits – pour certaines, derrière le parefeu – et pourtant, le besoin de contrôle et de gestion est toujours présent.
Des lacs de données cohabitent désormais avec les entrepôts de données. Toutefois, donner du sens à toutes ces données est encore une tâche ardue. Il est difficile de connecter un réseau social à un numéro de clients. Des techniques de Machine Learning ou de reconnaissance de pattern peuvent ici être d’un grand secours pour extraire du sens dans cette eau trouble.
Mais d’une manière ou d’une autre, ces données de référence, quelque peu déguisées, doivent être inclus à la golden copy pour que les équipes en charge de l’analytique puissent y évaluer précisément le sentiment d’un client ou le taux de churn par exemple. De nouvelles applications ont fait leur apparition, mais il reste encore une opportunité offerte aux éditeurs de MDM : celle d’adapter leurs outils pour répondre à cette nouvelle donne.