Temps réel et Big Data : indispensable qualité de données
Analyser plus de données, plus vite : les promesses du Big Data ne font que renforcer une des règles d’or de la BI traditionnelle, la nécessité d’introduire dans le système des données de qualité. Pour Sébastien Merle, de CSC, ce besoin doit déboucher sur la création d’un nouveau rôle dans l’entreprise, celui de « data owner ».
Analyser plus de données, plus vite : les promesses du Big Data ne font que renforcer une des règles d’or de la BI traditionnelle, la nécessité d’introduire dans le système des données de qualité. Pour Sébastien Merle, de CSC, ce besoin doit déboucher sur la création d’un nouveau rôle dans l’entreprise, celui de « data owner ».
Big Garbage In, Big Garbage Out ? Le passage de la BI traditionnelle au Big Data, marqué par d’importants volumes, une grande variété et de fréquentes mises à jour des données, ne remet pas en cause une des lois d’airain de l’analytique : tout investissement sur le segment est vain si la qualité des données n’est pas assurée. Pour Sébastien Merle, directeur associé chez CSC, en charge des référentiels et de la qualité de données chez cet intégrateur, avec le Big Data, la problématique se voit même renforcée. « Le nouveau paradigme, autour de SAP Hana et de la Real Time Data Platform (RTDP), débouche sur de nouveaux business models ou sur des processus innovants. Quand on est en mesure d’exécuter un processus clef de l’entreprise non plus en 24 heures, mais en quelques minutes ou dizaines de minutes, c’est évidemment un bouleversement essentiel dans la façon de travailler de l’entreprise. Mais, le temps réel associé à de grandes volumétries de données doit conduire les organisations à s’interroger que la qualité des informations qu’elles analysent », note-t-il. Logique : si une organisation peut travailler sur les données brutes de production, sans préparation, ni agrégat, elle doit garder un certain recul sur les analyses qui seront ainsi produites. Faute de quoi toute erreur dans les données introduites dans le système se traduit dans l’instant par une erreur d’interprétation.
Où sont les data owners ?
« Ces architectures promettent aux organisations de prendre des décisions plus vite. Mais il ne faut pas oublier le risque de prendre plus vite les mauvaises décisions », renchérit Sébastien Merle. D’où le besoin de structurer en interne une gouvernance de cette information, en mettant en place des garde-fous. Une structure qui dépend évidemment de la nature des organisations, notamment de leur degré de décentralisation. « La problématique n’est pas de savoir quelle est la bonne organisation, estime le responsable de CSC. En revanche, à l’intérieur de ces organisations, un certain nombre de rôles, notamment dans la gouvernance de l’information et la qualité de données, doivent émerger. » Et de remarquer que si les entreprises ont, pour la plupart d’entre elles, désigné des BPO (Business Process Owners) pour leurs principaux processus, elles sont moins nombreuses à avoir défini des responsabilités claires sur des données aussi fondamentales que celles relatives aux clients ou aux articles. « Les organisations ont souvent partagé ces responsabilités entre la supply chain, les ventes, le marketing, la finance, etc. », remarque Sébastien Merle. Une situation qui, déjà, soulève quelques obstacles, comme la difficulté à s’entendre sur des notions simples entre les différents départements de l’entreprise. « Et la problématique ne va aller qu’en se renforçant avec des architectures comme SAP Hana : si vous exploitez la donnée en temps réel, il va bien falloir identifier qui la produit, qui la manipule à un instant t, qui la consomme. »
Reste à savoir où positionner ce « data owner », un rôle frontière entre DSI et métiers. « Historiquement, ces sujets ont souvent été traités par les DSI, lors des mises en œuvre d’ERP ou de nouveaux systèmes, pour lesquelles la qualité des données injectées était un critère de succès, remarque Sébastien Merle. Mais c’est un sujet qui doit vivre, et pour ce faire, l’apport des métiers est indispensable. Ils doivent travailler de concert avec la DSI sur ces problématiques ». A noter que la Real Time Data Platform de SAP – qui renferme la base de données Hana – inclut des outils pour gérer l’alimentation des différents moteurs de base de données, mais aussi des modules permettant de piloter la gouvernance de l’information.