Sergey Nivens - stock.adobe.com
Valoriser ses données grâce au DataOps
Qu’est-ce que le DataOps ? Comment la démarche fiabilise-t-elle la donnée et son utilisation ? Quelles sont ses composantes techniques et d’organisation ? Un expert de SFEIR répond à toutes ces questions.
La maîtrise de la donnée est devenue un atout essentiel pour les entreprises. Grâce à elle, les géants du numérique et de la nouvelle économie ont pu s’implanter et croître aussi rapidement. C’est aussi grâce à la donnée que les entreprises traditionnelles les plus à la pointe sur le numérique parviennent à rebondir, à créer des services innovants, voire à se transformer.
Mais on ne devient pas data-driven du jour au lendemain.
Il ne suffit pas de créer un datalake, d’embaucher un data scientist, ou encore de nommer un Chief Data Officer. L’option est tentante, mais elle a conduit nombre d’entreprises à investir du temps, des ressources, de l’argent en vain ; en témoigne le taux impressionnant d’échec des projets Big Data, relevé par les analystes. En 2017, Gartner indiquait ainsi que 85 % des projets Big Data échouaient à arriver en production.
Pourquoi penser au DataOps ?
Heureusement, des expérimentations réussissent, et des projets créent de la valeur. C’est bien, mais pas suffisant. Ce qu’il faut, c’est s’assurer que ces réussites soient pérennes et reproductibles. La démarche DataOps vise à s’en assurer.
Gartner définit le DataOps comme « une pratique collaborative de gestion des données qui vise à améliorer la communication, l’intégration et l’automatisation des flux de données entre les gestionnaires et les consommateurs de données au sein d’une organisation ».
La démarche DevOps a largement contribué à fiabiliser la mise en production des développements logiciels. L’approche DataOps s’en inspire.
L’idée est d’industrialiser la stratégie de valorisation des données pour fiabiliser l’ensemble du processus de traitement et d’analyse de la donnée. Il s’agit à la fois d’une démarche technique et d’une démarche organisationnelle.
Quelle approche technique ?
Du point de vue technique, le DataOps demande une certaine rigueur dans la conception des plateformes de données, de façon à pouvoir automatiser au maximum la conception, le déploiement et l’amélioration continue des pipelines de données. On n’automatise bien que ce qui est bien pensé au départ.
De même, la rigueur sera de mise pour déterminer les métadonnées associées et automatiser leur mise à jour, de façon à disposer d’une donnée dont on connaîtra le sens ainsi que le niveau de qualité et dont on saura reconstituer le lignage.
Mettre en œuvre un tel environnement technique est facilité aujourd’hui par la disponibilité dans le cloud, et donc sans investissement préalable, d’offres extrêmement performantes et simples d’utilisation.
Toutefois, rien de tout cela n’aura d’importance s’il n’existe pas une collaboration efficace entre la DSI, les architectes et ingénieurs spécialistes de la donnée, les analystes et bien sûr les métiers – dont on doit souligner le double rôle de producteurs et de consommateurs de la donnée.
Quelle approche de la gouvernance ?
La dimension organisationnelle est essentielle dans l’approche DataOps, mais elle est souvent négligée.
Le terme de gouvernance est régulièrement associé à des processus IT, de gestion des règles, ou à une politique de suivi de la conformité. Comme si elle ne relevait que de la compétence du DSI ou du CDO. Or la gouvernance de la donnée va bien au-delà.
Une gouvernance des données efficace implique (liste non exhaustive) :
- un appui fort de la direction de l’entreprise,
- une définition très claire des rôles et des périmètres d’intervention de chacun,
- des instances et des processus d’échange,
- des dictionnaires et des catalogues de données à jour,
- des indicateurs clés à la fois sur la qualité, mais aussi sur la valeur des données.
Il n’est pas indispensable d’être excellent tout de suite dans chacune des dimensions de la gouvernance. En revanche, il est nécessaire de travailler sur chacun de ces aspects dès que l’on songe à mettre en place une plateforme de données.
Le DataOps a l’immense avantage d’obliger à aborder ces points, organisationnels et métiers, en parallèle des aspects techniques.
Olivier Rafal est Principal Strategy Consultant de SFEIR. Ancien Vice-Président de Teknowlogygroup, il a été journaliste IT pendant plus de 15 ans et analyste et consultant pendant une dizaine d’années.