jim - stock.adobe.com

Les secrets d’ArianeGroup pour décoller vers le « Data Centric »

Passer d’une culture d’ingénieur à une culture Data, c’est le pari engagé par ArianeGroup. Le constructeur et intégrateur de la fusée Ariane 6 mise sur l’approche 3 + 3 + 3 pour accélérer le déploiement d’applications Data dans toute son organisation, avec des projets tant destinés à son activité industrielle qu’à ses fonctions support.

Confronté à la concurrence féroce de SpaceX, ArianeGroup a repris le chemin de l’espace avec Ariane 6. Et en coulisses, le fabricant européen de lanceurs a dû passer d’une culture très ingénieurs à une culture plus « Data ».

Cette évolution se retrouve directement dans l’IT du groupe. L’industriel manipule énormément de données et a pris conscience qu’il fallait commencer à la valoriser pour en tirer des bénéfices. « Nous sommes partis de plusieurs constats qui ont permis de construire une stratégie globale », résume Laurent Gallo, Chief Data Officer (CDO) chez ArianeGroup.

« Le premier est que la population des ingénieurs d’Ariane Group a une notion très relative de la valeur de la data. Pour eux, cela reste un concept générique qui n’est pas encore complètement entré dans les esprits. Nous avons l’habitude d’être très orientés technologie plutôt que valeur de la data. L’un de mes rôles est de faire prendre conscience de cette valeur avant de parler de technologies et d’implémentation. »

Un changement de paradigme en cours

La nature de l’activité du groupe impose des mesures de sécurité et de mise en conformité particulièrement sévères sur les données. Ces contraintes ont entraîné une grande fragmentation des environnements et un empilement de réseaux de niveaux de sécurité croissants.

« Cela nous empêche d’aller dans le cloud et nous pose aujourd’hui le défi de décloisonner tout cela », explique le CDO. « Nous sommes dans une approche très “Application Centric” et pas “Data Centric”. Mon défi est de retourner ce paradigme. »

Pour mener cette petite révolution interne, le CDO met en œuvre une approche basée sur 3 « enablers » [3 leviers, N.DL.R.] :

  • la gouvernance de la donnée,
  • un volet architecture et technologie,
  • et un volet acculturation du personnel.

Pour son architecture data, ArianeGroup a repris les concepts du data mesh, avec des data lakehouses on-premise, localisés dans les différentes directions (chacune ayant un data catalog) et interconnectés via des hubs de données.

Chaque direction dispose des outils de data science Dataiku. Le stockage cloud reste possible, mais pour quelques données non critiques.

De nombreux cas d’usage sont issus de la direction industrielle, mais les directions RH, achats, finance ne manquent pas d’idées : « toutes les directions ont besoin de valoriser leurs données pour en tirer de la valeur et accroître leur efficacité opérationnelle. », assure le CDO.

Face à la concurrence de plus en plus forte des lanceurs de satellites, ArianeGroup doit impérativement réduire ses coûts et accroître l’efficacité de ses process. Pour Laurent Gallo, ce virage vers la culture data peut y contribuer. « Nous commençons à faire de l’anticipation opérationnelle, c’est-à-dire non plus regarder ce qui s’est passé et ce qui se passe actuellement, mais ce qui va se passer. C’est ce que nous essayons de faire avec les technologies d’IA. »

Photo d'Ariane 6
L’IA est parfois présente là où on ne l’attend pas. Sur Ariane 6, celle-ci a permis de retirer du câblage réseau du lanceur, tout en assurant un monitoring optimal de ce dernier en wireless. L’IA optimise le réseau de capteurs et le deep learning est mis en œuvre pour traiter les signaux.

Les 5 piliers de l’étude d’un nouveau cas d’usage

Pour lancer un nouveau cas d’usage, le CDO parle de valeur avant de parler de technologie. Pour y parvenir, il a imposé un template commun qui sert à cadrer l’idée de projet. Ce modèle, le BRD (Business Requirement Dossier), consiste en 5 phases.

Le bloc « Business & Functional needs » constitue le pilier central de la méthode. Cette phase permet de définir ce dont le métier a vraiment besoin. « Tout le chemin de la donnée est matérialisé au sein des blocs de construction, avec des blocs représentant l’acquisition, le stockage, l’accessibilité, le traitement et la visualisation. On fait rédiger des "user stories" aux directions métiers pour qu’ils expriment ce dont ils ont vraiment besoin fonctionnellement ».

La seconde partie du BRD porte sur les sources de données qui devront être mises en œuvre. Cette analyse porte sur l’exploration des sources et la qualité de la donnée attendue.

L’architecture et l’intégration du futur projet dans le patrimoine IT existant s’inscrivent dans le troisième pilier de l’étude. « On décrit dans cette partie les nouveaux process métier enrichis du nouveau cas d’usage, le parcours de la donnée, la couche applicative, et la couche infrastructure. L’idée est d’avoir une traçabilité verticale entre toutes ces couches, de façon à avoir l’analyse d’impact de l’arrivée du nouveau cas d’usage data dans l’ensemble du SI. »

Viennent, enfin, les piliers « Value Proposition » et dévaluations des coûts. Laurent Gallo insiste sur l’importance de la partie Value Proposition dans le dossier : « dans cette partie, il faut définir ce que le cas d’usage va réellement apporter à l’entreprise en comparant les situations “as is” et “to be”. C’est un exercice compliqué et pas toujours simple à exprimer, mais sans Value Proposition, pas de cas d’usage. »

3 + 3 + 3

Dans la méthodologie mise en œuvre par ArianeGroup, l’équipe projet dispose de 3 jours pour établir les 5 piliers de son cas d’usage. Elle aura ensuite 3 semaines pour le prototyper et enfin 3 mois pour mener à bien l’industrialisation du PoC.

En phase de prototypage, tous les ingénieurs sur le chemin de la Data sont regroupés dans une salle du Labs d’ArianeGroup aux Mureaux, dans les Yvelines. Les data architects, data engineers, data scientists et les représentants des directions métiers sont réunis au même endroit pendant 3 semaines pour aboutir à un résultat.

À l’issue des trois semaines de travail, la décision de poursuivre ou pas est prise. « Dans le cas où le cas d’usage est validé, celui-ci passe en phase d’industrialisation. Une phase qui, en temps ordinaire, ne doit pas excéder 3 mois, même si des dépassements sont possibles selon les sujets traités ». Cette approche « 3 + 3 + 3 » permet « de cadrer les choses pour qu’un cas d’usage ne dérive pas pendant des années. »

Dans ce cadre, le data office doit capitaliser sur ces travaux afin que les capacités qui sont développées puissent être mutualisées et réutilisées. L’idée est de pouvoir s’appuyer sur ces capacités organisationnelles, applicatives et infrastructures pour traiter les nouveaux cas d’usage de plus en plus vite.

« Nous comptons déjà beaucoup de cas d’usage, notamment dans la partie industrielle », confie Laurent Gallo. « Nous cherchons à valoriser les données qui sont générées par nos machines pour accélérer et fluidifier notre modèle opérationnel interne. Ces données nous permettent d’aller vers de la maintenance prédictive, ou encore faire du prédictif sur la qualité des soudures », illustre-t-il.

Un autre champ d’exploration pour de nouveaux cas d’usage data se trouve dans l’espace. L’activité Geotracker d’ArianeGroup, rebaptisée Helix, compte une trentaine de stations d’observation situées dans le monde entier. Celles-ci surveillent le ciel, ce qui permet de cartographier la position des satellites. Une IA évalue leurs trajectoires et alerte lorsque l’un d’eux se rapproche dangereusement d’un autre.

Laurent Gallo, chief data officer chez ArianeGroup

« Notre objectif est d’aller de plus en plus vers une approche “Data Centric”. Nous sommes en train de réorganiser l’entreprise afin qu’elle soit plus responsabilisée dans les différents domaines métiers pour qu’ils aient une autonomie locale et puissent publier des produits data et les partager avec d’autres en confiance, en sécurité pour les responsabiliser, mais aussi fluidifier la création de ces cas d’usage métiers. Le data office doit favoriser cette collaboration et aller de plus en plus vite. »

Pour approfondir sur Big Data et Data lake

Close