Eurotunnel : les 5 piliers de Getlink sur les données et l’IA
En 18 mois, Getlink a mis en production une plateforme de données, avec pour réacteur Snowflake, et de premiers cas d’usage de l’IA axés sur la maintenance. Les prochaines étapes toucheront le temps réel grâce à l’IoT, l’open data et la « self-data ».
Getlink chapeaute quatre entités (Eurotunnel, Europorte, ElecLink et CIFFCO). Le groupe qui gère donc le Tunnel sous la Manche transporte chaque année entre la France et le Royaume-Uni 2,1 millions de véhicules de tourisme et 8,3 millions de passagers. Via Le Shuttle Freight, ses navettes dédiées au fret, elle achemine aussi 1,4 million de camions tous les ans.
Pour optimiser ses opérations de transport, Getlink a sanctuarisé un budget de 2,5 millions d’euros jusqu’à fin 2025. Cet investissement sera consacré au déploiement de sa feuille de route en intelligence artificielle axée sur la maintenance (prédictive) des équipements.
Pas d’IA sans fondations (la One Getlink Data Platform)
Mais pour conduire ces projets et bâtir son « AI Readyness », Getlink a dû construire ses fondations Data. Ces piliers, mis en place dans le cadre d’un plan de transformation, Morade El Fahsi, head of data du groupe, les a détaillés à l’occasion de la conférence Big Data & AI Paris 2024.
Le premier : l’identification des cas d’usage afin d’explorer les applications métiers pour les données de l’entreprise. Fondation de toute stratégie Data, la gouvernance de ce patrimoine constitue le second de ces piliers. Cette gouvernance se veut « globale » et implique les métiers.
Viennent ensuite le data management (qualité et mise à disposition des consommateurs dans une approche Data-as-a-Product), l’architecture (pensée pour la collecte, la structuration, le stockage et la diffusion de la donnée) et enfin l’acculturation qui vise « à faire comprendre aux collaborateurs l’importance de la data ».
Dans le cadre de la mise en œuvre de cette stratégie, l’entreprise s’est dotée d’une plateforme centrale, la « One Getlink Data Platform » décrite comme « la consolidation de tous les verticaux métiers ». Selon Morade El Fahsi, ce choix d’architecture présente pour bénéfices un « accès sécurisé », une « approche centralisée », l’efficacité de la gouvernance et la facilitation des usages de l’IA.
Sur un plan technologique, Snowflake constitue le cœur de la plateforme en tant que « data lake warehouse ». Sa fonction ne se cantonne pas au stockage des données. « Au-delà, Snowflake nous permet de tester des modèles d’IA, de procéder à de la prédiction sur la maintenance et la gestion de stock », confie le head of data, associé au sein de Getlink à un Chief Data Officer, Denis Coutrot.
Cortex, une couche IA pour augmenter les données
« Nous modélisons la donnée, nous la traitons, nous l’analysons. Et au-dessus, nous avons positionné une couche d’intelligence artificielle grâce à Cortex, un nom emprunté à Snowflake », ajoute Morade El Fahsi.
Cette couche est présentée comme un moyen d’augmenter les données avant de les exposer avec plusieurs briques logicielles du marché, dont PowerBI et Alteryx. StreamLit est aussi exploité. Le framework est destiné au développement d’applications directement connectées à Snowflake qui servent les usages de l’équipe Data et des métiers.
Pour valoriser son patrimoine, Getlink s’appuie donc sur une infrastructure dédiée, ainsi que sur une organisation « spécifique » à l’entreprise, selon Morade El Fahsi qui revendique une approche inspirée du Data Mesh et baptisée « Data Flower ».
Au cœur de cette fleur (cf. ci-dessous) se place la One Getlink Data Platform qui consolide l’ensemble des données nécessaires aux cas d’usage. Pas question, cependant, de réunir toutes les données de l’entreprise « pour éviter les erreurs du passé ». Des erreurs qui ont abouti à faire du Data Lake un « Data dépotoir ».
« Nous gérons notre data plateforme en fonction des cas d’usage. Ce sont eux qui définissent les données qui alimentent la plateforme », insiste le responsable. Cette démarche permettrait à Getlink de créer des produits Data adaptés aux différents domaines : opérations, finance, RH…
Des squads pensées pour favoriser les synergies IT et métiers
Toujours sur un plan organisationnel, le transporteur s’appuie sur des « squads » au nom de planètes. « Lorsque vous expliquez à un métier qu’il appartient à la squad Vénus, il s’identifie et cela favorise des synergies avec l’IT », soutient le head of data.
Les squads se composent en outre d’un chef de projet, d’un data engineer et d’un data analyst. La direction Data bicéphale constituerait un autre moteur de synergies. Le chief data officer, Denis Coutrot, est positionné du côté métier et supervise les data scientists comme les initiatives en IA.
Quant au head of data, il pilote la mise à disposition des données, la collecte et les infrastructures. « La synergie entre le métier et l’IT a fait qu’en 18 mois nous avons mis en production une data plateforme complète avec des cas d’usage et des tableaux de bord également en production », commente-t-il.
Quid justement de ces cas d’usage ? Ils portent sur les trois domaines fonctionnels principaux de Getlink que sont la safety (sécurité & surveillance), l’infrastructure (rails, matériel, caténaires, alimentation électrique) et enfin la maintenance & opérations (pièces, véhicules, etc.).
Chaque semaine, l’état de la voie dans le tunnel est cartographié. Ces inspections hebdomadaires sont utilisées pour la planification des ordres de travaux. L’entreprise a décidé d’axer ses efforts sur ces opérations afin de les qualifier et les classifier.
Anticipation des pannes en combinant IoT et IA
Les anomalies sont identifiées par des agents, équipés de tablettes, sous forme de verbatim. L’analyse de ces informations permet la classification des problèmes et de les diriger vers les bonnes équipes de maintenance (électricité, rails, etc.).
Dans le domaine de la maintenance, toujours, Getlink a mis en place un système d’IA dédié à la détection d’une anomalie spécifique : les freins serrés. Pour cette application, l’opérateur exploite les capteurs positionnés dans le tunnel et sur les trains. L’infrastructure IoT, qui préexistait, relève les températures. En cas de dépassement du seuil des 200 degrés, une alerte est automatiquement générée. La donnée est croisée avec une information remontée par le conducteur quant à l’utilisation du frein ou non.
Une température élevée sans usage du frein traduit un dysfonctionnement et déclenche alors un ordre de travaux pour freins serrés. Pour anticiper et programmer des maintenances, Getlink a fixé un seuil de détection à 100 degrés.
« L’un des objectifs est de garantir le bon fonctionnement et le service dans le tunnel », justifie le head of data. Pour répondre à cette même problématique, Getlink a par ailleurs développé avec Microsoft et Ekimetrics un assistant basé sur l’IA générative : Get GPT.
Get GPT, le compagnon des techniciens sur les procédures
L’outil est associé aux procédures de maintenance, nombreuses et complexes. « Cela permet aux agents, en posant une question en langage naturel, de générer la procédure correspondante ».
Morade El FahsiHead of data, Getlink
À la clé, le groupe constaterait des gains de productivité. « L’agent est orienté vers la bonne procédure et il n’a plus ensuite qu’à la suivre étape par étape. » Getlink identifie aussi un impact au niveau de la formation puisque les collaborateurs sont amenés à être formés non sur l’ensemble des documents de procédures, mais sur le bon usage de Get GPT.
En parallèle, l’industriel a conçu un programme de formation, piloté par le CDO. Les utilisateurs formés sont récompensés par des badges qui permettent un usage accru du ChatGPT interne. Les modules dispensés aux salariés portent sur différents sujets : sécurité, sensibilisation à la fuite de données, écriture de prompt, etc.
Self Data et Self BI
Getlink mène actuellement d’autres chantiers technologiques. Pour Morade El Fahsi, les priorités vont notamment à la transition vers le temps réel grâce à la création d’une passerelle entre IoT et IT, ainsi qu’à la Self Data – à distinguer de la Self BI, insiste-t-il.
Avec la Self Data, l’entreprise souhaite fournir aux métiers des produits data pour les rendre plus autonomes dans leurs usages et réduire les demandes aux équipes de la direction data.
À cette fin, Getlink « accélère l’ouverture de datamarts » fonctionnels.
Getlink prépare l’Open Data interne et un jumeau numérique
En complément, des utilisateurs clés, des ambassadeurs ou des champions sont identifiés dans les différents départements. La bonne identification de ces relais contribue à la remontée des cas d’usage pertinents.
Enfin, Getlink souhaite mettre l’accent sur l’open data interne, c’est-à-dire sur l’ouverture des données à ses 4 000 collaborateurs.
De son côté le chief data officer mène des travaux autour des jumeaux numériques. Le but est de concevoir un digital twin de la concession, « c’est-à-dire de l’ensemble du parc, à l’entrée et à la sortie du tunnel, ainsi que des navettes. »
La GenAI pas forcément prioritaire
À l’inverse, l’IA générative apparaît encore peu prioritaire pour le chief data officer, qui a choisi d’axer plutôt ses efforts sur la maintenance prédictive.
Getlink a établi une feuille de route IA qui se concentre sur le matériel roulant et sur une approche par processus. Une douzaine de cas d’usage prioritaires ont été définis. Le premier projet délivré en 2024 est celui qui portait sur la détection de freins serrés.
Sur l’IA générative, l’entreprise planche sur le volet adoption et sur celui du ROI, qualifié de « difficile » par son CDO Denis Coutrot. Selon lui, la GenAI fait émerger trois problèmes : l’exposition des données, la fiabilité et la précision des solutions, et la durabilité.
« Nous sommes face à un marché comptant pléthore d’offres et en constante évolution », témoignait-il en octobre lors d’un déjeuner organisé par Ekimetrics. Ces caractéristiques sont synonymes pour l’exploitant d’obsolescence rapide et de coûts élevés lors du « build » comme lors du « run ».
À ce stade, le data office a mis au point un premier agent conversationnel, avec une architecture RAG, focalisé sur la réglementation ferroviaire. Après deux mois de test, le CDO a cependant constaté un faible taux d’utilisation.
L’assistant était destiné initialement aux experts, qui s’avèrent finalement peu demandeurs d’un tel outil en raison de leurs connaissances avancées. Le CDO juge donc nécessaire de changer de cible pour toucher non plus les experts, mais un « deuxième cercle » d’utilisateurs.
Une fois cet assistant adapté et adopté, Denis Coutrot estime que Getlink disposera d’une première brique d’un assistant plus générique capable de couvrir les besoins d’autres populations.