Vallourec : quand la data science devient un moteur de la production
Comme beaucoup d'industriels, Vallourec s'intéresse au Big Data tant pour optimiser ses procédures internes que pour délivrer de nouveaux services à ses clients. Pour booster sa stratégie, son DSI a fait le choix de se rapprocher d'une startup, Saagie.
Producteur mondial de tubes en acier sans soudure, le groupe Vallourec est très présent sur les secteurs de l'énergie et de la construction. On retrouve couramment ses produits dans l'exploration et la production pétrolière ainsi que dans la construction de grandes infrastructures, des machines spéciales, etc. Contrairement à ce que l'on pourrait penser, l'industrie lourde est elle-aussi confrontée à la transformation numérique, comme le souligne Barthelemy Longueville, CDO & CIO du groupe : « Nous avons toujours été innovants afin de nous différencier sur le volet produits, mais nous sommes aujourd'hui confrontés à un changement majeur dans notre industrie, à savoir l'arrivée majeure du numérique dans l'industrie Oil&Gas. Nos clients sont très demandeurs en données, de solutions associées aux données et cherchent à faire des gains de performances significatifs dans l'ingénierie des réservoirs par exemple, ou en production. »
Le Big Data, un moyen de progresser encore en productivité
Face à cette demande, le groupe a élaboré une stratégie Big Data qui permettra à la fois de répondre à la demande de la part des grands clients de Vallourec via de nouveaux services, mais aussi afin de réduire les coûts de production et d’accroitre les performances opérationnelles de ses sites de production. « Nous nous appuyons sur 7 gros sites de production dans 4 régions du globe et ces usines génèrent chacune pratiquement 1 To de données chaque mois. Il s'agit essentiellement de séries temporelles issues de capteurs qui représentent au final de gros volumes de données à traiter. »
Société plus que centenaire, les techniques de production de Vallourec sont déjà fortement optimisées, mais pour le CDO, le Big Data va permettre de franchir une nouvelle étape : « nous sommes passés par toutes les vagues d'optimisation avec de la productivité classique, de l'automatisation, du Lean Manufacturing puis Six Sigma, et aujourd'hui les Data Sciences appliquées aux Big Data nous permettent d'espérer atteindre des optimisations qui étaient jusqu'ici impossibles à obtenir, notamment en combinant des données issues de différents processus de fabrication. » Ainsi, il est possible de prédire l'apparition de défauts sur un tube en combinant les données des étapes de finition à celles de l'élaboration de l'acier qui a été faite bien plus en amont dans le cycle de production.
Un partenariat grand compte/startup pour aller plus vite
Pour mener cette stratégie, le poste de Chief Digital Officer est créé en février 2017 même si des initiatives locales ont déjà été lancées au niveau des différentes régions où le groupe est présent et bénéficient d'une certaine autonomie. Le Brésil est notamment très avancé avec un Data Lake déjà en production sur Amazon Web Services. Pour porter la stratégie Big Data du groupe, plusieurs alternatives s'offrent à Barthelemy Longueville : « parmi les solutions possibles, nous pouvions soit créer une architecture Big Data maison, soit nous appuyer sur une solution du marché éditée par des gros acteurs du secteur comme Hortonworks, ou encore aller vers des partenariats un peu plus créatifs comme celui que nous avons décidé de nouer avec Saagie pour l'Europe. »
Le CDO privilégie alors la solution d'un partenariat avec la startup afin d'accélérer le déploiement de la stratégie Big Data du groupe : « nous avions ainsi accès clé en mains à une plateforme "Big Data as a Service" avec des technologies à la fois packagées et entretenues par un éditeur. Notre réflexion porte aujourd'hui sur une approche hybride, en capitalisant sur ce qui a été bâti au Brésil avec un Data Lake opéré sur AWS, et vise à déployer plus largement notre partenariat avec Saagie pour assurer le volet Data Gouvernance et DevOps des projets Big Data. »
A la différence de nombreuses grandes entreprises telles qu'Air France ou Renault, Vallourec n'a pas fait le choix de créer un Data Lab centralisé mais de privilégier une approche régionale au plus près de ses usines de production. « Je suis fermement convaincu qu'il faut que les porteurs d'activités, que les opérationnels soient proches des Data Scientists, au plus près des problèmes industriels à résoudre. Cette culture industrielle et son langage doivent être partagés avec les Data Scientists afin d'aller vers des solutions au plus vite. »
Une stratégie hybride pour les différentes régions
Vallourec a mis en place un modèle distribué sur les différentes régions où l'industriel est présent. Reste à résoudre le problème de la mise en commun des initiatives régionales et c'est notamment le rôle de la plateforme Saagie.
La collaboration avec la startup a débuté par un hackathon de 3 jours mené en commun entre les équipes Big Data de Vallourec et les experts de Saagie afin de développer un premier concept. « Le point fort de Saagie est de raccourcir le délai entre l'idée et le premier MVP (Minimum Viable Product). Travailler avec Saagie nous donnait accès à une plateforme Big Data déjà configurée sans perdre de temps à installer un Data Lake Hadoop, de connecter d'autres briques technologiques, de mettre en place les droits d'accès, etc. »
En outre, l'industriel a pu influer sur la feuille de route de la startup afin que celle-ci corresponde à son propre plan de développement. Vallourec souhaite par exemple s'assurer que Saagie supporte Microsoft Azure, Amazon Web Services et, dans le futur, Alibaba car le groupe est présent en Chine. « Le troisième point fort était que Saagie allait jouer pour nous le rôle de plateforme collaborative entre nos Data Scientists internes mais aussi nos partenaires locaux qui nous font bénéficier de capacités supplémentaires en termes de Data Science. Ces Data Scientists additionnels devaient pouvoir rapidement avoir accès à notre plateforme et plugger leurs travaux. » Arnaud Muller, fondateur de Saagie, revient sur l'origine de ce partenariat : « Nous avons rencontré Barthelemy Longueville via la direction de l'innovation de Vallourec. Très tôt, nous avons constaté que Vallourec avait une vision long terme sur la donnée. Il avait dès le départ une appétence pour servir de la donnée tant en interne qu'en externe. Tout le monde y pense mais peu d'entreprises concrétisent véritablement cette vision. Vallourec connaissait déjà bien le sujet et était à la fois décideur et faiseur. »
Au Brésil, où un Data Lake était déjà en place, la plateforme Saagie va apporter une couche de gouvernance de la donnée avec une gestion des accès, des rôles, mais aussi la mise en place de processus qui vont faciliter les passages en production des modèles. Les Etats-Unis bénéficieront pour leur part d'une configuration assez proche de celle de l'Europe.
De multiples applications potentielles du Big Data
Suite au hackathon, Vallourec a signé un partenariat avec Saagie afin de couvrir les besoins de l'Europe et structurer un Data Lake essentiellement pour les besoins de la France et de l'Allemagne. Un programme baptisé Data Acceleration a été lancé afin de fédérer les partenaires Big Data de Vallourec sur la plateforme. Plusieurs projets sont menés de front en méthode agile par des équipes croisées Vallourec/Saagie.
« Nous avons choisi de commencer par des applications très complexes car nous voulions montrer le potentiel et la vitesse d'exécution de ce partenariat avec Saagie. Les premières applications ont été créées pour nos clients - de l'agrégation de données issues de multiples environnements et moins de Data Science. Il s'agissait notamment de données de traçabilité mises à disposition via une App. » L'objectif est de fournir aux clients de l'industriel des aides à l'utilisation des produits soit via du prédictif, soit de l'analytique. Si placer des capteurs connectés sur les produits fournis par Vallourec est difficile du fait des conditions d'usage extrêmes de ces tubes, l'industriel envisage de multiples cas d'usages, notamment pour aider ses clients dans les phases de construction.
« Un yard pétrolier (zone de stockage) peut être extrêmement vaste si bien que la géolocalisation des produits et leur identification sont une aide précieuse », explique Barthelemy Longueville. « Quand un pipeline est assemblé, des soudures orbitales sont réalisées aux extrémités du tube et la façon dont les tubes sont appairés entre eux est très importante pour garantir une bonne géométrie de soudage et des bonnes propriétés. Nous fournissons des données et des algorithmes qui délivrent une recommandation sur la meilleure séquence de tubes à assembler, quels sont les meilleurs angles d'appairage pour à la fois gagner du temps et de la performance. »
Si le prédictif est l'application la plus souvent évoquée lorsqu'on parle de Big Data, les outils fournis par Saagie aux Data Scientists et ingénieurs de Vallourec ouvrent à l'industriel de multiples autres applications possibles tant en interne que pour ses clients. C'est désormais une usine à modèles qui est entrée en production chez l'industriel.