Comment Schneider Electric a lancé son offre data as a service
Le pôle Data Factory de Schneider Electric Digital fait le bilan positif d’une offre data as a service lancée il y a un an et demi. En parallèle, le groupe français ajuste son modèle organisationnel pour infuser la data science dans toutes les lignes de métier.
Équipementier, éditeur de logiciels et maintenant data broker. Schneider Electric, le spécialiste français de la gestion d’énergie, des installations électriques et des automates industriels développe depuis quelques années des appareils connectés. Outre la production de capteurs et de solutions matérielles répertoriés dans la gamme Exostruxure, Schneider Electric développe des logiciels pour traiter et visualiser les données issues de ses capteurs IoT.
Herveig Lecuyer, responsable du programme Data Factory chez Schneider Electric, connaît bien ces sujets. Il a participé au développement d’offres IoT du groupe. « J’ai beaucoup travaillé sur les sujets de remontées d’informations des disjoncteurs et des divers équipements que Schneider Electric installe chez ses clients vers les applications Advisor ».
« Depuis un an et demi, j’ai rejoint Schneider Digital, une entité au service des besoins internes et au développement d’offres basées sur le numérique », explique-t-il.
Le programme Data Factory était alors en phase d’incubation. « Ce programme avait pour objectif de transformer et de valoriser les données issues de nos offres digitales », indique Herveig Lecuyer. « Quand je suis arrivé, nous avons basculé en phase d’industrialisation, avec une approche orientée produit ».
L’activité de la Data Factory tourne autour de deux axes. Le premier vise à fournir des services additionnels aux clients de la multinationale. Le second consiste en une mission d’acculturation au traitement des données et d’adoption de la plateforme de data science en interne.
Ce programme de SE Digital a pour but de partager et de monétiser les volumes toujours plus importants de données issus de ses capteurs. L’objectif : lancer un projet de data as a service.
Azure, Databricks, Opendatasoft : les fondations de l’architecture data chez Schneider Electric
Et pour ce faire, la maîtrise de la plateforme de traitement des données et des pipelines était essentielle. « Pour monter cette architecture, nous nous sommes appuyés sur trois partenaires principaux : Microsoft, Databricks et Opendatasoft », affirme Herveig Lecuyer.
La Data Factory a respecté les décisions du groupe pour qui elle a déployé une architecture basée sur un Data Lake hébergé dans le cloud. « Nous avons un fort partenariat avec Microsoft Azure dans le monde de l’IoT », avance-t-il. Le pôle Data Factory a ensuite sélectionné Azure Databricks comme « plateforme de traitement des données et de collaboration des métiers de la donnée ». Ce choix a été fait conjointement entre Schneider Electric et Microsoft en 2018, selon le responsable.
La multinationale française utilisait déjà Opendatasoft pour des besoins internes. « En 2017, les data scientists du groupe voulaient mettre en place un datahub nommé Data Library pour réunir des jeux de données et accéder directement aux données », indique Franck Carassus, CSO et cofondateur d’Opendatasoft.
« Nous revoyons régulièrement l’architecture et nous posons un certain nombre de questions. Toutefois, nous ne remettons pas en cause nos fondations : notre socle est solide, nous souhaitons le faire évoluer, mais le pérenniser », affirme Herveig Lecuyer.
Les trois solutions animent désormais Schneider Electric Exchange, une plateforme de partage et de ventes de données issues des solutions IoT du groupe.
« Pour l’orchestration de nos pipelines de transformation de données, nous nous appuyons sur Azure Data Factory », précise Herveig Lecuyer. Les données sont emmagasinées sur Azure Data Lake Gen 2, puis préparées dans Azure Databricks. « Nous stockons les données à chaque étape de transformation : Bronze, Silver, Gold et Platinium éventuellement ». Cette catégorisation renvoie à la manière dont Databricks classe les données « raffinées ». « Cela peut avoir de la valeur pour différents rôles de récupérer des informations à différentes étapes de transformation », explique le responsable.
Les jeux de données préparés, parfois traités à l’aide d’un algorithme de machine learning sont ensuite transférés via API vers Data Library pour les usages internes ou vers Exchange, soit deux instances de la plateforme Opendatasoft. La plateforme logicielle de l’éditeur français permet aussi d’effectuer des visualisations de données en quelques clics. Schneider Electric propose quelques tableaux de bord à ses clients, mais préfère se concentrer sur le partage de données et l’exposition d’API. SE fournit la documentation nécessaire pour les utiliser, tandis qu’Opendatasoft sert de back-end à Exchange.
Les jeux de données disponibles dans SE Exchange peuvent être de différentes natures. « Dans le cadre de notre offre Excostruxure Facility Expert, des séries temporelles sont remontées depuis des compteurs électriques, d’eau et de gaz. Nous avons également des data sets listant des actifs – de marque Schneider Electric ou non – déployés sur un site d’un client ; nous diffusons aussi des streamings de données liés à des alarmes en provenance des actifs. Pour contextualiser le tout, nous avons des ensembles de métadonnées », liste Herveig Lecuyer.
Vendre de la donnée, tout un métier
Par exemple, les data sets proposés servent à un spécialiste de la certification pour noter le bilan énergétique de certains bâtiments. « Nous mettons à disposition les données sur Opendatasoft à un organisme, pour qu’il puisse exécuter son algorithme de notation et réaliser ses évaluations », indique le responsable.
D’autres clients employaient déjà les outils de dashboarding de Schneider Electric pour la gestion d’énergie ou pour la maintenance de leurs équipements. Ils s’abonnent désormais à Schneider Electric Exchange.
« Ce sont des utilisateurs traditionnels de nos solutions : un facility manager, un propriétaire de bâtiments, un patron d’usine, etc. », évoque Herveig Lecuyer. « Ensuite, nos partenaires téléchargent nos jeux de données pour les enrichir avec leurs expertises et proposer des services à leurs clients finaux. Un assureur peut souhaiter analyser les données liées à la gestion des stocks et des équipements de sécurité dans une usine, afin de moduler les contrats d’assurance avec ses clients en fonction des remontées d’informations », illustre-t-il.
Mais certains clients n’ont pas d’intermédiaires. Le responsable du programme Data Factory évoque le cas d’une chaîne de restauration rapide qui utilise le service Exchange pour traiter des données en provenance de ses restaurants afin d’effectuer des bilans énergétiques, les comparer entre eux et réaliser son bilan RSE.
Pour Schneider Electric, il s’agit d’appréhender les enjeux et les stratégies économiques autour de la valorisation de données.
Herveig LecuyerResponsable programme Data Factory, Schneider Electric
« Ce sont des sujets nouveaux pour nous. Nous essayons plusieurs modèles tarifaires. Par exemple, pour la solution Facility Expert, la facturation dépend d’un abonnement mensuel par site pour récupérer un sous-ensemble de nos jeux de données. Nous sentons qu’il y a la volonté de payer ».
Depuis 10 ans, Opendatasoft cherche principalement à favoriser le partage et la visualisation de données ouvertes. Il ne propose pas de module pour gérer la facturation des data sets. « Nous avons développé un système de monétisation dans Schneider Electric Exchange pour que les clients puissent souscrire à l’offre de son choix et se connecter via API », déclare Herveig Lecuyer.
Au total, environ 200 organisations utilisent la plateforme Schneider Electric Exchange. Pas moins de 195 data sets sont disponibles. « Nous sommes à plus de 2,3 millions d’appels API en 2021. Le bilan est positif et rassurant pour l’avenir. Cela montre que nous avons eu raison de nous lancer sur ce sujet-là », se réjouit Herveig Lecuyer.
L’idée derrière Schneider Electric Exchange a surgi entre 2015 et 2016, mais le groupe a mis près de cinq ans pour poser son architecture et bâtir son organisation chargée du traitement des données. « Concernant l’architecture technologique, nous avons essayé d’aller assez vite, d’autant que c’est un segment de marché nouveau pour Schneider. Cela a entraîné l’émergence de nouveaux métiers. Il fallait accompagner le changement », estime le responsable.
Déployer des instances dans le cloud n’est pas long. C’est maîtriser les couches technologiques, la gouvernance des données, la formation des collaborateurs et l’industrialisation des projets qui demande un effort continu, selon Herveig Lecuyer.
En l’occurrence, le déploiement d’Opendatasoft et le lancement du projet data as a service a posé des questions de gouvernance. « Ce qui a été compliqué technologiquement, c’est de configurer les systèmes d’authentification et les droits d’accès aux données suivant la typologie des consommateurs qui utilisent la plateforme accessible en self-service », remarque Franck Carassus.
D’autant que c’est la même architecture type qui est employée en interne pour favoriser le partage de données. « Cela fait plusieurs années que nous travaillons à améliorer notre gouvernance des données », déclare Herveig Lecuyer.
Ouvrir les silos de données
Que ce soit pour des usages internes ou externes, le partage des données a d’abord posé un défi pour les équipes de Schneider Electric.
« Les données IoT étaient silotées par ligne de métier. Chaque ligne de métier avait ses propres systèmes IoT, avait ses propres bases de données clients. Le fait de centraliser et de gouverner l’ensemble des données Schneider commence à nous permettre des intégrations que nous n’avions pas l’habitude d’avoir », explique le responsable de la Data Factory.
Ces intégrations visent à décloisonner les silos IT/OT. « Nous nous rendons compte que d’intégrer nos deux grands métiers que sont la gestion de l’énergie et des automatismes industriels fait sens », avance-t-il. « Si l’on casse ces silos, que l’on agrège les données de manière cohérente et transparente cela peut apporter de la valeur à nos métiers de la donnée et à nos clients ».
De la même manière, Schneider Electric a réalisé plusieurs acquisitions ces dernières années. L’entreprise a racheté des éditeurs de logiciels dédiés à la conception et à la gestion du cycle de vie des bâtiments. « [Ces entités] étaient assez étanches. Nous commençons à mettre en place des modèles de données afin d’analyser et de partager aux clients des informations tout au long de la vie d’un bâtiment ». Les jeux de données transformées seront mis à disposition depuis la Data Library propulsée par Opendatasoft.
Herveig LecuyerResponsable programme Data Factory, Schneider Electric
Un changement organisationnel en cours
Maintenant que les pipelines de données en production sont éprouvés et que l’offre data as a service sort de sa phase MVP, le pôle Data Factory veut ouvrir sa plateforme de traitement. « Il s’agit d’embarquer des data scientists et des data engineers dans les lignes de métier pour qu’ils puissent bâtir leurs propres pipelines de transformation de données. Pour cela, nous proposons notre expertise et nous ouvrons notre plateforme pour qu’elles puissent réutiliser un certain nombre d’assets : des librairies de transformation, des connecteurs, etc. », explique Herveig Lecuyer. « Cela demande de l’accompagnement et de l’acculturation auprès des différents métiers concernés ».
En clair, il s’agit, dans les termes du cabinet Quantmetry, de passer d’un modèle d’organisation centralisé à un modèle hybride. « Jusqu’à présent il y avait divers outils déployés, des compétences disséminées aux quatre coins du globe. L’intérêt, c’est d’avoir une plateforme prête à l’emploi, une expérience accumulée et des chemins d’embarquement pour préparer cette adoption », indique Herveig Lecuyer.
Pour conduire ce changement organisationnel, Schneider Electric est accompagnée par Accenture et Microsoft. Le groupe fait aussi appel à des ESN pour combler les rangs de ses équipes data, mais l’heure est à l’internalisation. « De 2022 à 2025, nous tablons sur une stratégie de recrutement importante et ambitieuse consacrée aux métiers de la donnée et de l’intelligence artificielle, que ce soit aux États-Unis, en France ou en Inde », annonce le responsable.