Transformer une organisation avec la Data : la master class de Decathlon et de Crédit Mutuel Arkéa
Spécialistes des articles de sport et banquiers ont des activités différentes. Mais sur la valorisation des données, nombreuses sont les bonnes pratiques qu’ils partagent. Regards croisés entre le CDO du Crédit Mutuel Arkéa et le VP Data & IA de Decathlon.
Decathlon, Crédit Mutuel Arkéa, on pourrait être tenté de penser que tout les différencie. Ce n’est pas si sûr, en particulier concernant le sujet de la valorisation des données qui réunissait le 14 novembre plusieurs centaines de collaborateurs de la banque – en présentiel et distanciel – à l’occasion de son Data & IA Day.
Lors de cette journée consacrée avant tout à l’acculturation – ainsi qu’à certains chantiers menés dans le domaine de l’exploitation des données et de l’intelligence artificielle –, le groupe avait convié plusieurs intervenants extérieurs, dont Didier Mamma, le vice-président Advanced Analytics et AI Innovation de Decathlon.
Les quatre piliers d’une stratégie Data multisectorielle
Le dirigeant de l’enseigne de sport a pu ainsi confronter sa vision avec celle du Chief Data Officer de Crédit Mutuel Arkéa, Maxime Havez. Et malgré un positionnement sectoriel radicalement différent, les deux groupes se retrouvent sur les principaux piliers d’une stratégie de valorisation des données.
Ces fondations, la CDO de l’assureur Axa France, Chafika Chettaoui, en dénombre quatre :
-
- data architecture,
- data culture,
- data analytics (les usages),
- et data gouvernance.
Sur la culture, Decathlon et Crédit Mutuel Arkéa partagent de mêmes axes d’action, et au moins une barrière que constitue la résistance au changement.
« La culture est un objet complexe qui nécessite d’être travaillé sur la durée. [Chez Decathlon], nous avons mis en place ce que j’appelle un “arsenal”. », déclare Didier Mamma.
Et en la matière, la réponse se doit d’être sur-mesure pour chacun des personas du groupe. Decathlon compte en effet de nombreux métiers dont la sensibilité et les compétences sont très hétérogènes.
Didier MammaDecathlon
Une formation « de premier niveau », une master class, a été conçue pour diffuser des bases auprès du plus grand nombre. À cette entrée, Decathlon a ajouté un « Data Booster » – c’est-à-dire des parcours de formation pour les utilisateurs avec des modules spécifiques (ou « Data Journey ») –, qui renseigne par exemple sur la manière d’héberger ses données sur le Data Lake interne ou de contrôler la qualité des données produites par une application.
Ce Booster et ses parcours évoluent. « Il est essentiel de les faire vivre et de les adapter au fil du temps », insiste le VP Data & IA.
Pour transformer la culture en actions des métiers, Decathlon s’appuie aussi sur un Datalab regroupant deux pans (le Data Value Engineer et l’AI Lab).
Le Datalab est né d’un constat : les métiers sont source d’idées, mais ils peinent à les formuler. Au travers d’une approche de type Design Thinking, les Data Value Engineers accompagnent donc les utilisateurs business dans la formalisation de leurs projets et dans la mesure de la valeur qu’ils pourraient générer (via la méthodologie business Canvas).
La Data Culture s’inscrit dans le temps long
Maxime Havez se retrouve dans la trajectoire suivie par Decathlon sur la culture. « Nous ne pouvons qu’être d’accord sur la nécessité du temps long. Il n’est pas envisageable de se revendiquer entreprise Data Driven ou AI Centric de but en blanc », juge-t-il.
Inscrire la Data dans la culture de l’organisation – au même titre que le numérique ou la confiance – impose diverses actions et de se pencher sur plusieurs sujets, poursuit le Chief Data Officer. Il souligne ainsi la place prépondérante prise depuis fin 2022 par le thème de l’intelligence artificielle générative.
Ses initiatives, la banque les a initiées à partir de 2018/2019 au travers d’un « Programme Data » mené conjointement avec les ressources humaines. Il s’agissait alors d’identifier les principaux métiers et de proposer de premiers projets concrets, par le biais d’un format court, puis de proposer des formations pour celles et ceux qui souhaitaient aller plus loin.
Maxime HavezCrédit Mutuel Arkéa
Des formations d’une journée ont aussi été organisées sur des outils, pour par exemple développer la maîtrise du langage de programmation R, ou la sensibilisation à l’IA (une formation d’un format de un jour et demi qui continue aujourd’hui). Des certifications étaient aussi possibles.
« Mais nous ne pouvions pas nous arrêter là, même si les assets créés sont toujours disponibles et utilisés », indique Maxime Havez. Pour compléter son propre « arsenal », Crédit Mutuel Arkéa a élaboré des vidéos de sensibilisation. « Nous ne consommons pas tous la formation et l’information de la même façon », justifie-t-il.
Des journées thématiques sont aussi organisées, comme des matinées portant sur le conversationnel – domaine que l’IA générative promet de transformer – ou la blockchain.
La banque dispose aussi de son portail Data. Intitulé « go/data », il référence tous les supports d’acculturation. Mais son usage va au-delà. Il constitue un point d’entrée unique pour tous les sujets Data du groupe : architecture, IA, formations, actualités, retours d’expérience, cas d’usages, etc.
« Nous varions les actions. C’est un axe que nous allons devoir maintenir » fixe comme cap le CDO.
Pour diffuser la Data Culture, un sponsoring de la direction est aussi capital. À cette fin, des interventions dans des comités de direction sont menées, mais aussi auprès d’équipes fonctionnelles (là aussi, la GenAI suscite intérêt et réflexions partout dans l’organisation).
Data Analytics : pas de projets sans création de valeur
Sur les cas d’usage, les deux organisations rappellent qu’il est critique de mettre en place une organisation et une méthodologie adaptées. Le risque dans le cas contraire est de déployer des usages qui ne créent pas de valeur ou qui ne pourront pas être industrialisés.
Cette approche présente pour avantage d’éviter de « partir sur l’axe des stacks techniques à l’état de l’art, mais qui ne délivrent pas de valeur pour le métier », déclare Didier Mamma.
Trois ans plus tôt, Decathlon a d’ailleurs changé de méthode, en prenant pour point de départ les cas d’usage, qui déterminent ensuite les briques technologiques à adopter. « Le cas d’usage est la clé de l’adoption et de la compréhension par le métier du potentiel de valeur », continue Didier Mamma. « C’est nécessaire, mais pas suffisant. Il faut rapidement passer à la transformation ».
La donnée et l’intelligence artificielle peuvent optimiser des processus (logistiques, conception, etc.). Mais pour Didier Mamma, l’optimisation a ses limites. D’où l’importance de penser à la transformation avec la création de nouveaux processus « data-driven ». Une illustration chez Decathlon en est le Click & Collect, qualifié aujourd’hui de « très lucratif ».
Didier MammaDecathlon
Ce nouvel usage – aujourd’hui mis en place – a nécessité en amont une meilleure visibilité sur les volumes des demandes pour adapter le personnel en magasin chargé de la préparation des commandes. « Nous avons utilisé de l’IA et des séries temporelles pour que chaque jour les magasins soient informés du nombre de colis à préparer (avec un très fort taux de probabilité) », explique le VP.
Résoudre ce « pain » point a été un « quick win », se réjouit-il. Il arrive aussi que des frictions naissent lorsque les usages de l’IA transforment plus en profondeur. Mais Didier Mamma défend la valeur de ces « frictions pour être disruptif. »
Cette disruption, le lab IA de Decathlon a souhaité l’appliquer au domaine des fiches produits.
Sur le web, le commerçant est présent dans 60 pays. Les métiers envisageaient de faire rédiger et réviser les très nombreuses fiches des sites par des humains. Puis l’IA serait intervenue pour contrôler ce travail. Pour Didier Mamma, c’est l’inverse qui était préférable – encore plus avec l’IA générative.
« Nous avons eu beaucoup de débats », reconnaît-il. « Mais la machine présente deux avantages. Au premier jet, elle fait au moins aussi bien que l’humain. Et le modèle présente l’avantage de pouvoir être renforcé grâce au feed-back des superviseurs », ajoute-t-il en référence à la technique du RLHF ou Reinforcement Learning from Human Feedback.
Un Data Office copilote les initiatives transverses
Afin de transformer et de favoriser l’implication, le cadre de Decathlon défend l’importance d’un « accompagnement du métier. C’est lui qui va rendre possible la conception du processus. On parle de co-construction. »
Maxine Havez acquiesce. Data & IA « ne sont pas qu’un sujet tech, et loin de là ! La stack ne pilote pas l’identification des cas d’usage. »
Le Data Office remplit donc trois grandes missions :
-
- l’évolution de la plateforme (en intégrant entre autres le besoin de processeurs graphiques, par exemple pour l’IA Gen, ou en tirant profit des capacités du cloud Google),
- le recueil des cas d’usage,
- et la valorisation des données par le déploiement de Data ou d’IA Products.
« Nous ne sommes pas une multinationale comme Decathlon, mais nous comptons néanmoins des filiales et directions centrales dont les besoins et la maturité sont hétérogènes » compare le CDO.
Sa direction, rattachée à la DSI, co-pilote aussi des initiatives transverses comme sur la collecte des données extrafinancières, ou l’usage responsable et transparent des données clients.
Maxine HavezCrédit Mutuel Arkéa
« Sur l’IA de confiance, nous nous devons de sensibiliser au plus près des cas d’usage de ces technologies. » Sur l’intelligence artificielle générative, Crédit Mutuel Arkéa a ainsi fait le choix de développer son propre modèle open source – disponible sur Hugging Face – pour des questions de maîtrise technologique et de sobriété énergétique.
« Le fait d’avoir développé notre modèle, spécialisé en plus sur du français, permet de limiter drastiquement le recours à des GPU lors de son utilisation, là où un modèle comme ChatGPT en consommerait un très grand nombre », assure le Chief Data Officer.
À noter que les IA génératives grand public, comme ChatGPT, ne sont pas interdites dans l’entreprise. Elles sont en revanche encadrées par une charte, qui informe des risques et qui interdit leur utilisation avec des données confidentielles et sensibles.
Pour Didier Mamma, IA classique (de type machine learning) et IA Gen ne sont pas à opposer. Au contraire, « nous allons vers de plus en plus de modèles concaténés », constate-t-il.
Un exemple : le churn (ou attrition). Le ML permet de détecter ce risque. L’IA générative complète la détection en générant des messages personnalisés à destination des clients identifiés par le modèle anti-churn. Le potentiel est énorme, assure-t-il.
Éloge du « good enough »
Didier MammaDecathlon
Côté technologie, en revanche, Didier Mamma plaide pour le « good enough » (sic) – c’est-à-dire de retenir une solution technique moins avancée –, quand cela est nécessaire pour coller au niveau de maturité du métier.
Chez Decathlon par exemple, sur le renouvellement produit et le Product Scoring, le ML a été écarté pour le moment en faveur d’un tableau de bord – de l’analytics plus simple.
« Cela peut être vécu comme une frustration pour les Data Scientists. Mais cette première étape favorise une bonne adoption et rend possible, ultérieurement, la seconde étape avec du ML », justifie-t-il. « Il est important de ne pas viser systématiquement l’état de l’art ».
Concevoir des produits Data réutilisables
Autre enseignement, il faut que les données et les produits qui en sont issus soient réutilisables.
Maxime HavezCrédit Mutuel Arkéa
Dans cette optique, l’organisation Data évolue chez Decathlon comme chez Crédit Mutuel Arkéa. Les Data Offices ont ainsi la charge de concevoir des Data products (qui englobent les IA products et les Data-as-a-product) par exemple les données de stock – qui intéressent aussi bien la supply chain que les ventes.
Pour leur conception, le groupe s’organise autour de domaines métiers (supply, client, sport expérience, etc.). Chacun développe ses produits, mais ceux-ci sont prévus pour être « réutilisables et configurables » par les autres métiers et les autres pays. Decathlon développe ainsi des postes de Data Product managers.
En matière d’organisation, Crédit Mutuel Arkéa a un fonctionnement hybride qui combine à la fois un Data Office centralisé et des relais locaux ou décentralisés. Ce modèle favoriserait l’idéation au plus près du besoin, tout en offrant une expertise interne – accessible à tous – sous la forme d’un centre d’excellence.
« L’hybridation est un moyen de faire émerger le plus possible de produits Data et IA pouvant être mis au service du plus grand nombre de métiers. Au sein d’un groupe, réutilisation et mutualisation sont des enjeux très forts », souligne Maxime Havez.
Data Architecture
L’hybridation se retrouve aussi dans l’IT de la banque. Elle dispose de technologies Big Data hébergées sur ses propres infrastructures, mais elle consomme également des services managés sur le cloud public de Google (GCP). Même si pour des questions de réversibilité, de maîtrise et de coûts, Crédit Mutuel Arkéa peut limiter le recours à certains composants Google.
« Ce sont ces choix d’architecture qui nous ont permis de disposer d’un environnement pour développer nos propres modèles d’IA génératives », se félicite le CDO.
Chez Decathlon, le pilier de la Data Architecture est aussi central, même si les choix divergent. L’enseigne a d’emblée pris le parti du cloud avec deux prestataires.
Des questions « complexes » n’en continuent pas moins de se poser, prévient Didier Mamma. Comment impacter les décisions stratégiques des hyperscalers ? Quelle ventilation entre open source et make and/or buy ? Avec l’IA générative, l’anticipation du coût de calcul ou processing devient encore plus critique, compte tenu du besoin intense de GPU pour l’utilisation des Large Language Models.
La transformation d’une organisation n’est donc pas un long fleuve tranquille. Mais Decathlon comme Crédit Mutuel Arkéa le prouvent. En suivant de bonnes pratiques, on peut aller « à fond la Data » comme on va « à fond la forme ».