Comment Interflora compose sa stratégie « Data »

MyFlower, le groupe derrière Interflora en Europe, organise la transformation en profondeur de son architecture de données. L’objectif ? Établir un langage commun entre les métiers et les entités.

La marque Interflora, internationalement reconnue, est née en France en 1946 après la création de la Société Française de Transmissions Florales par l’Association des Fleuristes de France et la section française de Fleurop, un groupe né en Allemagne en 1908.

Aujourd’hui, l’enseigne représente un réseau de distribution de fleurs et de cadeaux regroupant près de 45 000 membres dans 145 pays. En France, la marque Interflora France est pilotée par le groupe MyFlower, contrôlé par PAI Partners. Celui-ci s’est étendu en Europe en rachetant d’autres possesseurs de la licence Interflora au Luxembourg, en Espagne, en Italie, au Portugal, au Danemark, et plus récemment, en Roumanie et en Suède. MyFlower compte environ 280 collaborateurs, gère plus de 4 millions de commandes annuelles (hors Suède) et orchestre un réseau incluant 7 000 fleuristes indépendants. MyFlower a également racheté le site cadeaux.com.  

« Interflora ne vend pas que des fleurs, nous proposons aussi des plantes, des chocolats, nous avons aussi une gamme de bières au Danemark. La bière de Noël, c’est quelque chose au Danemark », ajoute Vincent Faburel, Head of Data & Backend Products chez Interflora France.

Effet secondaire de cette décentralisation, la majeure partie des données du groupe résidait dans des silos.

« Les données étaient accessibles pour certaines personnes avec leurs outils, mais elles n’étaient pas consolidées ».
Vincent FaburelHead of Data, Interflora France

« Les données étaient accessibles pour certaines personnes avec leurs outils, mais elles n’étaient pas consolidées », raconte le responsable. « Quand ils échangeaient des données, des informations, des KPI, les métiers ne pouvaient pas les comparer, parce que rien n’était centralisé et il n’y avait pas de définitions communes ».

Avec les confinements successifs liés au COVID en 2020, Interflora France voit son nombre de commandes en ligne croître drastiquement. L’entreprise prend alors conscience que l’accès aux données et leur mise en qualité sont des enjeux stratégiques.

« Dites-le avec des… données » : la nécessaire mise en commun des KPI à l’échelle d’un groupe européen

Après avoir créé une équipe Data en 2020, inexistante auparavant, le groupe la renforce à partir de septembre 2021 en recrutant une Data Engineer et un Data Scienstist.

À l’aune des processus et de la connaissance des pratiques de l’entreprise, il a été décidé d’exploiter les données comme un moyen d’obtenir « un langage commun », selon les préceptes de l’approche Data Mesh. « Notre objectif, c’est de considérer les données comme des produits », martèle le Head of Data d’Interflora France.

Il fallait notamment que les entités se mettent d’accord sur plusieurs KPI concernant les statistiques de vente : le nombre de commandes réalisées la veille, le budget total, la comparaison avec le chiffre d’affaires l’année précédente, une première estimation de la marge brute et le taux d’annulation.

« Nous n’avions pas forcément le même sens de l’expression taux d’annulation, en Espagne, en France et ailleurs », illustre le Head of Data. « Désormais, nous avons la même définition pour tout le monde ».

Cette différence s’explique, entre autres, par le fait que sur le site Web d’Interflora France, il n’est possible de placer qu’un seul bouquet par commande. Si l’on supprime le bouquet, l’on supprime aussi les items associés. En revanche, sur cadeaux.com un panier peut contenir plusieurs cadeaux pouvant être retirés individuellement. « Si nous annulons un cadeau, est-ce une annulation ou une annulation partielle ? C’est à ce type de question auquel il faut trouver une réponse pour que tout le monde parle le même langage », explique-t-il.

Cela réclame beaucoup d’échanges avec les BU et les différentes entités, selon Vincent Faburel.

Pour créer ce langage commun, Interflora France a tout de même considéré que l’architecture de gestion de données devait être centralisée. L’équipe Data devient alors garante du support des demandes des métiers.

Si le défi principal concerne la gestion du changement, selon Vincent Faburel, notamment pour encourager les métiers à modifier leurs habitudes en matière d’accès aux données, il fallait d’abord mettre en place une architecture technologique qui répond à cette nécessité. Techniquement, cela réclame, en premier lieu, d’extraire les données de différents systèmes, de les transformer en vue d’afficher des indicateurs clés de performance aux métiers.

Un POC « avec les moyens du bord »

Dans un premier temps, à partir de septembre 2021, Vincent Faburel a orchestré un POC sur les infrastructures existantes en France. Il s’agissait de consolider les données sur une base de données PostgreSQL accessible par les équipes Data à travers l’outil de gestion de requêtes DBeaver et par les métiers via Power BI. Les processus d’extraction, de chargement et de transformation de données (ETL) et de reverse ETL, sont effectués à l’aide de Pentaho et de scripts Python. Crontab orchestre et programme les différentes tâches.

Dans un même temps, l’équipe Data accompagne quelques métiers volontaires dans plusieurs départements afin de les outiller et de les former à l’exécution de requêtes et la réalisation de rapports BI.

Ce pilote réalisé « avec les moyens du bord » convainc la direction. « La direction m’a demandé de reproduire l’exercice à l’échelle du groupe. Or chaque business unit avait ses propres systèmes, ses propres processus. Dans chaque nouveau pays, l’on recommençait de zéro », se rappelle Vincent Faburel.

En mai 2022, Decideom remporte par ailleurs un appel d’offres visant à assister cette équipe interne dans la mise en place de la nouvelle stratégie.

Avec Decideom, en juillet 2022, l’équipe Data lance un POC d’une durée de trois à quatre mois afin de déterminer les composants d’une plateforme de données modernisée. Après plusieurs tests, Interflora France choisit d’installer une partie de sa « Data Stack » sur Google Cloud, en privilégiant le data warehouse BigQuery comme espace de stockage.

Les pipelines de transformation de données sont revus au vu des exigences de la direction, en prenant en compte que l’équipe Data n’avait pas la bande passante pour développer tous les connecteurs requis afin de couvrir l’ensemble des pays dans le giron de MyFlower.

Dans ce deuxième orchestrateur de pipelines de transformation, Pentaho est remplacé par DBT sur Azure pour effectuer les transformations, tandis que les scripts python conteneurisés servent à orchestrer les opérations de reverse ETL dans les applications. Apache Airflow remplace Crontab comme planificateur des jobs. Il fallait trouver le moyen d’accélérer l’accès aux données brutes déversées dans le data warehouse avant d’être transformées et placées dans des data marts connectés à Power BI.

Moderniser la plateforme de données

Après quelques tests, l’ELT Fivetran et une solution open source sont les deux candidats privilégiés par Interflora France.

« Ce qui a convaincu notre équipe de choisir Fivetran, c’est qu’il gère nativement les changements de schéma », justifie Vincent Faburel. « Quand nous ajoutons un champ dans une table, Fivetran sait très bien le gérer et nous n’avons plus besoin d’intervenir. Avec les autres outils, nous devions refaire la connexion, la synchronisation, etc. »

Dernier point, Interflora France avait besoin d’un service managé et du support d’un éditeur. « L’on ne va pas se mentir, notre équipe est petite. Moi, j’ai besoin de réactivité et j’ai besoin que mes data engineers passent du temps à transformer les données », insiste-t-il.

À la fin de l’année 2022, la plateforme de données nouvelle génération et l’usine à pipelines de transformation entraient en production pour Interflora France, Interflora Luxembourg et Cadeaux.com. « Nous sommes allés très vite, car j’étais en lien avec les équipes françaises et je dirigeais le Back-end », explique Vincent Faburel.

En dehors de la France, ce processus de transformation des données est plus long. « Très rapidement, nous avons obtenu les données brutes via Fivetran. En revanche, nous avons dû travailler plus longuement avec les métiers afin de comprendre les données pour les transformer et les déverser dans les bons data marts connectés aux rapports Power BI ».

Exemple, au Danemark, afin d’estimer la marge brute, l’équipe Data a commencé par collecter les données en provenance de l’ERP, mais les responsables locaux avaient en partie réuni les données nécessaires à ce calcul au niveau d’une CDP. Or il manquait le « store-to-store », les opérations de transmissions entre fleuristes. « Toutes les données nécessaires se trouvaient en réalité dans le back-end e-commerce, ce qui réclamait de refaire les traitements ».

Les KPI financiers évoqués plus haut sont désormais calculés pour toutes les entités du groupe Myflower, hormis la Suède. « Nous allons doubler la taille de notre équipe et tenter de reproduire les rapports supplémentaires que nous avons construits pour la France dans tous les autres pays ».

Les premiers gains opérationnels bourgeonnent

Aujourd’hui, une vingtaine de connecteurs Fivetran sont utilisés pour extraire des données en provenance de 46 sources, dont SQL Server, Azure Functions, PostgreSQL, Google Cloud MySQL, Google Sheets, Google Search Console, Google Analytics, Amazon Ads, Criteo, Facebook Ads et d’autres. Le système ETL/ELT sert à synchroniser plus de 17 milliards de lignes par mois.  

Autant de sources qui représentent des back-end e-commerce, des outils de campagne marketing, un CRM, des ERP, etc.

Après transformation, les données permettent de nourrir plus de 200 rapports BI pour les départements marketing produit, acquisition, finance, expérience utilisateur, service client, et le réseau des fleuristes.

« Nous sommes en train de réduire le nombre de rapports et rationaliser la production de KPI. Cela réclame d’échanger avec les métiers pour trouver un équilibre entre les besoins exprimés et ce qui est réellement nécessaire pour l’entreprise », relate le Head of Data d’Interflora France.

Pour autant, le travail accompli porte déjà ses fruits. Outre un gain de temps pour l’équipe Data, l’architecture mise en place permet déjà d’accélérer la prise de décision et surtout de mesurer leurs effets.

« Désormais, un taux de réclamation anormal peut déclencher une réflexion sur la pertinence d’un produit. Par exemple, un bouquet peut ne pas plaire, il peut être difficile à faire ou les matières premières peuvent manquer. Grâce à la data, on peut réagir à la journée, arrêter un produit, en proposer un nouveau ou le retravailler », assure Vincent Faburel.

Industrialiser la démarche Data Mesh dans le reste de l’Europe

Au vu de la petite taille de son équipe, Vincent Faburel orchestre la mise en place de systèmes les plus robustes possibles. Il s’agit d’éviter les surprises lors des fêtes florales, comme en ce 14 février, jour de la Saint-Valentin. « Quand nous construisons quelque chose, nous faisons en sorte que cela fonctionne correctement et que les données soient rafraîchies toutes les 15 minutes quand cette fréquence de collection de données est pertinente lors des fêtes florales. Qui peut le plus, peut le moins », juge notre interlocuteur.

 « Nous n’avons pas voulu tout changer d’un coup. Déjà, il nous faut redonner le pouvoir aux métiers ».
Vincent FaburelHead of Data, Interflora France

La plateforme pilote, encore utilisée en production, devrait être décommissionnée d’ici la fin de l’année 2024.

Dans la nouvelle plateforme, si DBeaver est en cours de décommissionnement, Power BI devrait rester en place quelques années. « Nous n’avons pas voulu tout changer d’un coup. Déjà, il nous faut redonner le pouvoir aux métiers », poursuit Vincent Faburel.

Outre le fait de former les métiers pour enrichir eux-mêmes les rapports BI, l’équipe Data a pour charge de déployer un glossaire à travers un catalogue de données. 

Le groupe est aussi en train d’unifier le back-end e-commerce de l’ensemble de ses sites Web. Un nouvel outil de gestion du service client est en cours d’adoption. Tout cela demandera d’adapter les pipelines de données. Une fois les grandes phases du projet derrière elle, à partir de 2025, l’équipe Data espère pouvoir faire fleurir ses projets d’IA et de machine learning.

Pour approfondir sur Outils décisionnels et analytiques