beachboyx10 - stock.adobe.com
L’OM se transforme grâce à la donnée et au machine learning
Il n’y a pas que les grands industriels qui cherchent à adopter les outils numériques, les clubs sportifs aussi. Le département innovation de l’Olympique de Marseille a décidé de loger son lac de données sur AWS. Cette infrastructure est au centre de la transformation numérique du club de football.
Quand il est question de sport et du numérique, les technophiles pensent immédiatement à des moyens de suivre les exploits de leurs athlètes préférés grâce à l’IoT ou à la réalité virtuelle. Or cela renvoie à une fraction de l’activité d’un club professionnel. Celui-ci doit bien souvent gérer la billetterie, la comptabilité, les données des abonnés, des joueurs, l’inventaire des boutiques de merchandising ou encore le stade en lui-même.
« Quand je suis arrivé à l’OM il y a six ans, le digital se résumait à une application mobile, un site web et des comptes sur les réseaux sociaux », explique Frédéric Cozic, Head of digital transformation à l’Olympique de Marseille.
Les choses ont changé après le rachat du club par l’homme d’affaires Franck McCourt. « Le numérique a été alors perçu comme un levier de développement économique », estime Frédéric Cozic. « Nous voulions alors développer avec les canaux numériques que ce soit pour valoriser nos sponsors, vendre plus de billets, toucher des clients BtoB ou distribuer des produits dérivés ».
L’OM a pris un nouveau virage il y a peu plus d’un an. La nouvelle direction a pour ambition de hisser le club dans le top 15 du football européen. Cela ne passe pas seulement par les exploits sportifs. Il faut équiper l’entreprise pour soutenir l’ensemble de son activité économique et communautaire.
La quinzaine de personnes de l’équipe dédiée à la transformation numérique doit régir l’ensemble des technologies adoptées par le club afin de participer à la complétion de cet objectif.
« Mon équipe est positionnée en transverse du club. Nous sommes rattachés à la direction générale avec pour objectif de soutenir toutes les fonctions métiers que l’entreprise OM peut avoir, que ce soit pour accompagner les RH, la comptabilité, le centre de formation et l’équipe sportive. Nous sommes le garant des technologies en interne », déclare Frédéric Cozic.
Ce changement d’organisation a entraîné une réflexion autour des technologies et des outils utilisés par les différents métiers.
« Après un audit pour évaluer les briques technologies et les logiciels utilisés par l’OM, nous avons constaté que les licences étaient très anciennes ». Elles étaient pilotées directement par les métiers, il n’y a pas de DSI à l’OM, ce qui entraînait parfois des problèmes de doublons », estime Frédéric Cozic.
Pour rattraper les autres clubs européens « qui courent déjà très vite, la technologie a été vue comme un moyen de prendre des raccourcis ». Dans la construction de son projet technologique, la direction de l’Olympique de Marseille a imaginé ce dont elle aurait besoin en 2024. « 2024, c’est l’année des JO en France, du renouvellement des droits d’exploitation TV et possiblement du début de l’exploitation du parc Chanot [que Franck McCourt souhaite racheter] », explique le responsable de l’innovation à l’OM.
Recommencer de zéro
En 2019, la fin des contrats de licence a permis au club de football de « repartir d’une page blanche sans migration de l’existant ». « Nous avons établi un schéma d’architecture IT en identifiant des experts dans chaque brique métier. Nous avons étudié la manière dont ces briques pouvaient s’organiser entre elles afin de les réunir autour d’une brique data centrale qui sera disponible pour tout le monde », résume Frédéric Cozic. Cet élément central, est un data lake qui doit réunir l’ensemble des données en provenance des outils des différents pôles d’activité de l’OM.
« Nous faisons de la donnée une nouvelle ressource du club en adoptant volontairement une approche générique », estime-t-il. Le lac de données a pour vocation à réunir toutes les informations « qui gravitent autour de l’entreprise l’OM » : informations médicales des joueurs, données RH, comptables, variation des tarifs de la billetterie, etc. « Plus on en aura de données plus on sera fort », considère Frédéric Cozic.
Frédéric CozicOlympique de Marseille.
Techniquement, l’objectif est de faciliter la gestion des données des clients, leur suivi et permettre l’usage du machine learning.
Le pôle innovation s’est posé comme l’orchestrateur de ce ravalement numérique en internalisant une bonne partie de l’expertise sur la donnée. « Nous avons créé un pôle data avec un data manager, un data architect, nous sommes en train de recruter des data scientists », déclare le responsable de l’innovation.
Il fallait trouver le fournisseur de la brique centrale. L’équipe innovation a consulté les géants du cloud : Google, Microsoft, Alibaba et AWS. « Nous sommes allés les voir en leur racontant notre projet. Nous allons mettre l’accent sur notre positionnement particulier dans l’industrie du sport. Nous voulions établir une véritable collaboration et non pas simplement une relation de client à fournisseur », explique Frédéric Cozic. « Nous avons trouvé chez AWS un écho très fort parce qu’ils voient dans l’association du sport et du cloud un potentiel énorme », raconte-t-il.
Centraliser les données dans un data lake AWS
Depuis la fin de l’année 2019, l’architecture IT de l’OM est donc centrée autour d’AWS S3. Le déploiement a pris environ six mois au total. Il a été supervisé par les architectes du fournisseur de cloud. « Nous avons pris plus de temps pour établir des fondations structurées, scalables, prévues pour l’avenir avec les bons niveaux de sécurité, l’étanchéité entre les données, la gestion des accès, etc. », commente Frédéric Cozic.
Concrètement, le lac de données permet de stocker la donnée brute (bronze), transformée (silver) et affinée (gold). Il est alimenté par dépôt de fichiers ou par injection en direct. L’OM y a par exemple stocké six ans d’historique de données anonymisées en provenance de la billetterie. Les différentes applications métiers, l’application mobile et le site web sont connectés via API, géré depuis le service API Gateway. Une partie des données sont déposées à l’aide de Kinesis Firehose. Les données structurées sont stockées au sein du SGBD Amazon RDS afin que les diverses applications les exploitent. Pour faciliter la gestion des machines, l’équipe technique aidée par les techniciens d’AWS a choisi de maximiser l’utilisation des FaaS avec AWS Lambda, SQS ou SNS. Quand cela n’est pas possible, elle utilise les instances EC2.
L’équipe data utilise l’ETL AWS Glue pour transformer certaines données et Athena pour les requêter afin d’obtenir des analyses rapides. Quand il s’agit de gros volumes, les spécialistes de l’analytique optent pour de simples scripts ou Apache Spark.
Avant d’analyser de nouvelles données dans ce data lake, l’OM a d’abord changé son progiciel de billetterie Digitick par trois briques métiers. La première, le back-office, est proposée par DT Consulting qui accompagne également Roland Garros, le PSG, l’AS Monaco ou encore le FC Lorient. Le front office externalisé est géré par l’agence Wetix qui facilite la conception des tunnels de ventes. Enfin le club fait appel à Reachfive pour la gestion des identités et des accès clients. « Nous avons créé un OM ID qui est au centre de l’expérience utilisateur. Quelqu’un qui est connecté sur le site, l’application ou la boutique est identifié par un token ».
D’après notre interlocuteur, 100 % des données des comptes qui sont créés sont versées dans le data lake, tout comme les transactions liées à la billetterie et aux ventes d’accessoires. « Nous consolidons une fiche par client au sein du lac de données », détaille Frédéric Cozic. Dès lors, les analystes voient si un fan du club a acheté un billet, un maillot et s’il a parcouru les actualités sur l’application.
En 2020, le club souhaite se doter d’un outil pour visualiser cette fiche client afin d’obtenir la fameuse vision à 360 degrés, tout en respectant strictement la législation sur les données personnelles.
. « Le jour où nous aurons atteint cela, nous aurons une granularité d’informations sur nos clients qui sera très forte ». À l’avenir le club veut utiliser cette technologie d’identification pour mieux cibler une partie de ses 12 millions de fans et leur proposer des offres et des contenus adaptés à leurs envies. Le responsable de l’innovation se veut rassurant quant à l’utilisation des données. « Nous avons adopté nativement les recommandations liées au RGPD. Nous jouons la confiance avec nos fans et nous allons très prochainement mettre une gestion fine du consentement ».
L’OM veut prédire les ventes de billets
Toutefois, le cœur de la collaboration du club et L’OM repose pour l’instant sur la gestion de la billetterie. Le club veut adopter un modèle de Yield Management basé sur le machine learning. Cela permet d’améliorer la gestion tarifaire des billets qui donnent accès aux 65 000 places dans le stade Vélodrome lors des matchs. « Nous voulons faire du prédictif. Nous travaillons avec Mangrove [un partenaire d’AWS basé à Bordeaux spécialisé dans le machine learning] pour faire de la prédiction sur les ventes », détaille notre interlocuteur.
L’idée est de corréler des informations comme la météo, la disponibilité des places, les événements en cours dans la ville de Marseille, les résultats sportifs et un ensemble d’autres paramètres pour établir une stratégie de prix en amont des ventes. Là encore, l’Olympique de Marseille développe ses premiers modèles en se basant sur des briques AWS : DynamoDB et SageMaker.
« Aujourd’hui la tarification est basée sur de l’expérience interne. Nous voulons être capables de piloter les ventes cette année », affirme Frédéric Cozic. « Quand une billetterie représente plus de 10 millions d’euros par an dans le chiffre d’affaires, une augmentation de 2 % peut vite avoir un impact ».
Frédéric CozicOlympique de Marseille
SageMaker est également utilisé pour « accélérer » d’autres projets de data science qui sont en cours de préparation. DynamoDB est utilisé pour mettre divers modèles plus ou moins complexes.
Cette galaxie d’outils qui gravitent autour du data lake est par nature changeante. « C’est un projet sans fin ». L’équipe en charge de l’innovation prévoit de déployer le CRM Microsoft Dynamics et le service de data visualisation Power BI. Tous deux seront interfacés avec l’architecture gérée depuis AWS.
En parallèle, elle doit favoriser l’adoption du changement en interne. Cela passe par une démocratisation des enjeux de la donnée auprès des collaborateurs. « Nous consacrons beaucoup de temps avec les différents métiers. En 2020, nous voulons accompagner les forces commerciales dans l’adoption de ces nouveaux outils », conclut Frédéric Cozic.
NB : L’entretien avec Frédéric Cozic a eu lieu avant l’annulation ou le report des matchs de la Ligue 1 par la LFP à cause de la crise sanitaire en cours.