À l’ère du streaming vidéo, TF1 muscle ses jeux de données
L’audience graph de TF1 Plus rassemble les profils de 25 millions d’utilisateurs et leurs habitudes de visionnage. Une aubaine pour les marques… et un enjeu de transformation à marche forcée pour le groupe média.
Netflix, pionnier de la SVOD, est souvent cité comme modèle de l’économie numérique, bien qu’il ait commencé comme loueur de DVD à distance avant d’abandonner cette activité en 2023. Son succès a inspiré des géants comme Amazon, Disney ou Warner qui cherchent à s’imposer sur ce marché fortement concurrentiel.
Or, la multiplication des plateformes et la baisse des audiences hertziennes ont favorisé l’apparition d’offres de SVOD affichant des encarts publicitaires. En contrepartie d’un forfait à prix plancher, les usagers voient leurs séries et films préférés entrecoupés de réclames. Un modèle qui n’a finalement rien de nouveau pour les acteurs de la télévision traditionnelle. Eux aussi ont tenté de suivre le mouvement opéré par Netflix, d’abord en proposant des plateformes de « replay », donc de visionnage à la demande en sus des plateformes VOD plus traditionnelles. La transition fut rude, mais le retour de la publicité chez les concurrents payants, couplé à la hausse de qualité des contenus produits, leur donne un nouvel élan. C’est le cas de TF1.
Le groupe français séduirait plus de 33 millions d’utilisateurs par mois avec sa plateforme de streaming TF1+, dont 25 millions ayant créé un compte. La formule tient en la présence des programmes forts du média (Star Academy, The Voice, la reprise de Plus belle la vie, le flux TV en direct, etc.), d’une centaine de films (soit un peu moins que Prime Video) et de 200 séries avec une empreinte forte autour de séries comico-policières « maison » (HPI, Panda, Commandant Saint-Barth). Ici, l’accès est totalement gratuit en contrepartie des publicités et d’une qualité de streaming moindre. Il existe également une offre payante, sans publicités et avec l’accès en avant-première à certains contenus (par exemple, le visionnage des épisodes de HPI avant leur diffusion en prime time).
La diffusion de publicités et la relation avec des annonceurs n’ont pas de secrets pour TF1… sur sa chaîne linéaire. Si le groupe a pu reproduire en partie son modèle avec sa plateforme de replay, il a fait le constat qu’il fallait adapter son modèle aux nouvelles pratiques marketing et de consommation de contenus.
Les données au cœur de la guerre du « temps de cerveau humain disponible »
« Avec une plateforme de replay, les données ne représentent pas un enjeu central, il n’y a pas vraiment d’intérêt à reconstituer une base d’usagers, à l’animer », explique François-Xavier Pierrel, group chief data & Adtech officer chez TF1 depuis octobre 2023. « Quand vous êtes dans la nouvelle trajectoire qui est celle d’une plateforme de destination, et qu’au moment où un utilisateur veut regarder du contenu, il a le choix entre Prime, Netflix, Disney – pour ne pas reprendre l’expression très maladroite de Patrick Le Lay, je préfère dire qu’il n’y a toujours que 24 heures dans une journée – à la fin, il faut que l’on trouve une place dans ce moment où l’usager se demande “quelle plateforme vais-je consommer ?”. Et là, la data devient centrale ».
Les données servent principalement à deux choses. À commencer par l’amélioration de l’expérience utilisateur. « Une partie du travail de mon équipe consiste à développer l’algorithme de recommandations et la poursuite de lecture, ainsi que de reprendre les grands standards de plateformes de streaming », explique le directeur des données chez TF1.
Ainsi, cette équipe a souhaité mettre sur pied un algorithme de recommandation qui évite le « piège » de l’enfermement dans un type de contenu, un phénomène observable sur Netflix et Instagram, entre autres.
L’autre usage des données vise à monétiser la plateforme de streaming. « Le positionnement de TF1 repose sur l’idée de proposer une plateforme de qualité, offrant du contenu premium gratuit, financé par la publicité », résume François-Xavier Pierrel. « Contrairement aux plateformes américaines qui adoptent une approche descendante vers des modèles gratuits ou hybrides, TF1 part d’un modèle gratuit qu’il fait évoluer vers une monétisation capable de financer sa trajectoire ».
« La “data” permet de promouvoir le bon contenu auprès de la bonne personne, au bon moment, sur le bon appareil, en s’appuyant sur son historique. Parallèlement, elle est essentielle pour optimiser la monétisation et couvrir les coûts de production des programmes », poursuit le chief data & Adtech officer.
Donner de la place aux métiers
Évidemment, un tel constat réclame des évolutions organisationnelles et techniques. De fait, la gestion de la publicité et de TF1+ dépend d’entités séparées. Et qui dit silos organisationnels, dit souvent silos de données.
« La première chose que nous avons faite, c’est de faire comprendre à nos deux métiers (la publicité et TF1+) qu’à la fin un utilisateur est… un utilisateur », évoque François-Xavier Pierrel. « Celui qui voit l’écran de pub, celui qui consomme Grey’s Anatomy ou HPI, c’est toujours le même usager. Donc l’on ne peut pas avoir deux jeux de données, deux segmentations différentes, et finalement deux écosystèmes en parallèle ».
L’équipe responsable des données a donc décidé d’opter pour un modèle de données orienté graphe. « La connaissance utilisateur repose sur un identifiant stable auquel je lie son comportement : la consommation de contenu, sa fréquence de visionnage, ses horaires de connexion, le type d’écran utilisé… en prenant pour point de départ le respect du RGPD », explique le directeur de données. « Nous ne sortons pas de ce cadre-là, il n’est pas question de trahir la confiance des téléspectateurs ». Ce modèle graphe est le moteur de Graph:ID, une architecture rassemblant les données internes et externes (via 15 partenaires) des utilisateurs permettant de trier les profils suivant une centaine de critères et 1 300 segments.
« Nous avons consolidé toutes les informations disponibles sur l’utilisateur pour construire une base solide, à partir de laquelle nous pouvons activer nos différents écosystèmes. D’une part, cela nous permet d’utiliser des plateformes d’automatisation marketing pour communiquer sur divers supports comme une télévision connectée, un smartphone, un écran web, ou d’autres canaux. D’autre part, ces données enrichies grâce aux interactions sont segmentées et monétisées pour des partenaires propriétaires de grandes marques ».
Techniquement, Graph:ID repose sur une plateforme Snowflake, par-dessus un espace de stockage Azure, couplé à un CRM – Braze – et un outil de push notification flambant neuf. En amont, les données des partenaires et en provenance des équipements des usagers (70 écrans différents) sont ingérées avec les outils Azure, puis stockées sur le « Data Cloud ». La segmentation est réalisée avec des outils tels que OneTrust (conformité de l’entité), Piano et la DMP/CDP Mediarithmics.
En sortie de Snowflake, les équipes de TF1 peuvent exploiter les données pour optimiser le ciblage publicitaire et l’engagement utilisateur via des campagnes multicanaux (vidéo, audio, email, push) et des analyses avancées (IA, ML). En externe, le groupe peut partager ces données en partie grâce aux cleanrooms de la plateforme Snowflake. Un autre outil d’échange de données est utilisé en interne.
« Nous avions déjà Snowflake qui est une bonne voiture de course, mais nous l’utilisions plutôt pour rouler dans les champs. Avec les équipes de Snowflake, nous avons restructuré nos données afin de proposer quelque chose d’intelligible et de connectable à notre écosystème ».
François-Xavier PierrelGroup Chief Data & Adtech Officer, TF1
Cela devait se faire avant le lancement de TF1 Plus, soit il y a presque un an, le 8 janvier 2024. « Pour filer la métaphore automobile, nous devions changer les roues de la voiture pendant qu’elle roulait », s’amuse François-Xavier Pierrel.
Pas question de partir d’une nouvelle plateforme de données, donc. « Je pense que ça aurait été une grosse bêtise de repartir de zéro. L’idée était plutôt d’évaluer l’existant. Nous avions Azure qui, peu importe si on l’on aime ou pas, est efficace », considère le responsable.
Passer de 1 200 tables à 33
Il fallait en revanche revoir l’usage de Snowflake. « Nous avions aussi du Databricks. Il y avait un peu de chevauchement, mais nous avons décidé de faire de Snowflake le cerveau de Graph:ID ». Databricks est utilisé pour les charges de travail IA/ML plus avancées. « Nous avons aussi des engagements contractuels, l’on ne peut pas défaire tout du jour au lendemain ».
« Nous avons un enjeu d’équilibre et de passe-plat entre Snowflake et Databricks qui fonctionnent plutôt bien », estime François-Xavier Pierrel.
Pour Graph:ID, Snowflake répondait « pile-poil » au cahier des charges. Mais le gros du travail a consisté à faire le ménage dans les 1 200 tables présentes sur la plateforme pour revenir à une « trentaine de tables bien structurées » constituant le cœur de la connaissance utilisateur.
Cet effort dépendait davantage de la prise de besoin auprès des métiers afin de remonter les indicateurs clés de performance, intéressant à la fois les responsables derrière la plateforme de streaming et le département publicitaire.
François-Xavier PierrelGroup Chief Data & Adtech Officer, TF1
« Au lieu de travailler de manière isolée en mode expert, nous avons choisi de collaborer étroitement avec les équipes métiers. Cela nous a permis d’aborder des problématiques variées : business, métier, analyse, qualité, et bien sûr la conformité avec le RGPD », insiste le chief data & Adtech officer. « Nous avons restructuré nos processus pour garantir une conformité totale. Par exemple, si un utilisateur souhaite que ses données soient retirées de nos bases, cela doit être possible immédiatement, sans discussion. De même, si nous devons supprimer 2 millions d’adresses hors délai de 24 mois, cela doit être fait sans hésitation. Une fois cette conformité solidement établie, elle se transforme rapidement en levier pour créer de nouvelles opportunités business ».
Le projet d’audience graph a été assisté par l’agence Artefact. « Artefact nous a permis d’être très méthodiques et méticuleux, afin de tenir les délais tout en proposant une solution pérenne et évolutive », déclare François-Xavier Pierrel. « Cela nous a pris neuf mois, en parallèle du changement de CRM, de l’ajout d’un Ad server, et de la révision de notre gouvernance de données ».
Ce délai relativement court pour un projet de cette envergure résulte également d’un sponsor des directions concernées et d’une faible résistance aux changements des métiers, note François-Xavier Pierrel. « Si nous n’avions pas mené ce projet, nous n’aurions pas été dans la bonne ligne d’eau pour être comparés avec les meilleurs du marché », tranche-t-il.
Dans cette architecture, Snowflake est principalement cantonné à son rôle historique, celui d’un data warehouse/lakehouse. « Nous regardons évidemment les autres briques de la plateforme. Nous testons par exemple Cortex afin de donner aux métiers un moyen d’interroger les requêtes en langage naturel », évoque le directeur. « Au vu des coûts qu’elles représentent, il est certain que nous ne pourrons pas conserver toutes les plateformes ».
François-Xavier Pierrel fait davantage la distinction entre les offres des fournisseurs de cloud des plateformes de données plus spécialisés, comme Snowflake, Databricks ou Dataiku. « Au vu de la place de Snowflake dans le projet Graph:ID, il semble disposer d’une longueur d’avance chez nous ».