Cet article fait partie de notre guide: Comprendre le Machine Learning

Tour de France : les données en renfort de la Grande Boucle

La plus grande course cycliste du monde transforme l’expérience de ses fans et des téléspectateurs grâce à l’IoT, l’analyse de données et le Machine Learning

Jusqu’en 2014, la seule façon d’avoir de l’information en temps réel lors du Tour de France était de repérer rapidement les ardoises tenues par les responsables de la course, assis sur le siège passager d’une moto, filant au milieu des coureurs. 

Pour les fans habitués à être abreuvés de données et d’informations pendant les événements, que ce soit liés au football ou au tennis par exemple, l’expérience était quelque peu décalée. Les téléspectateurs avaient certes accès aux chronos ou pouvaient regarder la course à travers plusieurs angles de caméra, mais toutes les subtilités et tactiques de ces professionnels de la route restaient un mystère aux yeux des passionnés de cyclisme.

Mais cela est révolu. Cette année, les fans n’ont jamais eu autant de données à leur disposition, pour comprendre et analyser les performances de Chris Froome, ou des Mark Cavandish, dans les moindres détails et pendant toute la durée de la course.

A l’inverse des autres sports, confinés pour la plupart dans des endroits qui n’évoluent pas pendant un événement,  Le Tour de France  représente à lui seul un enjeu technologique, voire plusieurs enjeux.

Derrière cette façade, on retrouve Dimension Data, également sponsor d’une équipe qui participe à la course – Team Dimension Data. Mis à part l’impact promotionnel dû à ce sponsorship, la société profite également des conditions difficiles de la course pour apprendre et expérimenter des méthodes de traitement de données en temps réel, collectées depuis des capteurs – un environnement IoT en somme.

Chacun des 198 coureurs cyclistes démarrent la course avec un capteur attaché en dessous de leur selle. Ce capteur, qui pèse 100 g, contient un GPS, une puce radiofréquence et une batterie rechargeable, avec une capacité suffisante pour tenir le temps d’une étape.

Chaque capteur transmet les coordonnées GPS toutes les secondes, générant plus de trois milliards de références pendant la course. Dimension Data collecte des flux de données externes (comme la météo ou l’inclinaison de la route) et y associe les données temps réel du coureur et des données historiques glanées depuis le Tour 2015, date à laquelle la société est pour la première fois devenue le partenaire technologique de l’événement.

Résultats : les organisateurs de la course, les équipes, les chaînes de TV, les commentateurs, les fans et les téléspectateurs ont accès à une somme de statistiques détaillées sur l’avancée de la course ou encore sur leur coureur préféré. Et cela, via l’application mobile du Tour de France. Les cyclistes, de leur côté, portent des oreillettes à travers lesquelles leur équipe leur relaie ces données en temps réel, pendant la course – fini donc les ardoises !

Des indicateurs qui déroutent

Les fans les plus inconditionnels ont d’abord été surpris par les informations ainsi livrées, et surtout par leur niveau de précision. Par exemple, lors du tour en 2015, Dimension Data a publié un graphique montrant l’impact d’une chute sur la vitesse des coureurs et sur la décélération subites d’autres. Mais certains fans pensaient avoir mis le doigt sur une erreur : selon les données, certains cyclistes avaient plutôt accélérer suite à l’incident. Une étude approfondie a finalement montré que les vélos – auxquels sont attachés les capteurs – avaient été brièvement catapultés en avant lors de la chute.  Ces vélos qui semblaient ainsi accélérer étaient en fait récupérés par les équipes et leurs véhicules et conduits hors de la zone.

Autre exemple : lorsque les données prétendent que les coureurs atteignent des vitesses supérieures à 90 km/h. Une information jugé peu fiable pour certains. Mais les fans ont pu s’apercevoir eux-mêmes de la justesse des informations lorsque Cavendish a lui-même tweeté une photo montrant son compteur de vitesse – celui affichait une vitesse de 101,91 km/h.

Il se peut toutefois que les données comportent une bonne dose d’erreurs, comme ce fut le cas en 2015, lorsqu’un cycliste a brutalement été localisé au Kenya. Les données GPS peuvent en effet parfois être corrompues lors de leur transmission. Aujourd’hui, les données sont vérifiées et nettoyées avant traitement.

Des difficultés techniques

Reste que certains problèmes techniques doivent encore être résolus. Les courses cyclistes, comme le Tour de France, suivent des parcours difficiles, empruntant des routes de montagnes dans les Pyrénées et les Alpes, là où les réseaux mobiles peuvent parfois être faibles, voire inexistants.

Dans ce cas, les flux de données issus des vélos se reposent sur les signaux utilisés par les télévisions. Les données GPS sont transmises via un réseau mesh en utilisant les antennes installées sur les autos de la course qui suivent les cyclistes, le tout transmis aux hélicoptères de la TV. De là, les signaux transitent par un avion puis ré-expédiés vers les cars régie installés sur la ligne d’arrivée. Les données sont « libérées » du flux TV puis récupérées par le « camion Big Data » de Dimension Data, positionné sur la ligne d’arrivée.

La transmission par satellite est trop lente pour le Tour, explique Ettienne Reinecke, le CTO de Dimension Data. La société teste un réseau sans fil basse consommation, qui utilise LoRA pour créer ainsi ce qu’il baptise « une bulle sans fil » autour des cyclistes. Mais cela sera déployé sur une course à venir.

Les données collectées lors de chaque étape sont placées dans le Cloud de Dimension Data (les datacenters sont à Londres et Amsterdam) où elles passent à travers les algorithmes analytiques. Elles sont associées à des flux de données externes pour donner enfin les précieuses informations temps réel, envoyées aux TV, aux media sociaux et à l’application mobile de l’événement. Ce processus, de la bicyclette au spectateur, ne prend que 2 secondes.

La mise en place technique du dispositif n’aurait pas été possible sans le Cloud, du fait notamment que, par définition, une course cycliste se déplace. « La difficulté est que nous changeons d’endroit tous les jours », explique Pascal Queirel, DSI d’Amaury Sports Organisation, l’organisateur du Tour de France. « Nous devons déployer une technologie qui soit robuste et fiable. Aujourd’hui, nous sommes en montage et demain dans une autre ville. Les autres sports font un usage plus étendu des données. Nous devons faire de même. »

Interagir avec les fans

La technologie n’a jamais autant permis d’ouvrir Le Tour à de nouveaux fans.  Par exemple, en 2014, les vidéos créées par les organisateurs ont totalisé six millions de vue ; en 2016, cela est monté à 55 millions.

Pour Christian Prudhomme, directeur du Tour de France, « Aujourd’hui, les fans qui nous suivent veulent être complètement immergés dans l’événement. Ils sont très proches des réseaux sociaux et souhaitent une expérience enrichie, live et intéressante, en parallèle durant Le Tour. La technologie nous permet de transformer totalement leur expérience de la course ».

Cette année, Dimension Data a pour la première fois inclus à son arsenal des fonctions de Machine Learning, assure Peter Gray, directeur, Technology et Sports Practice, au sein de la société. Grâce à des algorithmes conçus par des experts en cyclisme, des data scientists et des analystes sportifs, le système est capable de faire des prédictions avant et pendant la course, à partir de données historiques et temps réel, et l’état de la course. « Le Machine Learning est le vrai cerveau de nos capacités de traitement. Il est à la base des corrélations et de l’intégration des différents types de données », assure-t-il.

« Avec ses algorithmes, la solution peut calculer en temps réel la probabilité d’éventuels événements durant la course – le peloton peut-il rattraper les échappés ? -  ou encore créer des profils de coureurs en fonction de leurs performances établies lors de courses précédentes », ajoute-t-il.

Après les 12 premières étapes de la Grande Boucle, Peter Gray assure que le système a pu identifier à six reprises le vainqueur de l’étape.

Avec ce caractère mouvant de la course, la technologie est elle-aussi mise à jour en continu durant la course. Dimension Data a mis en place une équipe DevOps et des cycles de développement de 24 heures. Par exemple, la mise à disposition de nouvelles dataviz : celles-ci sont programmées en Australie et testées à Hong-Kong avant d’être envoyées en production vers Londres et Amsterdam pour la prochaine étape.

Les enjeux culturels

Si des utilisations plus avancées des données sont envisageables dans le futur, il reste encore des problèmes d’ordre techniques et culturels à résoudre.

Des tests ont par exemple été menés pour installer des caméras GoPro sur les cyclistes. L’idée est de filmer la course en immersion, en proposant une vue identique à celle du coureur. Mais comme l’indique Peter Gray, le poids, l’autonomie de la batterie, la connectivité et la bande passante disponible pendant la course sont autant de difficultés qu’il convient de surmonter.

Les coureurs sont également équipés de capteurs biométriques pour contrôleur leurs performances physiques. Mais ces données sont aujourd’hui conservées par les équipes – imaginez l’avantage que cela peut avoir sur un autre coureur si l’on sait que celui portant le maillot jaune affiche un rythme cardiaque anormalement haut, montrant ainsi qu’il a atteint ses limites.

Team Dimension Data a bien testé la publication de ces données biométriques lors du Tour de Californie 2016. Mais Il n’existe actuellement aucun accord entre les équipes pour que de telles informations soient rendues publiques à grande échelle.

 

 

Pour approfondir sur Outils décisionnels et analytiques

Close