Kara - Fotolia
Le Big Data et la Data Science au service de la sécurité routière en France
La Prévention Routière vient de présenter un projet de type Big Data destiné à analyser le comportement des conducteurs et faire de nouvelles propositions en vue d'améliorer la sécurité des routes françaises. Une approche plutôt originale a été mise en place avec OpinionWay et Gfi Informatique.
Le 9 janvier dernier, suite au conseil interministériel de la sécurité routière, Edouard Philippe, le Premier ministre, annonçait une nouvelle stratégie afin d'améliorer la sécurité sur les routes. Si l'abaissement de la vitesse limite à 80 km/h a suscité beaucoup de réactions, un chapitre de ce plan d'action porte sur l'usage des nouvelles technologies afin d'anticiper les accidents. C'est tout l'objet de ce nouvel observatoire des risques routiers et de la mobilité. Ce projet est mené par l'association Prévention Routière, Attitude Prévention, qui réunit les assureurs français, l'institut des actuaires, OpinionWay et Gfi Informatique. Leur objectif est d'aller au-delà des données statistiques de l'ONISR (Observatoire National Interministériel de la Sécurité Routière). Anne Lavaud, déléguée générale de l'association Prévention Routière explique cette initiative : « Malgré leur grande qualité et l'indéniable valeur des séries longues sans rupture statistique, les causes et les facteurs d'accidents apparaissent parfois en décalage avec la réalité des comportements des automobilistes, cyclistes, motards ou piétons [...] Le développement des nouvelles technologies et des techniques du Big Data nous sont apparus comme des opportunités à saisir pour trouver des réponses à nos interrogations. »
Quand les enquêtes d'opinions sont confrontées au Big Data
De fait, l'Observatoire des risques routiers et de la mobilité se distingue des (très) nombreux observatoires qui publient des indicateurs dans à peu près tous les domaines imaginables. Créé avec OpinionWay, celui-ci va, très classiquement, être bâti sur des enquêtes régulières réalisées auprès d'un panel de 1000 français. Mais ce qui est beaucoup plus innovant : ces personnes vont disposer d'une application mobile qui va générer des données relatives à leur comportement de conduite. « Notre vision, c'est de continuer à faire notre métier traditionnel qui est d'interroger des échantillons de personnes, mais nous nous intéressons aussi au Big Data avec les données de nos clients ainsi que les données Open Data », a expliqué Hugues Cazenave, président d'OpinionWay.
« Croiser et hybrider les données permet de générer de la valeur », a conclu le fondateur de l'institut de sondage. Cette hybridation va surtout permettre de confronter les réponses des conducteurs au questionnaire qui leur sera soumis tous les 4 mois à leur véritable comportement sur la route. Car si tout le monde déclare respecter à la lettre le code de la route, la réalité est souvent toute autre.
L'application mobile dont seront dotés les panelistes assurera la remontée des données de conduite vers les serveurs de Gfi Informatique, partenaire technique du projet. L'ESN fournit sa plateforme Big Data gratuitement à l'association Prévention Routière, sous la forme d'un mécénat : « Participer à ce projet, c'est démontrer que les technologies du Big Data et d'IA peuvent être exploitées pour le bonheur et la sécurité des citoyens », a souligné Vincent Rouaix, PDG du groupe Gfi Informatique. « La corrélation des données permise par l'IA va donner une connaissance de l'état de la route. Nous travaillons sur les moyens de capter les données, soit au moyen de l'IoT, de caméras, du son afin d'améliorer encore la performance de captation. Nous travaillons sur les algorithmes d'intelligence artificielle afin de trouver de nouveaux usages, de nouvelles approches pour améliorer le quotidien de chacun. Une captation collaborative a aujourd'hui été mise en place auprès du panel, mais demain, nous irons vers une captation automatisée afin de sécuriser la mobilité dans notre quotidien. »
Une plateforme Big Data conçue par Gfi pour de multiples marchés
Cette plateforme est une démonstration du savoir-faire développé par Gfi Informatique dans le domaine du Big Data. Elle est le fruit des développements du laboratoire d'innovation parisien de l'ESN dirigé par Jean-François Gaudy, Chief Innovation Officer. Celui-ci a livré quelques détails sur cette plateforme : "Celle-ci ne s'appuie ni sur Hadoop, ni sur les bases NoSQL du marché. Hadoop par exemple n'était pas adapté pour une plateforme appelée à recevoir 1 milliard de données chaque jour. Cela aurait été à la fois très lourd et très couteux d'avoir des VM Hadoop dans le Cloud pour traiter ces données. Pour cette plateforme représentative de l'offre Daas (Data As a Service) de Gfi, nous avons préféré nous appuyer sur l'offre Cloud Microsoft Azure, avec le composant Azure Event Hub qui se charge de la collecte des données et Azure Data Lake pour le stockage. Tout ce qui vient au-dessus de ces briques techniques de base est développé par Gfi, avec notre propriété intellectuelle. »
Sur celle-ci, les Data Scientists de Gfi développent les algorithmes qui vont exploiter les données de comportement glanées via les smartphones des panélistes et les recouper avec des données tierces. « Nous corrélons nos données avec celles des infrastructures routières, notamment la signalisation disponible dans OpenStreetMap. Cela nous permet par exemple de calculer le temps d'arrêt du conducteur à un panneau stop. Nos données montrent que ce temps est souvent inférieur à l'arrêt de 2 secondes enseigné dans les auto-écoles. En déclaratif, le conducteur va déclarer s'arrêter aux stop, les données montrent que ses arrêts sont trop courts. »
De même, les Data Scientists peuvent déduire des données les franchissements de vitesse, mais aussi repérer les nids-de-poule sur une route lorsque des accélérations verticales sont repérées systématiquement au même endroit sur plusieurs véhicules. Autre donnée intéressante à analyser pour la sécurité routière, la vitesse angulaire des véhicules : « Nous sommes capables d'identifier les virages où la vitesse angulaire des véhicules est trop importante et corréler cette information avec la vitesse maximale dans ce virage. Si celle-ci est de 90 km/h par exemple, c'est un point dangereux et il faut sans doute limiter la vitesse à 70 km/h dans ce virage ».
Une plateforme qui se veut ouverte
Cette plateforme est accessible aux Data Scientists de Gfi, mais aussi à ceux d'OpinionWay afin de travailler sur les données en fonction de chaque étude. Néanmoins, le chef de l'innovation de Gfi évoque ouvrir ces données à des tiers : « Notre plateforme permet aux Data Scientists d'interroger nos données via Azure Analytics mais nous pensons qu'à l'avenir, des entrepreneurs pourront créer leur startup et valoriser les algorithmes qu'ils auront créés pour exploiter les données. Un Data Scientist pourra disposer de datasets anonymisés et représentatifs des données présentes dans nos Data Lake. Il pourra travailler sur ces modèles avec les outils de son choix, puis ceux-ci seront intégrés à notre plateforme pour être exécutés sur l'ensemble des données. »
L'équipe de Jean-François Gaudy travaille notamment sur les outils de monétisation de tels algorithmes. Cela permettrait de créer des écosystèmes autour des données stockées par les clients de l'offre Daas de Gfi Informatique. Municipalités, assureurs figurent parmi les premières cibles potentielles de cette offre Big Data qui vient se placer en concurrence avec les grandes plateformes IoT du marché.