TrainLine Europe reste fidèle à Dataiku

Grande rivale de Voyage-SNCF, Captain Train s'est fait un nom en France en revendant des billets de train grâce à un service ultra simplifié. Depuis, la startup a été rachetée par le britannique TrainLine, mais elle reste fidèle à Dataiku pour automatiser son activité analytique.

Captain Train est née en 2009, au moment où la SNCF a donné accès à son moteur d'achat de billets à des tiers. La startup est entrée en concurrence frontale avec Voyages-SNCF et a peu à peu étendu ses ventes aux services de transports par train ou par bus de 22 pays européens. Sa réussite a poussé son rival britannique TrainLine à prendre le contrôle du français en 2016 sur une valorisation de 200 millions d'euros. Captain Train représente désormais la marque britannique sur le continent européen et c'est bien la plateforme technique créée par Captain Train qui motorise aujourd'hui le service TrainLine Europe.

Captain Train, un service 100% Ruby

Techniquement, la réussite du français s'appuie sur un service ultra-efficace à l'interface très simplifiée. L'ensemble des développements ont été réalisés en interne sur la plateforme Ruby on Rails. Le fonctionnement du site TrainLine Europe met en œuvre des modules développé dans ce langage, sur le moteur de messagerie interapplicative RabbitMQ pour les échanges et sur la base de données PostgreSQL.

La particularité du service, c'est que TrainLine ne dispose pas de la base de l'ensemble des lignes de ses partenaires transporteurs ferroviaires. Lorsqu'un utilisateur du service effectue une requête pour trouver un billet de train sur le réseau de la SNCF, de la Deutsche Bahn ou de Renfe en Espagne, sas demande est transmise aux systèmes de billetterie destransporteurs qui renvoient une réponse à TrainLine. Ce dernier n'a donc pas à stocker sur ses serveurs l'intégralité des informations des transporteurs européens.

« Techniquement nous n'avons pas véritablement besoin d'avoir recours aux technologies que l'on a baptisé Big Data pour notre cœur d’activité » explique ainsi Cédric Raud, Développeur Full Stack chez TrainLine. En fait , l’entreprise a « lancé une initiative sur la Data voici deux ans maintenant pour [son] département marketing afin d'avoir une vision sur le comportement des utilisateurs et pour pouvoir analyser l'offre ferroviaire ».

Un besoin Big Data issu du marketing

Si TrainLine Europe arrive à supporter la charge avec des solutions "classiques", le département marketing, lui, a poussé la startup à s'intéresser aux technologies Big Data pour analyser les sources de trafic du site et l'efficacité des opérations promotionnelles.

A l'époque du choix de Dataiku, Captain Train n'avait qu'une petite structure avec 2 développeurs et un Data Scientist. « Les personnes qui travaillaient sur le SEO utilisaient Google Analytics, celle qui mettaient en œuvre les bannières utilisaient Google Adwords et DoubleClick, celles qui s'occupaient de l'affiliation utilisaient la plateforme Tradedoubler. Or nous avions un besoin d'avoir une vision sur nos coûts d'acquisition, sur nos paniers moyens. Toutes ces analyses étaient réalisées manuellement », des extractions à la mise en forme, en passant par le partage des résultats.

La tâche « occupait totalement notre Data Scientist ». L’expert de l’analyse statistique consacrait donc le plus claire de son temps à d’autres choses que celles « les plus génératrices de valeur ».

Les fondateurs de Captain Train ont alors cherché une solution. « L'objectif était que le Data Scientist puisse traiter ses données de manière totalement autonome, sans avoir recours aux développeurs. L'atout de Dataiku est de gérer le volet extraction, traitement et analyse de données mais aussi tout le volet préparation et analyse, directement dans l'outil. Tout est intégré, facile d'accès, là où les solutions Big Data plus classique nécessite des connaissances sur les outils et des compétences que nous n'avions pas en interne à l'époque ».

La solution Dataiku a été préférée à d’autres, comme celles éditées par Talend ou encore Omniscope de Visokio (dont les tarifs étaient peu adaptés aux moyens d'une startup).

« En plus du prix, l'avantage de Dataiku était aussi dans la modernité de sa solution avec la capacité d'héberger en interne une solution bâtie sur des technologies Web, ou la présence d'une brique prédictive intégrées à l'outil. C'est un choix que nous ne regrettons pas aujourd'hui car Dataiku continue à répondre à nos besoins ».

Les premiers usages de Dataiku chez Captain Train

Le premier projet à mettre en œuvre Dataiku a porté sur la performance des différents canaux mis en œuvre par l'équipe marketing pour conquérir de nouveaux clients.

Les pipelines d'extraction de données ont été modélisés sous Dataiku et, lorsque ceux-ci ont été jugés satisfaisants, ils ont été automatisés. C'est à dire qu’ils sont lancés chaque nuit afin d'alimenter une base de données dédiée aux analyses. « Nous avons développé en interne une brique logicielle qui nous permet de visualiser ces reporting. Cette brique permet à chacun de créer son propre rapport et donc de permettre aux équipes d'explorer cette donnée et d’identifier celles qui ont le plus de sens dans leur métier ».

Le second usage de Dataiku a été d'analyser le comportement des utilisateurs du service. Un moyen pour la startup de valoriser cette compréhension auprès des transporteurs et de faciliter ses relations commerciales avec ses partenaires.

La plateforme est alimentée par les données de production via un connecteur développé par Captain Train en Python. « Autre point très intéressant pour nous, Dataiku fonctionne aussi en mode collaboratif. Cela signifie que plusieurs personnes peuvent travailler sur l'outil, avec cette notion de comptes utilisateurs. On sait que tel Data Scientist est intervenu sur une partie d'un pipeline, qu'un développeur est intervenu sur une autre partie. C'est une bonne pratique, intéressante et très utile, pour assurer la maintenance des chaines de traitements ».

Cohabitation Franco-britannique dans le SI

Maintenant intégré à TrainLine, le système d'information de Captain Train cohabite avec celui créé par son alter-ego britannique - dont les choix technologiques sont assez différents.

Alors que le français privilégie la maitrise interne de son infrastructure, l'anglais a clairement misé sur le Cloud (Amazon Web Services) pour développer ses activités. TrainLine UK utilise en effet les instances Amazon EC2, une base Oracle sur Amazon RDS. Pour le volet Big Data, ses Data Scientists mettent œuvre Amazon Kinesis pour l'intégration des flux de données et des clusters Hadoop avec Amazon EMR.

La convergence des deux systèmes d'information n'est pas à l'ordre du jour. Mais Cédric Raud précise que Dataiku pourra – s’il le souhaite - se connecter à cette infrastructure AWS sans difficulté.

Pour approfondir sur Outils décisionnels et analytiques

Close