Cet article fait partie de notre guide: Profession Data Scientist

7 questions à Franck Bardol, Data Scientist

Avec une formation initiale en gestion d’entreprise et en économétrie statistique, Franck Bardol est venu au métier de Data Scientist. Avec un profil mixte entre ingénieur de développement et analyste quantitatif, il est devenu consultant auprès des banques et des services financiers. Il est également co-organisateur d’une rendez-vous mensuel, animant ainsi une communauté d’experts de cette précieuse science des données.

Avec une formation initiale en gestion d’entreprise et en économétrie statistique, Franck Bardol est venu au métier de Data Scientist. Avec un profil mixte entre ingénieur de développement et analyste quantitatif, il est devenu consultant auprès des banques et des services financiers. Il est également co-organisateur d’une rendez-vous mensuel, animant ainsi une communauté d’experts de cette précieuse science des données.

 

LeMagIT : Comment décririez-vous le métier de Data Scientist ?

Franck Bardol : Il s’agit d’un profil multi-casquette qui nécessite plusieurs compétences. La première compétence est la programmation pour pouvoir programmer ses propres algorithmes. Puis arrivent les statistiques et les mathématiques. Pour utiliser les modèles mathématiques et exploiter les librairies pour la Data science, il faut tout de même avoir quelques notions d’un niveau de première à troisième année de Fac. A cela s’ajoute un peu d’intuition et du temps. Car on procède sur le mode essai - erreur. Cette profession repose sur une dimension très empirique […]

Les demandes seront différentes en fonction du profil de Data Scientist. On trouve par exemple beaucoup de mathématiciens et de physiciens qui se reconvertissent dans la science des données. On peut leur demander de concevoir l’algorithme, depuis le modèle mathématiques puis tous les enchaînements informatiques qui s’y greffent. Celui qui utilisera cet algorithme aura un profil différent.

Pour se dire Data Scientist, il faut avoir plusieurs casquettes. Celui qui n’aurait qu’une seule de ces casquettes, ne pourrait pas prétendre à cela. Il s’agit davantage d’un assemblage de compétences hétéroclites. Pour moi, la Data Science est une science inductive, une science de l’empirisme. On part des data et ce sont elles qui vont fournir le modèle. On cherche des corrélations et des structures qui existent au sein de la donnée. Une fois que l’on a trouvé ces corrélations, le Data Scientist ne vas pas forcément essayer de les expliquer. On va essayer de les réutiliser de façon à réaliser des prédictions.

 

LeMagIT : L’analyse est donc le travail d’une autre personne ?

Franck Bardol : Pas forcément. Le Data Scientist a construit le modèle mathématique et réalisé des prédictions - est-ce que le client, lors d’une prochaine itération, va rester fidèle ou alors partir ? Va-t-il acheter ou non, par exemple . Il connait le modèle, mais ensuite il y a de grande chance que ce modèle soit davantage entre les mains avec un profil de business developer ou lié encore au Marketing. Sur un axe davantage orienté métier.

 

LeMagIT : Avec cette spécificité où s’enchevêtrent plusieurs profils, la formation semble être nécessaire. Où en est-elle ?

Franck Bardol : Des formations commencent à se mettre en place. J’en ai moi-même suivi une, via le CNAM, en traitement de l’information. De nombreuses écoles d’ingénieurs s’y mettent également, comme Mines ParisTech, l’Ensimag (un cursus est prévu pour l’an prochain), plutôt orienté Big Data. Plus tourné vers le business, HEC Paris a également sorti un cursus. La première promo devrait sortir cette année. D’autres sur le modèle prédictif sont également en cours.

 

LeMagIT : Dans le cadre de vos prestations aux entreprises, rencontrez-vous d’autres Data Scientists ou s’agit encore d’une denrée rare ?

Franck Bardol : Je n’en rencontre pas énormément dans les entreprises. C’est plutôt lors de rendez-vous, comme celui que j’organise [il s'agit de la rencontre organisée par le Paris Machine Learning liant entrepreneurs, chercheurs et développeurs, NDLR] où , pour le moment, nous pouvons en rencontrer, plutôt que dans une entreprise lambda. A part chez de grands noms, comme Google, où on peut trouver un étage complet de data scientists. En France, ce n’est pas encore le cas.

 

LeMagIT :  Existe-t-il aujourd’hui des secteurs d’activités plus actifs que d’autres en matière de Data Science ?

Franck Bardol : Les services financiers et les assureurs y sont entrés différemment. Les premiers par les systèmes de trading et les seconds par la détection de fraudes. C’est par ces biais qu'ils ont intégré la data science à leur processus. La sécurité sociale et Pôle Emploi sont également très intéressés par la détection de fraudes, pour identifier les faux profils. Ils ont mis en place des algorithmes pour répondre à ces problématiques. Au départ, il sont venus à la Data Science sous la forme de Business Intelligence traditionnelle, reposant sur des entrepôts de données et de l’ETL, associé à l’intervention d’un analyste business. Mais l’arrivée de la Data Science et du Big Data est en train de révolutionner le secteur et de rendre quelque peu désuètes les anciennes méthodes.

Tous les domaines sont impactés par les Data Scientists. Dans la voyage (par exemple chez Amadeus), pour déterminer, par exemple, le meilleur moment de la journée pour changer le prix du billet. Dans les télécoms, j’ai participé à l’élaboration d’un modèle prédictif où l’on a intégré toute l’activité client d’un opérateur (combien de temps téléphone-t-il, à qui il téléphone, est-ce qu’il téléphone à l’international, téléphone-t-il à un service client). A partir de son profil, on parvient à déterminer à 95% de réussite s’il va quitter l’opérateur ou pas.

 

LeMagIT :  Voyez-vous les modèles économiques se modifier autour de la donnée ?

Franck Bardol : Complètement. De nouveaux modèles économiques commencent à émerger. Souvent auprès des start-ups, qui adoptent le modèle Freemium. De nouveaux usages autour de la données apparaissent. Les entreprises vont se rendre compte que les Data Scientists peuvent résoudre certains problèmes, mais également participer à l’élaboration de nouveaux services autour de la donnée. Les entreprises vont de plus en plus comprendre ce qu’on peut en faire. Les décideurs et les entrepreneurs vont mieux appréhender les cas d’usage.

 

LeMagIT : Quel est aujourd’hui le niveau de l’outillage du Data Scientist ?

Franck Bardol : Les outils sont aujourd’hui essentiellement Open Source. Il y a 3 ou 4 ans, il fallait tout recoder soi-même sur des logiciels très chers et coder l’algorithme. C’est aujourd’hui terminé. On trouve de bonnes librairies Open Source, comme scikit-learn, développée par des Français. Vous l’intégrez dans votre programme et vous pouvez directement utiliser des outils de Data Science. On trouve également des Web Apps, comme BigML.com. Cette application Web construit votre modèle. Vous devez juste lui donner en entrée vos données et vous lui indiquez les prédictions que vous souhaitez réalisez. Il fait le travail du Data Scientist.

Pour approfondir sur Formation