Cet article fait partie de notre guide: Profession Data Scientist

Big Data : des métiers qui inventent le mouvement en marchant (1ère partie)

Les projets démarrent. Les compétences se forgent en grande partie on the job, sur le terrain. Pour quels (nouveaux) métiers, au delà du profil le plus médiatisé du data scientist ?

Trois cursus, une bonne centaine d'engagés : le premier bataillon français de futurs spécialistes du big data est en cours de constitution, via la formation. Avec beaucoup plus de volontaires que d'élus dans chacun des cas. Signe d'un certain empirisme caractérisant ce marché naissant, ces cursus proposés par HEC, Telecom ParisTech ou l'éditeur SAS, sont montés avec des entreprises partenaires. Et répondent à des motivations différentes. Pour quels débouchés-métiers précisément? (Ce sera l'objet d'une 2ème partie).

 

Pour le MBA associant HEC Paris et IBM, la cible est celle de la stratégie d'entreprise. Soit, pour la première promo – 55 futurs analystes business, décideurs ou consultants – que la formation théorique et pratique (études de cas), entend préparer à une approche transverse, caractéristique des projets big data. « Pour être profitable, une telle formation est destinée à des personnes qui se sont déjà frottées à la vie de l'entreprise », souligne Josiane Gain, responsable des relations universitaires d'IBM France. Le programme mise sur « une approche en T », rapprochant des profils techniques et des profils métiers, en l'occurrence plutôt marketing, pour forger une compétence essentielle : la capacité « à identifier les nouvelles opportunités de croissance liées à l'exploitation intelligente des données massives ». Plutôt des Chief Data Officers en puissance, donc, familiarisé avec l'outillage (au sens large) big data fourni par IBM, que des data scientists. Bien que HEC assortisse la présentation de ce nouveau cursus de la perspective de développer « sur les prochaines années » une série de cours sur la modélisation, l'extraction de données, l'analytique prédictive, les outils de web analytics et de visualisation des données. Aidée en cela par la puissance de feu de Big Blue qui déploie ce genre de collaboration dans une centaine de pays.
 

Un panel d'industriels demandeurs

 

Autant de composantes que l'on retrouve, d'ailleurs, au menu du master spécialisé (Ms) de Telecom ParisTech qui accueille sa première promo de 30 étudiants. Mais cette fois, en misant sur l'acquisition d'un socle de connaissances techniques concernant l'ensemble de l'infrastructure de projets big data (architecture de systèmes répartis, technologies d'informatique décisionnelle avancée, sécurisation, etc). Le propos est clairement l'entraînement de data scientists. « A l'interface de l'informatique et des mathématiques appliquées», résume Stéphan Clémençon, professeur de l'Institut Mines-Télécom, responsable du montage de ce nouveau Ms. Le fait que ce dernier, passé par Carnegie Mellon, soit également à l'origine d'une chaire d'enseignement-recherche (avec huit doctorants) sur le thème « machine-learning for big data » n'est pas neutre. Cette spécialité étant la composante incontournable de l'analyse prédictive et autres débouchés de l'algorithmie avancée). L'atout-clé pour le master: la contribution d'un panel d'industriels particulièrement demandeurs (Safran, EADS, Thales, Capgemini, SAS, IBM, Criteo, Liligo, ainsi que PSA, BNP Paribas pour la chaire). De quoi fournir un « fil rouge » au volet pratique de la formation, avec des projets réalisés parallèlement aux cours, autour d'une problématique industrielle. Et comme pour le MBA d'HEC, la première session du Ms a suscité un afflux de candidatures : aussi bien des ingénieurs tout juste diplômés, des statisticiens et matheux, que des informaticiens candidats à une reconversion professionnelle. Trois fois plus que ne peut en accueillir un Master spécialisé. Un cursus qui, en plus du décloisonnement entre disciplines scientifiques et technologiques, doit faire la part à des aspects peu familiers aux jeunes scientifiques (juridique, économétrie, conduite du changement, etc). Mais bonne nouvelle : forte de cette expérience de pluridisciplinarité, l'école d'ingénieurs prépare un programme de CES (certificat d'études spécialisés, formation courte diplômante, recours au e-learning) ouvert dès le printemps 2014 à la formation continue pour la montée en compétences sur le thème big data.

 

Cette pluridisciplinarité, partant d'un bagage scientifique solide, a certes la préférence des initiés. Tel Elias Baltassis, issu du sérail des mathématiques appliquées, patron du pôle big data du Boston Consulting Group après avoir dirigé le développement en Europe d'Opera Solutions, éditeur new-yorkais de solutions d'analyse prédictive des données : « derrière le terme de data scientist, il n'y a pas que des compétences de data miner ou de statisticien sur fond de mathématiques appliquées. Sur le volet informatique, les technologies évoluent tellement vite que si vous ne les maîtrisez pas vous-mêmes, vous perdez le fil ». Et d'ajouter : «la meilleure façon, et probablement la seule pour former les compétences voulues, à l'échelle voulue par ce marché que l'on dit déjà pénurique, est d'amener ceux qui sont déjà très calés en mathématiques et statistiques à s'intéresser aux nouvelles méthodes et solutions informatiques propres au big data. Ou l'inverse, mais c'est beaucoup plus difficile ».

 

Un contexte d'immersion totale
 

C'est, dans une certaine mesure, le choix que fait l'éditeur SAS, spécialiste de l'informatique décisionnelle, avec le Spring Campus, formation intensive d'un mois suivie d'un stage de cinq mois au sein d'entreprises partenaires. Un cursus proposé de ce fait à des étudiants en fin de cycle (master 2, licence 3). Pour l'éditeur et les entreprises d'accueil, il s'agit de préparer des professionnels maîtrisant la chaîne des technologies de business analytics. Et ce, dans un contexte d'immersion totale, « en relation avec les besoins d'un métier, pour s'entraîner à tirer partie de l'analyse des données », souligne Ariane Liger-Belair responsable du programme académique de SAS France. Une approche expérimentale, en quelque sorte, qui tranche avec l'approche classique des données rangées dans des bases, et qui caractérise la « culture de la donnée » que sont appelés à représenter les « pro » du big data au sein de l'entreprise. Les deux orientations fonctionnelles proposées à la promo 2013 du SAS Spring Campus sont révélatrices : la gestion du risque, capitale pour le milieu bancaire et financier ; la connaissance client, indispensable aux formes évoluées du pilotage du marketing. Les vingt étudiants formés en avril dernier (retenus parmi quelque 250 postulants) et sortant de stage en ce mois d'octobre sont d'ores et déjà assurés d'un emploi. Le recueil des candidatures pour la seconde promo (début de cursus en avril 2014) est ouvert jusqu'à la fin octobre.

 

Quant au volet technique et l'écosystème des outils de traitement des flux de données, la rapidité d'évolution est telle que seul un arsenal de formations courtes (deux à trois jours autour d'Hadoop par exemple) et une bonne dose de pragmatisme et de mise en pratique au fil des projets, peuvent satisfaire le besoin de montée en compétences. Pour quels métiers précisément ? En dépit du fait que ces projets relèvent le plus souvent d'une organisation instable « faite pour durer le temps de répondre à un besoin business », un structuration de ces métiers se dégage (ce que nous aborderons dans la 2e partie).

Pour approfondir sur Big Data et Data lake