Vasily Merkushev - stock.adobe.c
Data Science : « L’analytique, c’est aussi une transformation profonde des métiers » (Dataiku)
Lors de l’évènement français 2022 de leur société, les deux fondateurs de Dataiku ont partagé avec LeMagIT leur analyse sur la maturité des différentes entreprises pour la Data Science, ainsi que leurs conseils pour lever les freins à l’utilisation de l’IA.
Que de chemin parcouru pour Dataiku ! Il y a 10 ans, Florian Douetteau (PDG) et Clément Stenac (CTO) fondaient une startup pour éditer « des outils qui donnent la capacité aux entreprises d’utiliser plus massivement leurs données, l’analytique et pour démocratiser l’intelligence artificielle », résument en 2022 les deux dirigeants. Aujourd’hui, Dataiku affiche un chiffre d’affaires de 150 millions $, une présence internationale dans 15 pays (dont les États-Unis), une croissance insolente de 60 % par an et la société a dépassé la barre symbolique des 1 000 employés cette année.
Le tout en continuant à « ne » vendre « que » des outils pour les Data Scientists – et pour leurs homologues métiers (les Citizen Data Scientists).
Autre chiffre impressionnant, lors de son évènement clients à Paris (Everyday AI, le 20 octobre au Louvre), Dataiku a réuni 1 500 participants. Un évènement où LeMagIT était présent et a échangé avec les deux dirigeants fondateurs d’un groupe international qui – après un nouveau tour de table de 400 millions $ – pèse aujourd’hui la bagatelle de 4,6 milliards $. À titre de comparaison, un de ses principaux concurrents sur ce marché, Alteryx – côté à Wall Street – est valorisé 3 milliards.
L’IA et les données : un marché porteur
LeMagIT : Vous affichez une croissance de 60 % en 2022. Quels défis vous reste-t-il à relever en 2023 pour continuer à vous développer ?
Florian Douetteau : L’opportunité pour Dataiku, c’est que nous sommes sur un marché de la data et de l’Intelligence Artificielle (IA) qui est énorme. Pour les entreprises, c’est un enjeu de transformation massif pour maintenir leur compétitivité. Je pense que toutes les grandes entreprises, de tous les secteurs, ont vocation à avoir des plateformes de gestion systématique de leurs données et de l’analytique. Il y a une appétence de plus en plus forte des grands groupes pour ce type de solutions.
Florian DouetteauCo-fondateur de Dataiku
L’analytique, c’est plus que le travail des seuls data scientists ou de quelques spécialistes. C’est aussi une transformation profonde des métiers. Il y a quelques dizaines de millions de personnes dans le monde qui ont vocation à utiliser ce type d’outils et à changer leur manière de travailler.
L’enjeu pour nous, chez Dataiku, c’est d’être à la hauteur de cette opportunité en continuant de grossir : en ouvrant de nouveaux bureaux dans d’autres pays, en développant encore notre réseau de partenaires, et de manière très prosaïque, en continuant de faire évoluer nos produits pour servir nos clients – qui ont l’air plutôt contents aujourd’hui.
LeMagIT : Sur le produit justement : qui sont vos concurrents les plus directs ? Des spécialistes comme Alteryx et Databricks ? Ou des éditeurs plus généralistes comme SAP, Oracle, IBM ou les grands cloudistes ?
Florian Douetteau : Il y a tous ces compétiteurs que vous mentionnez. Et il y a une autre frange de marché – celle du MLOps et du AutoML – sur laquelle il y a beaucoup d’acteurs émergents. Mais nous avons la chance d’être un acteur de grande taille. En dix ans, depuis Paris, nous sommes parvenus à exister à l’échelle mondiale.
L’aventure américaine et les conseils de Dataiku
LeMagIT : De quand datez-vous votre « décollage », le moment où Dataiku est passé d’un « petit acteur » à un acteur majeur de l’IA ?
Florian Douetteau : Un effet de seuil important a été l’ouverture de bureaux à l’étranger, donc en 2016. Notre expansion aux États-Unis nous a permis d’avoir des clients de taille mondiale et de pénétrer sur ce marché américain.
LeMagIT : Quels conseils donneriez-vous à d’autres éditeurs français qui souhaiteraient prendre exemple sur vous et tenter, eux aussi, leur chance aux États-Unis ?
Florian Douetteau : Étape 1… y aller ! (rire)
Clément Stenac (co-fondateur et CTO) : C’est complexe. Ça a nécessité pour nous un peu « d’essai erreur », notamment dans le recrutement. Le point clé, c’est vraiment l’équipe.
Clément StenacCo-fondateur de Dataiku
Grosso modo, ça a décollé très vite et très fort dès qu’on a eu l’équipe. Parce qu’on avait déjà le produit. Il avait déjà prouvé en France qu’il était adapté aux entreprises. Le déclic est vraiment venu quand on a eu quelques personnes clés.
Florian Douetteau : Je pense que ce qu’il faut bien comprendre, c’est que quand on veut créer une équipe forte aux États-Unis quand on vient d’ailleurs, on fait face à un problème de recrutement. Ce qu’on propose est « atypique ».
C’est atypique pour des Américains de travailler pour une entreprise de logiciels étrangère. Pour convaincre, il faut avoir une proposition de valeur originale. Et ensuite il faut savoir faire confiance à quelques profils clés « locaux » qui vont vous permettre d’accélérer la mise sur le marché.
Clément Stenac : Ces profils clés sont aussi parfois eux-mêmes un petit peu atypiques. On n’a pas bootstrapé cette équipe aux États-Unis avec les profils les plus communs qu’on pourrait imaginer pour des Sales Leaders aux US. Mais si on regarde bien, c’est ce qu’on a fait aussi en France à nos débuts.
Évolutions clés de la plateforme Dataiku
LeMagIT : Si on en revient au produit, quelles sont les évolutions majeures récentes de Dataiku (désormais le nom de la plateforme et de l’entreprise) ? À quelles grandes tendances répondent-elles ?
Clément StenacCo-fondateur de Dataiku
Clément Stenac : Les grandes améliorations qu’on a apportées récemment visent à « gouverner, déployer et massifier » l’utilisation de l’IA et des données.
Au sein d’une entreprise, il y a toujours quelques projets phares – qu’on appelle, nous, les « moonshots ». Cependant une partie importante de la valeur vient d’un grand nombre de projets un peu plus « triviaux », mais qui sont très générateurs d’accélération, de productivité, de valeur… et surtout d’envie de continuer à en faire plus avec les données.
Cette prolifération de projets nécessite des capacités de gouvernance et de cohérence. C’est pour répondre à ce mouvement que l’on a beaucoup avancé sur ces fonctionnalités au cours des deux années passées.
Maturité des entreprises et des métiers dans l’IA
LeMagIT : Ce qui nous amène à votre vision du « terrain ». Que font réellement les entreprises avec la Data Science, l’IA et l’analytique avancée ? Certaines zones ou certaines industries vous paraissent-elles en avance ou au contraire en retard ?
Florian Douetteau : La maturité est très comparable entre les marchés français, UK et américain. On est sur les mêmes cas d’usage et sur des niveaux d’investissement assez similaires.
Florian DouetteauCo-fondateur de Dataiku
Après… il y a toujours des sociétés qui vont plus vite que d’autres ; c’est très lié à des cultures d’entreprise. Mais globalement, il n’y a plus ce décalage de un ou deux ans qu’on pouvait sentir au début de Dataiku.
Il y a en revanche des disparités entre industries. Elles n’ont pas toutes la même appétence pour les données ni les mêmes publics en interne. Certaines travaillent avec les données depuis 30, 40 voire 50 ans, parce que c’est le centre de leurs activités (comme la banque, les sciences de la vie ou l’industrie pharmaceutique). Mais pour d’autres (comme dans la production industrielle), avoir des logiques de capteurs et de SI centraux qui traitent de la donnée, c’est un peu nouveau. En revanche, ce sont des secteurs d’activité qui progressent très vite.
Mais globalement, une fois de plus, il y a des usages qui sont assez systémiques dans toutes les industries. Et il n’y a pas un seul secteur dans lequel nous n’ayons pas de client.
Clément StenacCo-fondateur de Dataiku
Clément Stenac : En plus des secteurs, on peut aussi regarder par métiers. Il y en a un certain nombre qui utilise depuis longtemps les données. On pense évidemment au marketing.
D’autres les utilisent historiquement moins. Mais on constate de plus en plus que les métiers de production, de recherche, ou dans les RH, y viennent aussi.
Ils sont encore beaucoup dans des phases d’exploration, mais ils y viennent.
Les freins : l’accès aux données et la culture
LeMagIT : Quels freins à l’usage du machine learning persistent encore aujourd’hui ? On parle souvent de la qualité des données. Le constatez-vous également et en voyez-vous d’autres ?
Florian Douetteau : Oui, il y a des sujets de qualité de données. Mais il y a des sujets encore plus prosaïques d’accès à ces données.
Le vrai facteur qui est en train de débloquer cela – pas encore complètement, c’est en cours – c’est le cloud. L’idée d’avoir 90 à 95 % de ses données utiles pour l’analytique, centralisées au même endroit, sans avoir des questions trop complexes de coûts, de gestion, etc. simplifie énormément les choses pour les entreprises.
Cela n’avait jamais été le cas avant, même avec les data warehouses. À titre d’exemple, nous avons des clients qui ont commencé avec 36 entrepôts de données. C’est un frein qui est en train de se lever.
Clément Stenac : Le mouvement a commencé il y a un ou deux ans. Certaines entreprises en sont déjà là. Mais pas encore toutes. Cela va encore prendre du temps.
Florian Douetteau : Oui, les early adopters du cloud analytique y sont déjà. À mon avis, c’est un cycle de cinq ans.
Clément Stenac : Et comme souvent les précurseurs entraînent derrière eux la lame de fond.
LeMagIT : Y’a-t-il d’autres freins que vous rencontrez au jour le jour dans les entreprises ?
Florian Douetteau : L’autre frein majeur est culturel. Tel métier ou tel groupe peuvent-ils imaginer des cas d’usage pertinents [de l’IA] pour eux ?
Florian DouetteauCo-fondateur de Dataiku
Prenez un chimiste qui mesure la température de sa cuve par rapport à la température extérieure. Depuis dix ans, il fait des règles de trois pour déterminer la bonne température. Il sent bien qu’il pourrait faire plus de choses avec ses données.
La première question culturelle, c’est de savoir s’il y a, ou non, un système qui capture les historiques des mesures – les siennes, mais aussi celles de ses collègues. Si c’est le cas, l’analytique peut commencer à devenir une réalité.
La deuxième question culturelle, c’est de savoir s’il a le droit de fabriquer un modèle – ce qui peut se faire rien qu’en cliquant sur des boutons. Si oui, il s’apercevra que, en effet, le modèle fonctionne mieux que la règle de trois.
L’innovation peut être aussi « simple » que cela.
Cette dimension culturelle reste un frein dans de nombreux cas. Mais comme pour la centralisation des données, il y a quand même une transition majeure en cours.
Le cas particulier des PME et des ETI
LeMagIT : Nous avons parlé des grands groupes, mais quid des PME ? Il semblerait qu’elles soient moins friandes de Machine Learning et de données, des projets que beaucoup pensent être réservés aux grandes entreprises. Vous confirmez ce retard ?
Florian Douetteau : Les PME ont les mêmes freins que les grandes entreprises, avec un décalage et des différences d’échelle. Mais ce sont toujours les questions d’avoir ou pas une stratégie donnée, de centraliser ses données, de comprendre les cas d’utilisation qui peuvent être intéressants et la capacité d’avoir quelques ressources pour commencer. [Sur ce segment] le passage au cloud et l’activation par les partenaires devraient aider.
En particulier en France, on voit en ce moment beaucoup d’équipement chez les retailers de taille intermédiaire (entre 500 millions et 1 milliard d’euros de chiffre d’affaires). Il y a une maturité qu’il n’y avait pas il y a 5 ans.
Clément Stenac : Il y a aussi certainement quelque chose de culturel qui explique ce retard que vous évoquez. En France, on commence réellement à se préoccuper de l’IA et de l’analytique quand on est un peu plus grand. On parle plus d’ETI que de PME. Jusqu’à 500 personnes, c’est un petit peu plus dur de se dire qu’on dédie des ressources à ce sujet.
Le Citizen Data Scientist existe
LeMagIT : Votre exemple du chimiste – de l’IA faite directement par le métier – c’est ce que les analystes appellent la « Citizen Data Science ». Comment se positionne Dataiku par rapport à cette tendance ?
Florian Douetteau : C’est le cœur de notre activité depuis plusieurs années !
LeMagIT : Intéressant parce que, historiquement, vous vous adressiez plus aux data scientists « pur sucre » et pas forcément aux métiers…
Clément Stenac : C’est avec ce positionnement qu’on a démarré il y a dix ans. Le but était alors de répondre aux besoins de l’époque, à savoir la pénurie de data scientists. Mais depuis, on a beaucoup étendu notre plateforme. Maintenant, la problématique, c’est de démocratiser tout cela par la collaboration entre différents types de profils.
Florian DouetteauCo-fondateur de Dataiku
Oui, sur des cas d’usages avancés, il y a des data scientists. Mais, comme on le disait juste avant, tous les use cases ne sont pas « avancés » et n’ont pas forcément besoin d’experts [des algorithmes] !
Le but, c’est déjà d’amener à utiliser les données, de commencer, d’itérer et de passer en production le plus vite possible. Et après, éventuellement, on essaie d’optimiser avec de meilleurs algorithmes et des data scientists… Même s’il est quand même relativement rare d’avoir besoin de meilleurs algorithmes pour affiner les résultats au dernier millième après la virgule.
Donc pour répondre à votre question, je dirais que l’on fait de la Citizen Data Science parce que Dataiku est un outil pour tout le monde : pour les experts comme pour les métiers (même si eux n’utiliseront pas cette expression de Citizen Data Scientist).
Florian Douetteau : Et précisons quand même que quand on entend dire « pour tout le monde », on parle d’un sous-ensemble de personnes qui ont souvent un profil ingénieur ou finance, en tout cas avec une affinité pour les données, mais qui, effectivement, ne sont pas des développeurs. Ils ont une expertise métier forte. Ils sont souvent au cœur des entreprises, car c’est eux qui fabriquent les process, ou qui mettent au point des produits, ou la stratégie marketing. Et souvent ils sont frustrés de ce qu’ils ne peuvent pas faire par manque d’un bon outil.