Le Machine Learning à l’assaut des applications d’entreprise
L’accès au Machine Learning est en train de se simplifier. Avec des applications beaucoup plus accessibles, le nombre d’applications va exploser. Depuis les progiciels d’entreprise jusqu’à l’OS de nos smartphones, le prédictif va devenir omniprésent.
Le dernier salon Big Data l’a montré : les entreprises françaises ont enfin pris le train du Big Data et sont en train de mettre en place leurs stratégies et d’installer leurs premiers clusters Hadoop. Pourtant, une nouvelle tendance se dégage déjà, celle des APIs.
Pourquoi chercher à monter en compétence sur des technologies encore complexes alors que celles-ci sont d’ores et déjà accessibles simplement dans le Cloud ? La conférence PAPIs.io Connect (PAPI pour Predictive API) dont la dernière édition vient d’avoir lieu à Paris, a été l’occasion de faire un point sur ce mouvement de fond.
Ce qui s’est passé avec Wordpress dans la création de sites se passe dans le Machine Learning
Louis Dorard
Le recours aux API permet non seulement de profiter de la puissance de stockage et de traitement illimitée du Cloud, mais aussi de faire face à la pénurie de compétences « Big Data ».
« La promesse des APIs prédictives, c’est de mettre le Machine Learning à la portée de tous », a souligné Louis Dorard, auteur de l’ouvrage « Boostrapping Machine Learning » dans sa keynote d’ouverture.
« Si je prend l’exemple du site Web de mon livre, je l’ai créé sur SquareSpace sans avoir besoin d’écrire du HTML, du CSS ou coder du JavaScript. Je n’ai pas écrit une ligne de code. Ce qui s’est passé à l’arrivée de Wordpress dans la création de site est en train de se passer dans le domaine du Machine Learning. Nous disposons aujourd’hui d’APIs qui permettent de créer des applications sans disposer d’une expertise très développée. Il suffit d’avoir les données et vous êtes capables d’avoir les modèles. »
Les plateformes prédictives de nouvelle génération sont maintenant disponibles
Force est de constater que les diverses solutions présentées lors de la conférence montrent l’évolution nette prise par les outils de Machine Learning ces derniers mois.
Le Français Dataiku y a présenté pour la première fois la nouvelle version de sa plateforme Data Science Studio mise en ligne… 2 jours plus tôt. Cette plateforme, dédiée au travail collaboratif de l’équipe de Data Scientists et expert métiers, permet de travailler sur la qualité des données et de générer les modèles prédictifs, puis de travailler sur les performances des algorithmes en quelques clics.
Soucieux de ne pas se mettre à dos les Data Scientists chevronnés, il est toujours possible d’avoir accès au code Python ou R, mais les progrès ergonomiques de l’outil sont impressionnants.
Une tendance que l’on retrouve chez les concurrents directs du Français. Présentée par David Gerster, vice président « Data Science » de BigML. BigML – la technologie - est une solution qui donne elle aussi l’impression d’une grande maturité. Il suffit de charger les données sur le site, et avec un seul bouton, on peut lancer l’analyse automatique par l’application qui, au bout de quelques secondes de calcul, va proposer le modèle prédictif qui lui semble le plus adapté. Le poids de chaque variable est expliqué, et on peut ensuite travailler pour affiner l’efficacité de l’algorithme.
Sur le sujet
Alors que Google, Microsoft, Amazon proposent des APIs de Machine Learning stricto sensu, Dataiku, BigML, mais aussi Blue Yonder ou encore PredicSis, éditeur de ChurnSpotter, s’attachent à créer de véritables environnements dédiés au Machine Learning avec un vrai effort pour rendre l’accès à ces techniques plus simple.
David Jones, directeur technique de Resolve Digital, une société de conseil en e-Commerce qui opère en Australie et en Nouvelle Zélande, a pour sa part fait le choix de la solution Open Source PredictionIO. Celle-ci a été développée sur Apache Spark, HBase et Spray, mais elle présente le gros avantage d’être totalement intégrée. La plateforme s’installe en une ligne de commande mais surtout, elle est assortie de tout un catalogue de modèles prédictifs clés en main.
Ainsi, pour mettre en place un algorithme de recommandation pour le site United Cellars, un site de vente de vins australiens, David Jones a privilégié cette solution simple et rapide à mettre en œuvre : « Nous avions besoin d’un moteur de recommandation et nous avons fait le choix de la solution PredictionIO. C’est un serveur prédictif Open Source pour lequel de nombreux templates e-Commerce sont disponibles. Les algorithmes sont bien implémentés et on peut réellement s’appuyer sur eux. Mais surtout, ces algorithmes sont prêts pour une mise en production immédiate. Ils sont simples à déployer, fiables et faciles à maintenir. Pour une entreprise de consulting, c’est très important car pour nous, le temps, c’est de l’argent. »
Pour ce marchand, la mise en place des recommandations de produits a eu un effet immédiat sur le chiffre d’affaires. La durée moyenne des sessions des visiteurs s’est accrue de 45%, le taux de conversion s’est amélioré de 22% et le panier moyen a bondi de 37%. Des chiffres impressionnants alors que l’algorithme de Machine Learning mis en œuvre par David Jones était un template prêt à l’emploi.
Une démocratisation qui va faire apparaitre de nouveaux usages
Si la recommandation de produits, l’up-selling et le cross-selling sur les sites de e-Commerce restent les applications les plus visibles du Machine Learning, les modèles prédictifs sont de plus en plus présents dans les applications et l’arrivée d’APIs clés en main va faire exploser les usages.
L’application actuelle la plus massive de ces algorithmes est sans nul doute la lutte anti-spam. Tous les grands services de messagerie électronique ont mis en production des algorithmes de Machine Learning qui analysent des milliards d’emails chaque jour pour trier les messages pertinents des messages indésirables.
Mais si un algorithme est capable de prédire votre niveau d’intérêt pour un message, les annonceurs peuvent aussi se servir du Machine Learning pour optimiser leurs campagnes. C’est notamment ce que réalise Np6 pour des entreprises comme Sarenza ou La Redoute.
En s’appuyant sur un calcul de churn (taux d'attrition), ces marchands déclenchent des campagnes d’emailing pour réactiver les clients qui s’apprêtent à quitter leur enseigne. En outre, les données de scoring (qualification du potentiel client) permettent de ne lancer une campagne d’emailing qu’auprès des contacts qui présentent l’appétence la plus forte pour l’offre proposée. Un bon moyen pour optimiser les coûts de la campagne.
Il y a les maths, et la technique. Il faut savoir mettre les maths dans la technique. Mais ce dont vous avez vraiment besoin, c’est une expertise dans le domaine
Keiran Thompson, Datagami
Au-delà le marketing, beaucoup de secteurs vont être impactés par le Machine Learning. Keiran Thompson, Data Scientist en chef chez Datagami , est ainsi venu raconter comment il a été amené à créer un modèle prédictif capable d’évaluer la valeur d’un bien immobilier en fonction de l’historique des ventes. En se fondant sur ces données, il a élaboré un premier modèle de type GBM (Gradient Boosting Model) simple.
Un modèle prédictif peu performant qu’il a peu à peu enrichi avec des données disponibles en Open Data afin d’en améliorer l’efficacité.
Il a par exemple tenu compte de la proximité d’une école, de l’âge du bâtiment, etc. « Le Machine Learning, c’est facile, il suffit d’appeler des APIs. Vous pouvez lancer des milliers de calcul en parallèle sur Amazon, ce n’est plus le problème », lance le Data Scientist qui ajoute : « une chose est de connaitre les maths, une autre chose est de connaitre la technique, il faut ensuite mettre les maths dans la technique, mais ce dont vous avez vraiment besoin, c’est d’une expertise dans le domaine. »
Le Machine Learning va être mis en œuvre dans le cadre de problématique métiers de plus en plus fréquemment, mais il pourrait bien se retrouver aussi dans des progiciels d’entreprise très classiques. « Les applications d’entreprise « prédictives » reprennent l’idée de présenter les choses en fonction de leur priorité, mettre en avant les tâches qui ont la priorité la plus forte », explique Louis Dorard.
Il ajoute « qu’une application intéressante dans la relation client, c’est le routage de messages. Pouvoir assigner à la meilleure personne une demande émise par un client. On peut imaginer que l’application va réaliser ce routage non pas avec des règles fixes, mais par auto-apprentissage, en observant qui traite les demandes en fonction de leur objet. Un système auto-apprenant et qui s’adapte de lui-même aux changements. »
Un moteur de Machine Learning dans chaque smartphone ?
Un exemple d’application qui applique à la lettre cette nouvelle approche, c’est Snips, le nouveau projet de Rand Hindi. Le créateur de cette application mobile, jeune prodige des algorithmes, a développé le moteur prédictif de l’application Tranquilien de la SNCF, l’application qui estime le taux de fréquentation de chaque train. Il a aussi développé pour La Poste un modèle qui prédit avec une précision de 90% le nombre de minutes d’attente dans chaque bureau.
Sur le Machine Learning
- Conexance dope ses prédictions marketing au Machine Learning et au Cloud
- Parkeon met le « Machine Learning » au service des automobilistes
- Le Machine Learning, moteur de l’efficacité énergétique des datacenters de Google
- Fortscale combine Big Data et Machine Learning pour traquer les comportements anormaux
Sa nouvelle application, Snips, est une surcouche qui vient se placer sur les OS mobiles afin de personnaliser leur interface utilisateur en fonction des habitudes de leur utilisateur.
« Nous passons nos journées à chercher des informations sur nos smartphones, passant d’une application à une autre, d’une application de transport à une application de messagerie. On passe beaucoup de temps à ouvrir les applications, à taper l’information recherchée, ça ne fonctionne pas ; alors on change d’application, etc. C’est un fardeau car c’est une approche purement statique, quels que soit votre comportement et vos difficultés. Cela n’a pas de sens. Quand je me déplace, mon application de transport a bien plus d’importance qu’un jeu par exemple. Pourquoi l’OS n’offre-t-il pas un raccourci vers cette application lorsque je suis en train de me déplacer, sans que je doive taper quoi que ce soit ? »
Encore en béta, Snips veut rendre l’interface utilisateur des smartphones « intelligente », c'est-à-dire capable d’anticiper les besoins de leur utilisateur. Le Machine Learning dans la main de tous, c’est pour bientôt.