Applications & Données n° 10 : le Machine Learning est en action
Le numéro d’automne de notre revue dédiée aux applications métiers et à la gestion des données est entièrement consacré au Machine Learning et à la Data Science. Au menu : des conseils d’experts pour mener à bien vos projets de bout en bout, et deux retours d’expérience qui les ont appliqués à la SNCF et dans le secteur de la logistique.
Le numéro 10 de la revue « Applications & Données » est sorti. Il est entièrement dédié à la Data Science. Pourquoi ce choix ? Parce que le Machine Learning et sa variante, le Deep Learning, ne sont plus des sujets théoriques pour les entreprises et les organisations. Celles-ci mettent désormais en place des projets très divers, en fonction des secteurs et des sujets (finances, supply chain, etc.). Le principe premier de ces projets est de trouver des récurrences, de dévoiler des corrélations et des liens cachés dans les données, le plus souvent pour améliorer les opérations, grâce à une automatisation devenue « intelligente ».
Mais le basculement entre théorie et pratique n’est pas très vieux. Et les questions sur les bonnes pratiques restent nombreuses. D’où ce numéro.
Concrètement, les PoC ont ouvert la voie aux mises en production réelles il y a environ deux ans. Mais depuis, le Machine Learning a progressé, à grande vitesse. Le récent salon AI Paris a montré à quel point les grands groupes étaient devenus familiers avec cette technologie, dont on peut désormais dire qu’elle décolle.
Mais les « grands » ne sont pas les seuls. L’année dernière, le Data Scientist de Nexway nous expliquait que ces outils statistiques (puisqu’il s’agit en grande partie de cela) ne devaient pas être réservés « aux gros ». Pour lui, et il le prouvait dans son quotidien, toute PME peut envisager de manipuler des algorithmes.
Autre signe de décollage : les formes évoluées d’Intelligence Artificielle, comme le Deep Learning (la variante du Machine Learning qui fait couler tant d’encre avec ses « boîtes noires ») ont, elles aussi, connu un virage sur l’année écoulée. Et avec elles, de nouveaux usages véritablement « disruptifs ». Les responsables France de Milestone et le fondateur de la startup Earthcube, par exemple, constatent chacun de leur côté que la « video recognition » et l’analyse d’images par l’IA ont connu un développement sur cette période.
Ces projets n’auraient donc plus rien d’exceptionnel ?
Attention ! Pas si vite.
Le Machine Learning n’a rien de trivial. Il est histoire de connaissance et de choix d’algorithmes, de compréhension métier, de qualité des données (et d’accès à la donnée). Et il est surtout itératif. Dit autrement, il évolue sans cesse dans un aller et retour permanent entre ses « outputs » (prévisions, reconnaissances, etc.) et la réalité.
Une telle « boucle infinie » impose de nouvelles règles qui ne sont, malheureusement, pas toujours bien connues ni appliquées.
Ce numéro spécial de « Application & Données », la revue trimestrielle du MagIT, se penche justement sur ces spécificités et sur les bonnes pratiques à observer en amont (cf. le conseil « Machine Learning ou moteur de règles ? »), pendant, et après une mise en production pour réellement itérer et tirer les bénéfices de l’IA (avec un dossier sur les quatre étapes clefs à ne pas sauter).
Car quand ces projets sont bien menés, les retombées peuvent être remarquables, comme vous pourrez le lire dans deux témoignages : celui du spécialiste de la logistique Upply et celui de SNCF Réseau (la filiale de la SNCF en charge de l’infrastructure qui multiplie les applications de l’IA).
Une fois ce cadre établi, des problématiques plus évoluées se poseront, comme de savoir comment améliorer vos modèles. Une réponse se trouve, comme vous le verrez, dans le « feature engineering » – c’est-à-dire le choix des attributs pertinents pour que le modèle soit efficace et ceux que vous pouvez laisser de côté.
Toujours dans le but d’aller un peu plus loin, il se peut que vous soyez aussi tenté(e) par le fameux Deep Learning et les usages qui montent. Des usages qui s’appuient de plus en plus sur les réseaux neuronaux « RNN » et « CNN ». De quoi s’agit-il et en quoi diffèrent-ils ? Vous le saurez en détail en lisant l’expertise et le témoignage sur ce sujet de ceux qui en font, réellement, au quotidien.
Le Machine Learning se réinvente par temps de pandémie
Enfin, avec la crise que nous traversons, ce numéro ne pouvait pas passer à côté de la grande question actuelle : comment fait-on concrètement pour extrapoler des enseignements (des insights) à partir de données du passé alors que l’avenir est « imprévisible » et qu’il n’est pas la continuité statistique du passé (comme c’est le cas actuellement) ? Le Machine Learning touche-t-il ici ses limites ?
Vous verrez que la réponse est « non, pas vraiment ». De nouvelles méthodes (comme multiplier les données en entrées grâce à… une IA) et l’évolution des algorithmes (comme le LSTM) permettent un apprentissage avec beaucoup moins de données (une semaine d’historique par exemple). Certains appellent cela le « small data ». Mais c’est plutôt le terme « d’IA frugale » qui rend le mieux compte de ce « nouveau Machine Learning » – comme le qualifie Franck Cohen, expert en IA (et membre du board de Workday).
Une IA « frugale » donc, qui n’aura plus de secret pour vous après avoir lu ce numéro 10 d’Applications & Données. Bonne lecture. Et surtout : bons projets de ML.
Télécharger gratuitement le numéro 10 de « Applications et Données »