ktsdesign - stock.adobe.com

Deep Learning : trois nouvelles approches montent en puissance

Les réseaux antagonistes génératifs, l'apprentissage par renforcement et l'apprentissage par transfert sont des approches explorées par les théoriciens et les chercheurs depuis des années. Mais grâce aux récentes évolutions technologiques, ces nouvelles techniques d'apprentissage profond deviennent enfin utilisables pour les entreprises.

par

Maria Korolov

Publié le: 25 janv. 2019

« Il ne s'agit pas vraiment de nouveaux concepts », lance Hermann Ney - professeur d'informatique à l'Université RWTH d'Aix-la-Chapelle en Allemagne. « Mais aujourd'hui, à l'ère de l'apprentissage profond, les réseaux antagonistes génératifs (GAN), l'apprentissage par renforcement et l'apprentissage par transfert ont une meilleure chance de devenir vraiment utiles ».

Les réseaux antagonistes génératifs floutent la frontière entre réel et virtuel

En décembre 2018, des chercheurs de Nvidia ont publié une vidéo qui montrait des visages, des voitures et des meubles... générés par ordinateur. Et qui étaient incroyablement réalistes.

Le secret ? Les réseaux antagonistes génératifs (GAN), un système de Deep Learning dans lequel deux Intelligences Artificielles différentes s'affrontent. Une première essaie de créer des images réalistes ; l'autre essaie de repérer les fausses des vraies.

Au fur et à mesure que les deux instances s'affrontent, elles s'améliorent. Les résultats peuvent être exceptionnellement réalistes - et même un peu troublants, pour Vivek Katyal, responsable mondial de l'analyse des risques et des conseils financiers chez Deloitte.

Mais si les GAN sont d'un intérêt évident pour, disons, le cinéma ou les créateurs de jeux vidéo, d'autres utilisations sont utiles pour les professionnels.

Par exemple, les entreprises peuvent l'utiliser pour prendre des photos et créer des rendus 3D ou générer des modèles pour une impression 3D. « C'est ce que l'on étudie actuellement dans le domaine de la fabrication et du manufacturing de pointe », avance Vivek Katyal.

Toutefois, celui-ci avertit qu'il faut se méfier d'introduire des biais et des erreurs dans ces systèmes. Si une entreprise met en œuvre des GAN sans s'assurer au préalable que ses données sont propres, représentatives et impartiales, alors cette technique d'apprentissage profond va amplifier les problèmes.

« Je ne pense pas que cela empêche l'adoption des réseaux antagonistes génératifs », diagnostique Katyal, « les gens regardent d'abord les bénéfices qu'ils peuvent en tirer avant de regarder les risques », constate-t-il.

L'apprentissage par renforcement crée de nouvelles stratégies

En décembre 2018 également, Google a publié les résultats de son expérience avec AlphaZero, un système qui a appris seul à jouer au Go et aux échecs, sans étudier les parties faites par des humains et sans s'appuyer sur des commentaires.

Le secret était l'utilisation de l'apprentissage par renforcement, une autre technique avant-gardiste de Deep Learning. Le programme a joué des parties encore et encore, en essayant de se battre lui même - ou plutôt de battre ses propres versions précédentes. AlphaZero a rapidement abouti à un système capable de battre tous les joueurs.

Au-delà du Go et des échecs, l'apprentissage par renforcement peut être utilisé pour apprendre à faire presque n'importe quoi, pourvu qu'il y ait un moyen de compter des points ou de chiffrer le résultat.

Une application pratique se trouve par exemple dans l'amélioration des logiciels de navigation pouvant s'appuyer sur des bots qui trouvent des chemins dans de nouveaux endroits (y compris ceux où il y a peu de passage et donc peu de données pour les GPS à base de Machine Learning traditionnel). Une autre concerne les robots industriels qui apprennent seuls à interagir avec les objets, raconte Jacob Perkins, directeur technique de la société d'analyse de sécurité Insight Engines et auteur de plusieurs livres sur le développement de logiciels d'apprentissage automatique.

« Je ne sais pas si l'aspirateur autonome Roomba utilise l'apprentissage par renforcement, mais ce serait une bonne chose à faire », plaisante-t-il.

En fait, pour Christian Shelton, professeur d'informatique à l'Université de Californie, tout processus qui peut être optimisé peut tirer parti de l'apprentissage par renforcement.

Les défis de l'optimisation dans les chaînes d'approvisionnement, dans la consommation d'énergie des centres de données ou la gestion des workloads cloud, sont aujourd'hui traités, de manière satisfaisantes, avec des méthodes statistiques traditionnelles. Pour tout dire, ces optimisations ne nécessitent pas d'apprentissage par renforcement. Pas aujourd'hui... Mais demain, à mesure que ces exigences deviendront plus complexes avec des entreprises qui intègreront plus de facteurs et de KPI, l'apprentissage par renforcement commencera à trouver une place ici aussi, prédit Christian Shelton.

L'apprentissage par transfert

L'apprentissage par transfert vient naturellement à l'homme. Une fois que nous apprenons à faire une chose, il nous est facile de « transférer » ce savoir, pour apprendre à en faire une deuxième connexe au lieu d'avoir à tout réapprendre de zéro.

Mais cette faculté n'est pas naturelle en informatique. Des développeurs y ont donc travaillé, via diverses méthodes. Et avec les récents progrès du Deep Learning, les possibilités de transfert de connaissances se sont nettement améliorées.

AppTek, par exemple, utilise l'IA pour comprendre et traduire un langage parlé. Cette phase d'apprentissage s'appuie sur de vastes ensembles de données accessibles au public - comme les vidéos et les podcasts. Ensuite, l'apprentissage par transfert permet d'appliquer ces algorithmes à d'autres situations, comme des appels téléphoniques où la qualité sonore est moins bonne, explique Mudar Yaghi, PDG d'AppTek.

« Dans tous les cas, les résultats sont plus précis, comme ces chatbots qui reconnaissent désormais les dialectes ou les variantes régionales », explique Ken Sanford, architecte analytique chez Dataiku et professeur au Boston College.

Walmart (et d'autres distributeurs) utilisent également l'apprentissage par transfert pour mieux catégoriser leurs références, continue Ken Sanford. « Ils ont trop de nouveaux produits, le système de classification est trop complexe pour le faire manuellement ». L'apprentissage par transfert, combiné à la reconnaissance de l'image, permet d'identifier des différences subtiles entre des produits proches et de les classer automatiquement.

Les géants du cloud qui offrent des services d'intelligence artificielle personnalisables et entrainables avec les jeux de données de leurs clients (comme Google, Microsoft ou Amazon), ont également recours à l'apprentissage par transfert pour accélérer l'apprentissage de nouveaux modèles en s'appuyant sur les anciens modèles qui leur ressemblent.

En route pour une nouvelle IA

Au cours des dernières décennies, l'intelligence artificielle s'est considérablement améliorée. Elle est passée de systèmes assez simples à base de règles à des approches statistiques, puis aux algorithmes d'apprentissage automatiques (Machine Learning), retrace Vivek Katyal de Deloitte.

Les réseaux antagonistes génératifs, l'apprentissage par renforcement et l'apprentissage par transfert vont aider l'IA à dépasser le Machine Learning et donner un coup d'accélérateur au Deep Learning. En résumé, ils sont la prochaine étape annoncée sur la route de l'IA.

Sur le Deep Learning

Machine Learning, Deep Learning, AI, Informatique cognitive : quelles différences ?

Du Big Data à l’AI : de l’automatisation à l’autonomie du code

Machine Learning vs Deep Learning ? La même différence qu'entre un ULM et un Airbus A380

Deep Learning : trois nouvelles approches montent en puissance

Les réseaux antagonistes génératifs floutent la frontière entre réel et virtuel

L'apprentissage par renforcement crée de nouvelles stratégies

L'apprentissage par transfert

En route pour une nouvelle IA

Sur le Deep Learning

Machine Learning, Deep Learning, AI, Informatique cognitive : quelles différences ?

Du Big Data à l’AI : de l’automatisation à l’autonomie du code

Pour approfondir sur Outils décisionnels et analytiques

Qu'est-ce que le réglage fin dans l'apprentissage automatique et l'IA ?

Qu'est-ce que l'apprentissage profond (Deep Learning) et comment fonctionne-t-il ?

Qu'est-ce que l'apprentissage automatique (AutoML) ?

Qu'est-ce que l'apprentissage automatique antagoniste?