Definition

Réseau antagoniste génératif (GAN)

Dans le domaine de l'intelligence artificielle, les réseaux antagonistes génératifs (ou GAN, generative adversarial networks) appartiennent à une catégorie de technique d'apprentissage automatique dans laquelle deux réseaux sont placés en compétition dans un scénario de jeu à somme nulle. Généralement, les GAN sont non supervisés et apprennent par eux-mêmes à imiter n'importe quelle répartition de données.

Les deux réseaux neuronaux qui composent un GAN sont appelés générateur et discriminateur. Le générateur est un type de réseau neuronal convolutif qui crée de nouvelles instances d'un objet. Le discriminateur est un type de réseau neuronal déconvolutif qui détermine l'authenticité de cet objet ou son appartenance à un jeu de données.

Ces deux entités sont en compétition pendant la phase d'apprentissage où les pertes se confrontent les unes aux autres afin d'améliorer les comportements, ce mécanisme étant appelé rétropropagation.

L'objectif du générateur est de produire une sortie passable sans être pris en faute tandis que celui du discriminateur est d'identifier les contrefaçons. A mesure que la double boucle de rétroaction se déroule, le générateur produit une sortie de meilleure qualité et le discriminateur identifie mieux les contrefaçons.

Les GAN sont de plus en plus connus comme une forme évoluée d'apprentissage automatique. Des chercheurs et des développeurs ont expérimenté l'utilisation de GAN pour produire des copies, même imparfaites, d'œuvres célèbres telles que la Joconde et des portraits de personnes qui n'existent pas.

Fonctionnement d'un GAN

Pour créer un GAN, on doit commencer par déterminer la sortie finale souhaitée et compiler un jeu initial de données d'apprentissage fondé sur ces paramètres. Ensuite, ces données sont envoyées de manière aléatoire dans le générateur jusqu'à ce qu'il obtienne une précision minimum dans la production des sorties.

Puis les images générées sont introduites dans le discriminateur accompagnées des points de données réelles provenant de la conception d'origine. Le discriminateur filtre les informations et renvoie une probabilité entre 0 et 1 pour représenter l'authenticité de chaque image (1 pour une image réelle et 0 pour une image contrefaite).

Enfin, ces valeurs sont contrôlées manuellement et répétées jusqu'à obtention du résultat souhaité. Les deux réseaux essaient d'optimiser des fonctions différentes, opposées, dans un jeu à somme nulle.

Utilisations des GAN

Les GAN peuvent apprendre à imiter la vie réelle afin de générer des contenus tels que du multimédia, du texte ou un discours. La principale fonction d'un GAN est de créer des données à partir de zéro. Les applications les plus courantes sont, par exemple :

  • La conversion d'une image en une autre image ou la création d'images complètes à partir d'une ébauche.
  • L'augmentation de la résolution d'une image.
  • La modélisation de comportements et de mouvements humains récurrents pour des vidéos.
  • L'entraînement d'un auteur artificiel chargé de rédiger un blog pour un site Web en s'inspirant d'un contenu précédent.
  • La recréation d'une photo ou d'une peinture très connue.
  • La prévision d'images vidéo successives.
  • La génération d'une image à partir d'un texte.
  • La création de vidéos truquées (deepfakes) ou l'imitation de comportements de célébrités.
  • La production de descriptions photoréalistes de prototypes de produits.

La conversion en couleur d'images en noir et blanc.

Cette définition a été mise à jour en juin 2019

Pour approfondir sur Outils décisionnels et analytiques