Definition

Apprentissage supervisé

L'apprentissage supervisé, dans le contexte de l'intelligence artificielle (IA) et de l'apprentissage automatique, est un système qui fournit à la fois les données en entrée et les données attendues en sortie. Les données en entrée et en sortie sont étiquetées en vue de leur classification, afin d'établir une base d'apprentissage pour le traitement ultérieur des données.

Les systèmes d'apprentissage automatique supervisé alimentent les algorithmes d'apprentissage avec des quantités connues qui étayeront les futures décisions. Supervisé ou non supervisé, l'apprentissage automatique est utilisé notamment pour les chatbots, les véhicules autonomes, les programmes de reconnaissance faciale, les systèmes experts et les robots. Les systèmes d'apprentissage supervisé sont associés pour la plupart à une intelligence artificielle basée sur la récupération, mais ils peuvent aussi reposer sur un modèle d'apprentissage génératif. 

Les données utilisées pour l'apprentissage supervisé sont une série d'exemples comprenant des paires composées de sujets en entrée et de sorties attendues (appelées également signaux de supervision). Prenons l'exemple d'un système d'apprentissage supervisé pour le traitement d'images dans lequel on introduit des photos de véhicules appartenant aux catégories voitures et camions. Après un temps d'observation suffisant, le système doit être capable de faire la distinction entre plusieurs images non étiquetées et de les catégoriser ; une fois cet objectif atteint, l'apprentissage peut être considéré comme terminé.

Les modèles d'apprentissage supervisé présentent certains avantages sur les modèles non supervisés, mais ils ont aussi des limites. Par exemple, ils sont plus susceptibles de prendre des décisions auxquelles les humains peuvent s'identifier parce qu'elles reposent sur des données fournies par les humains. Mais dans le cas d'une méthode basée sur la récupération, les systèmes d'apprentissage supervisé ont des difficultés à traiter les nouvelles informations. Si un système qui connaît les catégories voitures et camions, par exemple, reçoit une image de vélo, il devra la placer dans l'une ou l'autre de ces deux catégories, ce qui sera incorrect. Alors que si le système était génératif, il ne saurait pas forcément reconnaître un vélo, mais il serait capable de l'identifier comme appartenant à une autre catégorie.

L'apprentissage supervisé expliqué par des professeurs de Georgia Tech (en anglais) :

Cette définition a été mise à jour en octobre 2018

Pour approfondir sur Outils décisionnels et analytiques