Matrice de confusion
La matrice de confusion, appelée également matrice d'erreur, est un tableau qui présente différentes prévisions et résultats de tests, en les comparant avec des valeurs réelles. Ces matrices sont utilisées dans les statistiques, le data mining, les modèles d'apprentissage automatique et d'autres applications de l'intelligence artificielle.
Elles permettent d'effectuer plus rapidement une analyse approfondie des statistiques et de faciliter la lecture des résultats grâce à une visualisation claire des données. Ces tableaux peuvent aider à analyser les erreurs dans les statistiques, le data mining, la médecine légale et les tests médicaux. Une analyse approfondie aide les utilisateurs à déterminer les résultats qui indiquent comment les erreurs se produisent, au lieu de donner simplement les bons et les mauvais résultats.
Les matrices de confusion utilisent un format simple pour présenter les prévisions. Dans la matrice de confusion d'un modèle d'apprentissage automatique, les prévisions sont alignées sur la droite et les données réelles en haut. Les prévisions ou les résultats sont présentés dans les lignes, juste en dessous des données réelles. Les résultats peuvent comprendre l'indication correcte d'une valeur positive comme étant un vrai positif ou d'une valeur négative comme étant un vrai négatif, ou encore d'une valeur positive incorrecte comme un faux positif ou d'une valeur négative incorrecte comme un faux négatif.
Voici un exemple simple de matrice de confusion qui peut être utilisée pour présenter les résultats de tests de grossesse :
Les matrices qui utilisent des codes couleur donnent la possibilité de lire rapidement un certain nombre d'occurrences dans un test. Cette visualisation rapide permet d'analyser l'efficacité d'un modèle donné plus en détail qu'un résultat et de déterminer des tendances qui peuvent aider à régler les paramètres.