Guides Essentiels

Machine learning : les clés pour contrôler les biais

Introduction

Les initiatives consacrées à l’IA de confiance et l’éthique des applications de machine learning se multiplient. Les grands groupes y vont de leur charte et de leurs méthodologies pour lutter contre les possibles déviations des modèles en production. Il est vrai, les algorithmes assistent de plus en plus les métiers, qu’ils le sachent ou non.

Les éditeurs et les chercheurs mettent en avant la nécessité d’obtenir une IA explicable, par l’entremise de méthodes, d’outils et de calibrations afin que les algorithmes produisent eux-mêmes des scores de confiance. Cette prise de conscience atteint les sphères gouvernementales nationales et fédérales. Les États-Unis et l’Union européenne sont les premiers à vouloir légiférer sur la question de l’IA de confiance.

Mais il existe un autre pendant de cette approche qui fait souvent l’objet de confusion : la sous-thématique des biais.

Dans le domaine de la data science, le terme biais est plus communément employé pour désigner les erreurs ou les simplifications statistiques. Or, il revêt plusieurs réalités. Un biais peut être une ligne oblique qui traverse un espace. Il peut découler de la qualité des données, de leur inexactitude, d’un mauvais paramétrage d’un modèle ou encore des résultats qu’il affiche aux utilisateurs. Il est statistique, social, éthique, et si certaines conséquences peuvent prêter à sourire, d’autres impactent largement les processus de décision humaine.
Dans une ère où l’on souhaite automatiser une partie des processus de recrutement, d’attribution de crédit, d’analyse des textes de loi, les campagnes marketing, générer des contenus, voire de pilotage d’équipements à distance, la notion de risques prend tout son sens.

Malgré les qualités et l’efficience attribuées au machine learning et le deep learning, les biais font figure de risques qu’il faut minimiser.

Mais au-delà des discours et des cadres plus ou moins délimités, comment les équipes de data science peuvent au quotidien lutter contre ces biais qui, s’ils demeurent, influeront sur l’activité de leur entreprise ? C’est tout le sujet de ce guide essentiel qui aborde la question sous un angle pratique et didactique en tentant de cartographier les types de biais et plusieurs méthodologies pour les corriger ou les éviter.

Soyons claires, la tâche paraît impossible et demande finalement de se pencher sur des cas d’usage spécifiques. Un cadre général ne peut que tracer les grandes lignes d’une méthodologie qu’il faut adapter suivant la technique d’IA (NLP, NLG, Computer vision, classification, etc.) et l’objectif associé. Cependant, prendre conscience de l’existence de ces éléments permet d’en mesurer l’impact et prioriser les risques.

En clair, les pratiques issues de la cybersécurité comme la supervision, l’identification des risques, la mesure de périmètres et des sphères d’attaque peuvent s’appliquer, en principe. Mais certaines techniques, quoique très efficaces, manquent de clarté pour le commun des mortels, ici, les mortels étant les data scientists. Là encore, la traque des biais ne peut se faire sans avoir les notions d’explicabilité en tête.

Télécharger gratuitement ce dossier au format PDF

1Contexte-

Les biais au cœur des problématiques de transparence

Actualités

L'éthique, passage obligé pour le développement de l'IA

L'intelligence artificielle pose autant de questions philosophiques que technologiques. En cause, les mythes et les fantasmes qui lui sont associés, colportés par la littérature et le cinéma. Mais aussi les déceptions qu'elle a causées. Aujourd'hui, vraisemblablement mature, elle nous oblige à prendre conscience de ses limites et à réfléchir à l'usage que nous voulons en faire. Lire la suite

Actualités

Transparence de l’IA : IBM confie ses outils à la Fondation Linux

IBM a fait don lundi de trois projets open source dédiés à l’explicabilité de l’IA, à la LF AI Foundation, une structure imbriquée dans la Fondation Linux. Lire la suite

Actualités

IA : les projets de directives européennes préoccupent les éditeurs américains

La Commission européenne a publié des lignes directrices sur la réglementation de l’IA. Celles-ci exigent que les systèmes utilisés dans les secteurs à haut risque soient transparents et fassent l’objet d’une surveillance humaine. Certains éditeurs américains semblent préoccupés. Lire la suite

Actualités

IA : le Parlement européen prend position pour les principes de transparence et de contrôle humain

Première étape vers une possible loi, le Parlement européen a adopté mercredi une position sur les grands principes qui doivent encadrer les usages de l’Intelligence Artificielle en Europe. Le cœur du texte concerne les domaines militaires, de la justice et de la médecine. Mais il va au-delà. Lire la suite

Actualités

IA : les experts face au mur de l’élaboration d’un « cadre de confiance »

Gestion des risques, responsabilité, bonnes pratiques, auditabilité. Tout reste à définir dans le domaine de l’intelligence artificielle. Des experts de l’audit IT s’y attèlent et développent cinq recommandations pour le développement d’une IA « de confiance ». Lire la suite

2Exemples-

La COVID fait surgir les biais

Actualités

Coronavirus : l’IA cumule les erreurs de diagnostic

Jusqu’à maintenant, l’intelligence artificielle n’a pas apporté d’aide convaincante concernant la pandémie du coronavirus. La cause : le manque de données fiables, d’autant que de nombreuses personnes infectées ne le savent pas elles-mêmes. Lire la suite

Actualités

E-commerce : quand le coronavirus fait tousser les IA

Le confinement a totalement bouleversé les habitudes de consommation de tous et les algorithmes d’IA, notamment les modèles de Machine Learning, ont été bousculés par ce brusque changement de contexte. Une crise des algorithmes qui replace l’humain au cœur du jeu. Lire la suite

Actualités

L’IA contre la COVID-19 : Facebook AI Research entre dans la danse

Afin de prédire la détérioration de l’état des patients atteints de la COVID-19, Facebook AI Research met à contribution ses derniers travaux consacrés à l’apprentissage non supervisé. Les trois modèles IA feraient mieux que leurs concurrents, et le laboratoire entend le faire savoir en les rendant open source. Lire la suite

3Conseils-

Cartographier et corriger les biais

Conseils IT

Machine learning : six conseils pour faire la chasse aux biais

À mesure que l’adoption du machine learning se développe, les entreprises doivent devenir des experts en préparation de données, faute de quoi elles risquent d’obtenir des résultats inexacts, injustes ou même dangereux. Voici comment lutter contre les biais inhérents au machine learning. Lire la suite

Conseils IT

Biais dans l’IA : une cartographie nécessaire pour tenter de les corriger

La multiplication des algorithmes pose la question des biais. Le responsable scientifique chargé de l’IA de confiance chez Quantmetry décrit la méthodologie du cabinet pour les identifier et tenter de les corriger. Lire la suite

Conseils IT

9 problèmes de qualité des données qui menacent vos projets IA

La qualité de vos données a une incidence sur le bon fonctionnement de vos modèles d’IA et de machine learning. En identifiant et en anticipant ces neuf problèmes de données, les organisations seront en mesure de préparer des algorithmes efficaces. Lire la suite

Conseils IT

IA : comment lutter contre les biais dans les données d’entraînement

Bien que le biais des données puisse sembler être un problème de back-end, les données faussées peuvent faire dérailler un modèle et avoir de lourdes répercussions sur l’entreprise. Lire la suite

Conseils IT

Cinq exemples pour appréhender les biais dans un projet NLP

L’utilisation du traitement du langage naturel devient de plus en plus courante en entreprise. Cette multiplication des usages force à se pencher sur les biais et le possible manque d’explicabilité des modèles NLP. Lire la suite

Conseils IT

Intelligence Artificielle et finance : les freins les plus courants (et comment les surmonter)

La gestion financière et la comptabilité ont beaucoup a gagné de l’Intelligence Artificielle. Mais les freins sont nombreux. En voici sept, très courants, et la manière de les lever pour vous assurer du succès de vos projets d’automatisation et de processus augmentés. Lire la suite

4Glossaire-

Quelques définitions