Que font les entreprises avec le Machine Learning ?
Détection de fraudes, moteurs de recommandations, arbre de décision, sécurité sont autant d’usage du Machine Learning en entreprise. On y apprend également la différence entre apprentissage supervisé et non supervisé.
Bien que le terme évoque immédiatement un futur technologique avancé, comme décrit par de nombreux auteurs de science-fiction, ce que le Machine Learning facilite reste aujourd’hui d’usage assez courant.
Par exemple, les moteurs de recommandation bâtis sur l'apprentissage statistique (Machine Learning) personnalisent la diffusion des publicités en ligne, souvent en temps (presque) réel. Ce n'est pas un hasard si une recherche de chaussures sur Amazon fait apparaître des annonces de chaussures sur d'autres sites Web.
Le Machine Learning est une catégorie d'algorithmes qui permet aux applications de prédire plus précisément les résultats, sans programmation explicite. Les entreprises s’appuient sur des plateformes pour développer des modèles. Ceux-ci sont alimentés par des données multi- sources et y appliquent l'analyse statistique afin de prédire un résultat, tout en mettant à jour le celui-ci à mesure que de nouvelles données deviennent disponibles.
Comme pour l'analyse prédictive et l'exploration de données, l'apprentissage statistique recherche dans les données pour identifier des tendances et des schémas particuliers et ajuste ensuite les actions en conséquence.
Il existe différents types d'algorithmes de Machine Learning, de simples à très complexes. En voici quelques exemples :
- les arbres de décision. Ces modèles s’appuient sur des observations de certaines actions et identifient la voie optimale pour arriver à un résultat souhaité ;
- le clustering. Cela regroupe des données dans un nombre précis de groupes, eux-mêmes bâtis sur des caractéristiques semblables ; et
- le renforcement de l'apprentissage, un domaine d'apprentissage en profondeur qui implique des modèles itératifs sur de nombreuses tentatives d'achèvement d'un processus.
Machine Learning supervisé ou non supervisé
Le Machine Learning se divise en deux catégories distinctes : le supervisé et le non supervisé.
Les algorithmes de ML supervisés nécessitent un spécialiste ou un analyste des données qui possède des compétences en ML et qui peut fournir à la fois l'entrée et la sortie souhaitée. Ils peuvent également observer la précision de la prédiction pendant l'apprentissage de l'algorithme et effectuer des corrections, si besoin.
Les data scientists déterminent les variables que le modèle doit analyser et utiliser pour élaborer des prévisions. Une fois créé, un algorithme applique ce qu'il a appris à de nouvelles données.
De leur côté, les algorithmes non supervisés n'ont pas besoin d'être formés avec les données de résultats. Ces algorithmes de Deep Learning examinent les données et arrivent à des conclusions.
Les réseaux neuronaux identifient des corrélations entre de multiples variables dans de grandes quantités de données. Ils utilisent ce qu'ils apprennent pour traiter les données entrantes. Ils sont mieux adaptés à des tâches de traitement plus complexes - comme la reconnaissance d'images, la synthèse vocale et la génération de langage naturel - que les systèmes d'apprentissage supervisés.
Machine Learning et data science
Le Machine Learning et la data science sont bien distincts, et ils diffèrent des plateformes d'analyse de données. Plus précisément, les plateformes de data science sont des hubs dans lesquels les travaux de science des données, comme l'intégration, la programmation, l'élaboration de modèles et l'exploration des données, peuvent être effectués en interne.
Les plateformes d'analyse permettent quant à elles d’effectuer des analyses afin d'obtenir des informations commerciales à partir de données.
Exemples de Machine Learning
L'apprentissage statistique est de plus en plus utilisé par les entreprises dans des scenarii ayant un impact important. En voici quelques exemples :
Moteurs de recommandation
Les moteurs ou systèmes de recommandation sont des plateformes de filtrage de données qui visent à prédire les préférences des utilisateurs ou à évaluer l’appétence d'un utilisateur pour un produit particulier. Les sites Web d’e-commerce utilisent ces systèmes, tout comme les sociétés de services financiers, les compagnies d'assurance, les restaurants et les entreprises de rencontres en ligne.
Ces moteurs produisent souvent des recommandations basées sur le filtrage collaboratif. Ce modèle se base sur le comportement passé d'un utilisateur ou sur des décisions similaires prises par d'autres utilisateurs. Ces moteurs peuvent également utiliser un filtrage basé sur le contenu. Il identifie les caractéristiques sémantiques d'un élément pour recommander d'autres éléments ayant des caractéristiques similaires.
Détection de fraudes
Les méthodes traditionnelles d'analyse des données pour détecter les fraudes prennent beaucoup de temps. Le Machine Learning peut jouer un rôle clé en regroupant et en classant les données et ainsi, identifier des modèles qui pourraient indiquer un comportement frauduleux. Les réseaux neuronaux, en particulier, peuvent apprendre des modèles suspects à partir d'échantillons de données.
Filtrage anti-spam et sécurité réseau
Le ML peut aussi aider à filtrer les courriels indésirables. On développe des modèles de classification qui font la distinction entre les courriels légitimes et les pourriels. L'objectif ultime est de créer des modèles avec un haut niveau de précision et un faible taux de faux positifs.
Étant donné que de nombreux rançongiciels et méthodes de phishing se présentent sous la forme de spam, la sécurité du réseau s'en trouve également renforcée. De plus, le ML peut détecter la présence d'intrus sur le réseau. Ces algorithmes aident les entreprises à détecter rapidement les activités malveillantes et à stopper les attaques avant qu'elles ne causent des dommages.
Voitures autonomes
Un cas d’usage très tendance porte sur les voitures autonomes. Le Deep Learning identifie des objets sur la route ou dans l'environnement et détermine la meilleure action pour guider le véhicule en toute sécurité.
Le Machine Learning évalue également des scénarii de conduite à l'aide de données recueillies par divers capteurs externes et internes, tels que des radars et des caméras.
Assistants virtuels / chatbots
Les assistants virtuels et les chatbots, deux applications qui reposent sur le langage naturel et les commandes vocales, peuvent accomplir des tâches comme la prise de dictée, la recherche de numéros de téléphone et le rappel de rendez-vous.
Les technologies qui alimentent les assistants virtuels et les chatbots nécessitent des quantités massives de données, et le Machine Learning est un élément clé.
Maintenance prédictive
C’est un des cas d’usage les plus répandus pour les entreprises dont l’IoT est une priorité. Le fait d'être en mesure de prévoir et de corriger les défaillances techniques ou la baisse de rendement avant qu'elles ne surviennent peut empêcher de graves et coûteux problèmes. La maintenance prédictive évite ainsi les temps d'arrêt dans les usines, très dépendantes de leur équipement de production.