metamorworks - stock.adobe.com
IA : Microsoft s'entoure pour proposer des SLM industriels
Microsoft travaille avec plusieurs éditeurs de logiciels spécialisés dans différents secteurs industriels afin d'apporter de petits modèles de langage spécifiques à certains domaines, accessibles depuis sa plateforme Azure AI. Ces SLM peuvent être déployés sur le cloud ou en Edge.
Afin de rendre l'intelligence artificielle plus tangible, Microsoft collabore avec un certain nombre de plateformes industrielles pour fournir des petits modèles de langage (SLM) à son catalogue Azure AI.
Les modèles spécifiques à l'industrie, dont la plupart sont entraînés sur la base de la collection de SLM Phi 3 de Microsoft, représentent une expansion des capacités d'IA adaptées à l'industrie de l'entreprise, qui, selon elle, cible des besoins et des défis spécifiques dans des secteurs allant de la santé à la finance et de l’industrie manufacturière.
« En intégrant le cloud de Microsoft à nos capacités spécifiques à l'industrie et à un solide écosystème de partenaires, nous fournissons une approche sûre pour faire progresser l'innovation dans certains verticaux », écrit Satish Thomas, vice-président des solutions d'entreprise et d'industrie chez Microsoft, dans un billet de blog.
« Cette collaboration nous permet de créer de vastes scénarios pour les clients du monde entier, avec des capacités d'IA intégrées - des solutions de données industrielles dans Microsoft Fabric aux agents d'IA dans Microsoft Copilot Studio et aux modèles d'IA dans Azure AI Studio ».
Satish Thomas précise que les modèles seront disponibles soit à travers le catalogue de modèles Azure AI, qui offre une gamme de LLM pour construire des applications d'IA personnalisées dans Azure AI Studio, soit directement auprès des partenaires de Microsoft. Il ajoute que ceux disponibles dans le catalogue peuvent également être utilisés pour configurer des agents dans Copilot Studio, la plateforme de Microsoft pour créer et déployer des agents personnalisés alimentés par l'IA.
Bayer, Siemens, Rockwell Automation, Cerence : des alliés de choix dans l’industrie
Parmi ces modèles, l’on trouve ELY Crop Protection de la société Bayer, le fameux spécialiste des domaines de la santé et de l'agriculture. Selon Bayer, ce SLM spécialisé est conçu pour améliorer la protection des cultures, l'utilisation durable, l'application, la conformité et les connaissances dans le secteur de l'agriculture. Dans les faits, il « est destiné aux agronomes et vise à fournir des informations utiles et opportunes sur la lutte contre les mauvaises herbes, les maladies et les ravageurs, sur la base d'une bonne compréhension des étiquettes et des fiches de données de sécurité des produits phytosanitaires américains de Bayer ». Il serait déjà utilisé par 1500 « employés de première ligne » aux États-Unis, mais le groupe allemand ne précise pas si le SLM est déployé auprès des agronomes, des commerciaux itinérants ou des clients exploitants agricoles.
Parmi les autres grands noms, citons Siemens Digital Industries Software. L’éditeur a mis au point un nouveau copilote pour son logiciel NX X. Selon Siemens, ce copilote utilise un modèle d'IA adapté qui permet aux utilisateurs de poser des questions en langage naturel, d'accéder à des informations techniques détaillées et de rationaliser des tâches de conception complexes pour un développement de produits plus rapide et plus intelligent. Le copilote vise à fournir aux concepteurs CAO des recommandations et de bonnes pratiques basées sur l'IA afin d'optimiser le processus de conception dans le cadre de l'expérience NX X.
Dans le secteur financier, l'entreprise technologique Saifr, spécialisée dans la conformité réglementaire et soutenue par l'incubateur d'innovation de Fidelity Investments, Fidelity Labs, a introduit en préversion quatre nouveaux modèles de NLP et de computer vision dans le catalogue de modèles Azure AI. La documentation semble indiquer que ce ne sont pas des modèles en provenance de la collection Phi 3.
Il y a d’abord Saifr Language Suggestion. Ce modèle NLP scanne des contenus à destination de l’externe et identifie les éléments qui ne seraient pas conformes en matière de régulations ou de politiques internes financières. Il génère ensuite des suggestions pour modifier les communiqués de presse ou financiers, par exemple.
Saifr Risk Interpretation, lui, détecte et explique pourquoi une phrase est conforme ou non avec la règle FINRA 2210, un document qui définit les normes en matière de communication avec le public pour une entreprise cotée en bourse aux États-Unis.
Par ailleurs, Saifr a entraîné un classificateur d’images sur une grande quantité de données liée à des produits financiers. « Le modèle est conçu pour aider les responsables de la conformité, les équipes juridiques et les équipes de marketing à identifier et à atténuer les risques associés au contenu des images dans les communications publiques, afin de s'assurer que les communications sont conformes aux normes réglementaires », précise Saifr dans la description fournie sur le catalogue Azure. Parmi les images non conformes, l’on trouve les arbres sur lesquels poussent des billets, des coffres-forts – synonymes d’investissements sans pertes – ou encore des diagrammes représentant une croissance exponentielle.
Enfin, Saifr propose un modèle de conformité marketing censé détecter et noter selon un niveau de sévérité les propositions potentiellement prometteuses, trompeuses, exagérées ou injustifiées en anglais.
Rockwell Automation fournit le modèle FT Optix Food & Beverage, qui, selon l'entreprise, apporte les avantages des capacités spécifiques à l'industrie aux travailleurs de première ligne dans la fabrication, en soutenant le dépannage des actifs dans le domaine de l'alimentation et des boissons. Selon Rockwell Automation, ce modèle fournit des recommandations, des explications et des connaissances sur des processus de fabrication, des machines et des intrants spécifiques aux ouvriers et aux ingénieurs de l'usine.
En outre, le SLM fine-tuné du développeur de logiciels embarqués Cerence s'exécute dans le matériel d'un véhicule dédié à l’infotainment (pour répondre aux questions des automobilistes). Factory Namespace Manager, celui de SightManager, analyse les données d'usine existantes, apprend les patterns et les règles qui sous-tendent les conventions de dénomination, puis traduit automatiquement les noms des champs de données dans un format normalisé. SightManager considère son dérivé de Phi 3 Mini comme un bon outil pour modifier les tags des capteurs, un sujet récurrent lors du déploiement de gros projets IIoT.
En sus de ces modèles propriétaires, Microsoft propose cinq modèles NLP open source fine-tunés sur des données financières depuis HuggingFace (par exemple, FinancialBERT –, Sentiment Analysis ou financial-summarization-pegasus).
SLM : Microsoft n’est pas le seul sur le terrain
Scientifiquement, l’équipe de recherche de Microsoft est l’une des plus avancées en matière de SLM, mais elle n’est pas la seule à prendre cette voie. Mistral AI a récemment présenté les Ministraux, Google mise sur Gemma 2-2.6B, tandis que les capacités des modèles Qwen 2.5 du Chinois Alibaba Cloud sont saluées par la communauté.
Aussi, Infosys dit entraîner des SLM consacrés au cœur de son activité, la gestion IT, dans sa suite Topaz en s’appuyant sur la pile technologique de Nvidia, dont les microservices d’inférence NIM. Ceux-là ne sont pas encore disponibles sur le catalogue du géant des GPU. ABBYY, lui, assure exploiter des SLM dans sa suite Phoenix consacrée à la gestion intelligente de documents. Cependant, l’entreprise n’utilise pas de petits LLM, mais des modèles NLP de type transformer (RoBERTa) ou de vision par ordinateur type CNN, en sus de biLTSM, des modèles LTSM bidirectionnels, capables de traiter de données dans un sens (à partir de l’entrée) et dans l’autre (à partir de la sortie). Si la dénomination SLM n’est pas fausse, ces technologies datent de l’ère « pré-GPT ».
Toutefois, aucun de ces acteurs n’a la position dominante de Microsoft, dans le monde de l’IT, mais aussi de l’IT-OT.