Sergey Nivens - Fotolia
GenAI : Microsoft veut simplifier la mise en production des assistants de développement
Les mises à jour effectuées par Microsoft cette semaine visent à résoudre les difficultés rencontrées par les premiers utilisateurs de l’IA générative en entreprise, qui ont freiné les efforts de déploiement en production des premiers projets.
Après 18 mois de battage médiatique intense mené par la plupart des acteurs du marché IT, il n’y a toujours que des signes légers d’utilisation réelle de l’IA générative par les entreprises traditionnelles.
En fait, une enquête récente de Gartner suggère que le « creux de la désillusion » pourrait déjà pointer le bout de son nez.
Au quatrième trimestre 2023, plus de la moitié (52 %) des projets d’IA n’avaient pas encore été mis en production, selon l’enquête « AI in the Enterprise » de Gartner, réalisée auprès de 703 personnes occupant des postes de direction dans des entreprises aux États-Unis, au Royaume-Uni et en Allemagne.
Jason WongAnalyste, Gartner
« Il y a encore beaucoup de risques d’échec. Certaines entreprises constatent que l’IA n’est pas aussi révolutionnaire qu’elles le pensaient, ce qui les pousse à ne pas la mettre en œuvre », déclare Jason Wong, analyste chez Gartner. « Soit elles découvrent qu’elles ne disposent pas de la qualité de données nécessaire pour lancer un produit à part entière ou un outil accessible en production, soit elles réalisent des tests et se demandent si le coût en vaut la peine ».
Comme dans la vague initiale de promotion des outils AIOps reposant sur d’autres formes modèles d’IA, de nombreuses entreprises ont découvert que l’efficacité des outils d’IA générative dépend fortement de la qualité des pratiques d’automatisation et de la gestion des données, ajoute Jason Wong.
« Les dirigeants nous disent : “nos employés ne trouvent rien. Notre système de recherche ne fonctionne pas. Nous allons donc confier la tâche à Copilot [Microsoft], qui se chargera de mettre de l’ordre dans tout ce bazar” », avance M. Wong. « Mais vous devez étiqueter vos données, les classer, les catégoriser – et si vous l’aviez fait dès le départ, vous auriez une meilleure recherche ».
Microsoft renforce les liens entre IA et aide au développement
Jason WongAnalyste, Gartner
Lors de sa conférence Ignite en novembre, Microsoft a présenté Fabric, une offre destinée à l’intégration des données et à l’analytique. Le chatbot Copilot au sein de Fabric, destiné à aider les utilisateurs à construire des pipelines de données plus facilement, est entré en disponibilité générale lors de la conférence Microsoft Build de mardi.
Une fonction en perversion appelée AI skills in Fabric est censée aider « les analystes, les créateurs, les développeurs et même ceux qui ont une expertise technique minimale […] à construire des expériences d’IA intuitives avec des données pour débloquer des perspectives », selon un communiqué de presse de Microsoft.
Le fournisseur a également ajouté des fonctions censées simplifier l’usage de l’IA générative et des garde-fous pour des ingénieurs logiciels. Par exemple, la version 17.10 de Visual Studio, l’IDE commercial de Microsoft, intègre officiellement l’assistant de code Github Copilot, en disponibilité générale et en production.
Cette intégration a été présentée en préversion dans plusieurs versions de Visual Studio. Par exemple, l’IDE gratuit et plus léger de Microsoft, Visual Studio Code, prend depuis longtemps en charge GitHub Copilot. Mais à partir de la version 3 de Visual Studio, « GitHub Copilot et Copilot Chat sont disponibles à l’installation en tant qu’extension unique qui combine à la fois Copilot et Copilot Chat en un seul paquet intégré et recommandé par défaut dans toutes les charges de travail », selon la documentation de Microsoft.
Microsoft a également intégré GitHub Copilot à son outil de complétion de code Visual Studio IntelliSense. Bien que certains chevauchements entre les deux outils semblent déroutants, un professionnel de l’IT considère que cette combinaison pourrait être particulièrement intéressante pour les entreprises. « IntelliSense est capable de trouver des bibliothèques qui sont liées au code, mais l’outil appelle Copilot pour ajouter les variables dans la bibliothèque afin de compléter le résultat », déclare Nick Cassidy, ingénieur en chef de l’innovation chez Blue Shield of California, qui a souligné que ses opinions ne reflètent pas celles de son employeur. « Si j’écrivais un nouveau morceau de code, j’utiliserais probablement Copilot sans IntelliSense. Mais [pour] apporter des modifications à du code existant, je pense que [cette combinaison] pourrait être utile ».
L’intégration de nouvelles technologies d’IA dans des outils familiers pourrait aider les développeurs à comprendre plus rapidement comment les utiliser, d’après Larry Carvalho, analyste indépendant chez RobustCloud, une société de conseils IT. « Les développeurs choisiront l’IDE qui leur est le plus familier, et les outils Microsoft sont populaires auprès d’un large segment de développeurs », affirme-t-il.
La prise en compte du contexte dans l’intégration GitHub Copilot de Visual Studio « permettra à Microsoft de garder une longueur d’avance sur la concurrence en aidant les développeurs », anticipe-t-il.
De même, un lot de mises à jour consacrées à Azure AI Studio dévoilées cette semaine pourrait aider un client de Microsoft à surmonter les obstacles à une utilisation plus large de la GenAI en production. Ces ajouts comprennent des architectures de référence actualisées, des accélérateurs de zone d’atterrissage (landing zone) et des guides d’utilisation pour le service Azure OpenAI, une préversion d’un service de modèles d’IA accessibles à la demande et la prise en charge de la surveillance des performances des applications propulsées par des LLM.
« L’adoption de l’IA dans de nombreuses entreprises se heurte encore à de grandes difficultés, qu’il s’agisse de recruter du personnel compétent, de définir une architecture sur des technologies qui évoluent rapidement ou sont obsolètes, ou de trouver les ressources matérielles et les partenaires nécessaires pour prendre en charge les niveaux de service critiques », affirme Nuno Guedes, responsable du cloud chez Millennium BCP, la plus grande banque privée du Portugal. « Les annonces de cette année témoignent d’un effort global pour abaisser ces barrières à l’entrée ».
Les utilisateurs de Microsoft 365 pourront également découvrir des versions préliminaires d’extensions tierces pour des outils tels que Jira d’Atlassian dans Copilot Studio et Teams Toolkit for Visual Studio. Selon Jason Wong de Gartner, cette fonctionnalité est remarquable pour les utilisateurs non techniques et les développeurs citoyens qui souhaitent concevoir des chatbots personnalisés.
« D’après nos conversations avec les clients, Copilot Studio suscite un vif intérêt et un suivi de la part des entreprises qui ont commencé à mettre en œuvre Microsoft 365 Copilot », note l’analyste de Gartner. « Mais une question se pose : “Comment obtenir davantage de données basées sur les rôles à partir d’autres systèmes, d’autres sources de données, d’autres applications ?”. Certains clients s’y sont essayés, mais l’approche du plugin complet est encore en cours d’élaboration ».
Profusion d’outils, ROI difficile à estimer : des DSI submergés par l’IA générative
Outre l’hésitation des entreprises vis-à-vis de l’IA générative en raison des problèmes de qualité des données et des préoccupations relatives à la sécurité, à la confidentialité des données et à la gouvernance, à ce stade, il y a tout simplement trop d’outils d’automatisation et d’IA générative sur la table, signale Nick Cassidy. « Ce qui me préoccupe en ce moment – et je pense qu’une grande partie de l’industrie commence à s’en rendre compte – c’est de savoir comment comparer Watsonx [Code Assistant] à GitHub Copilot maintenant qu’il y a une véritable concurrence sur ce marché », s’interroge-t-il. « Certaines de ces annonces sont tellement confuses qu’elles ne me donnent même pas assez d’informations pour que j’y prête réellement attention. Ce n’est qu’un bruit de fond ».
Les clients de Gartner qui pilotent des produits GenAI trouvent que les comparaisons approfondies des preuves de concept entre les produits sont également déroutantes, en particulier lorsqu’il s’agit d’évaluer leur retour sur investissement, acquiesce Jason Wong. « Nous observons des entreprises qui regardent cela et qui disent : “Nous avons besoin d’un retour sur investissement ici. Nous ne pouvons tout simplement pas payer pour tout cela sur la base d’un espoir de ROI” ».
Les assistants de programmation ont probablement été adoptés plus tôt par les entreprises, en partie parce qu’il est relativement facile pour certaines sociétés d’évaluer s’ils augmentent la productivité des équipes de développeurs, poursuit l’analyste de Gartner. « Elles peuvent comparer une équipe qui les utilise à une autre qui ne les utilise pas ».
Pour Nick Cassidy, cependant, ce n’est pas nécessairement simple. « Il y a tellement de variantes et de facteurs qui peuvent entrer en ligne de compte dans la performance d’un développeur, que ce que je constate, c’est qu’il est peut-être plus facile de poser des questions sur l’expérience du développeur (“Êtes-vous plus heureux depuis que vous utilisez un assistant ?”). Mais je peux facilement voir des développeurs débutants s’appuyer un peu trop sur l’assistant de code et supposer que les résultats sont immédiatement corrects ».
Chez la banque portugaise Millenium BCP, malgré ces difficultés, Nuno Guedes recense quelques projets d’IA générative en production en dehors de la sphère du développement. Il indique que ces déploiements découlent d’une approche itérative se concentrant sur de petits projets répondant à des cas d’usage spécifiques dont les retours sur investissement sont relativement bien définis. Jusqu’à présent, les projets réussis qui utilisent cette approche concernent l’amélioration de l’accès à l’information interne pour les équipes de support produit et client, la conversion de données dans différents formats, par exemple l’application du speech to text, l’analyse des sentiments et l’évaluation de la qualité.
« Ayant compris que le rythme actuel de l’innovation ne permet pas des déploiements stables à long terme, nous nous concentrons sur l’itération et les tests dans le monde réel et prenons des décisions en fonction des résultats obtenus », décrit Nuno Guedes.