YakobchukOlena - Fotolia
Google vs Microsoft : avec les chatbots, la guerre des moteurs de recherche est relancée
Le 6 février, Sundar Pichai, CEO de Google et d’Alphabet, a annoncé la disponibilité prochaine de Bard, un concurrent direct à ChatGPT qui sera intégré à son moteur de recherche. Le lendemain, Microsoft a dévoilé l’infusion dans Bing et Edge d’un cousin de ChatGPT. Plus que la guerre des chatbots, c’est une nouvelle bataille des moteurs de recherche qui se trame à l’horizon.
D’un côté du ring, OpenAI, créateur du flamboyant agent conversationnel ChatGPT, et son parrain Microsoft. De l’autre, Google, roi de la recherche par pertinence, mais aussi un des pionniers du NLP.
Champion incontesté dans ces deux domaines pendant des années, Google a vu l’émergence du « petit nouveau » qui, en mettant dans les mains du plus grand nombre un outil puissant de génération de texte et de code, lui a porté de sérieux coups, ridiculisant par la même occasion l’expérience utilisateur de tout moteur de recherche.
« Les avancées d’OpenAI et l’accès libre à ses capacités par un large public ont vraiment donné le ton et ont permis à Microsoft d’en tirer parti pour être considéré comme un leader dans ce domaine, grâce à ce partenariat », déclare William McKeon-White, un analyste de Forrester Research.
Le marché attendait une réponse de Google. Celui qui a propulsé les premiers « Transformers », dont le fameux BERT, se devait de réagir.
Bard, la réaction de Google à ChatGPT
William McKeon-WhiteAnalyste, Forrester Research
C’est dans ce contexte que Google a annoncé la disponibilité prochaine de Bard, « un service d’intelligence artificielle conversationnel expérimental utilisé en interne », indique Sundair Pichai, CEO de Google et d’Alphabet, dans un billet de blog.
« Nous franchissons une nouvelle étape en l’ouvrant à des testeurs de confiance avant de le rendre plus largement disponible au public dans les semaines à venir », informe le CEO.
Tandis que ChatGPT est issu de la cuisse de GPT-3 (175 milliards de paramètres), Bard est une émanation de LaMDA. LaMDA, ou Language Model for Dialog Applications, est un modèle NLP dévoilé en 2021, et dont la première ébauche – nommée Meena (2,6 milliards de paramètres) – avait été présentée en janvier 2020.
LaMDA est donc un modèle spécialisé dans l’émulation d’un dialogue avec un humain. C’est un Transformer dont l’entraînement a été supervisé à l’aide de 2, 8 et 137 milliards de paramètres ainsi que d’un corpus comprenant 1,56 « T mots » (2,97 milliards de documents, 1,12 milliard de dialogues et 13,39 milliards d’énoncés de dialogues). Ce travail est directement inspiré de celui d’OpenAI sur GPT-3.
« LaMDA a été préentraîné pour prédire le prochain token [un mot ou une syllabe par exemple N.D.L.R] dans un corpus de texte », avancent les chercheurs de Google. Son entraînement aurait pris près de 60 jours sur les TPU v3, les ASICs de Google Cloud. Puis, plusieurs phases d’affinage ont été menées. Elles ont consisté à mener des dialogues avec des testeurs humains en prenant en compte des critères de qualité, d’ancrage dans la réalité et de sûreté. Par exemple, les chercheurs souhaitaient trouver une solution pour que le modèle lie la génération de réponses à des sources et qu’il puisse mettre à jour ses informations. Pour rappel, la « connaissance » de ChatGPT s’arrête quelque part à la fin de l’année 2021.
Bard est une version « allégée » de LaMDA. « Ce modèle beaucoup plus petit nécessite beaucoup moins de puissance de calcul, ce qui nous permet d’atteindre un plus grand nombre d’utilisateurs et d’obtenir davantage de commentaires », avance Sundar Pichai. « Nous combinerons les réactions externes avec nos propres tests internes pour nous assurer que les réponses de Bard répondent à des critères élevés de qualité, de sécurité et d’ancrage dans le monde réel ».
De son côté, Microsoft a bien compris qu’en parrainant OpenAI, en investissant quelque dix milliards de dollars dans l’entreprise et en intégrant les technologies de son filleul dans ses propres produits de recherche, il pourrait enfin espérer renverser la vapeur sur le marché de la recherche en ligne.
Selon Statista, Google détient environ 84 % du marché mondial de la recherche, contre 9 % pour Bing. Ils sont suivis par une multitude d’autres sociétés, dont Yahoo avec environ 2,6 % ; Baidu, DuckDuckGo et d’autres détiennent 1,5 % ou moins.
Comment Microsoft infuse GPT-3.5 dans Bing et Edge
Le lendemain de la présentation de Bard, le 7 février, Microsoft a annoncé le lancement d’une préversion de Bing propulsée par un modèle NLG concocté par OpenAI et Microsoft. Il rassemble « les apprentissages et les avancées liés à ChatGPT et GPT-3.5 ». Il a été entraîné à l’aide d’une collection d’outils nommée Prometheus, qui par extension donne son nom à ce modèle. Cette technologie est également infusée dans Edge, le moteur de recherche de Microsoft.
Selon Microsoft, les « refontes » de Bing et de Edge comprennent une barre latérale de recherche avec des réponses plus complètes, la planification de voyages et d’itinéraires et la composition d’e-mails. Après un accès limité, réclamant de s’inscrire sur une liste d’attente, Microsoft ouvrira la fonctionnalité à des millions de personnes « dans plusieurs semaines ».
Lors d’un événement médiatique organisé à la hâte avec OpenAI, a vanté l’innovation dont Microsoft a été le parrain, et l’a qualifiée de « plus grande catégorie de logiciels sur la planète Terre ».
« C’est un nouveau jour pour la recherche, un nouveau paradigme, une source d’innovation rapide », a affirmé Satya Nadella.
Le PDG de Microsoft croit que la technologie qui a donné naissance à ChatGPT va « remodeler à peu près toutes les catégories de logiciels ».
Depuis Bing, Microsoft donne un aperçu des capacités de Prometheus. Ce dernier est capable de synthétiser une recherche à partir d’une question, pousser un résumé des réponses disponibles sur le Web et d’inclure les liens vers les pages Web utilisées comme source.
Parfois, l’outil ne fournit pas ses sources, ce qui laisse à penser que Microsoft a reproduit la méthode d’implémentation de GPT-3.5 dans un moteur de recherche présentée dans la documentation d’Azure OpenAI. En clair, même si Microsoft essaye de mettre en place des garde-fous, il n’est pas sûr que le modèle puisse de lui-même pointer du doigt vers des liens spécifiques. Il s’agit en premier lieu de résumer les résultats les plus pertinents obtenus par un moteur de recherche.
Une menace pour le modèle économique de Google…
Est-ce que Microsoft souhaite reprendre des parts sur le marché publicitaire numérique ? Souhaite-t-il tirer les fruits de nouvelles applications apportant davantage de valeurs aux utilisateurs ? Sûrement les deux. De son côté, Google est toujours déterminé à générer des revenus en vendant aux annonceurs les clics des utilisateurs dans les recherches, signale Johna Till Johnson, fondateur et analyste chez Nemertes.
Selon l’analyste, l’IA serait une question de survie pour Google. « Si “Google est ton meilleur ami” devient “ChatGPT est ton meilleur ami”, les recettes publicitaires de Google disparaîtront et la société implosera », avance-t-elle. « Bard a du sens dans ce contexte – si les gens se mettent à dire “Bard est ton meilleur ami”, Google aura réussi à défendre sa position ».
… Qui se veut beaucoup plus prudent
Dan MillerFondateur et analyste, Opus Research
Malgré son investissement intensif dans DeepMind, laboratoire spécialisé dans le deep learning, pour Dan Miller, fondateur et analyste chez Opus Research, Google a jusqu’alors fait preuve de retenue.
« Cela fait longtemps qu’ils auraient pu faire quelque chose comme ChatGPT », avance-t-il.
Aussi, LaMDA n’est autre que le modèle à l’origine du licenciement de Black Lemoine, un ingénieur de Google qui prétendait que cette IA était douée de sensibilité. Ce que Google a réfuté. Voilà sans doute pourquoi la société joue davantage de prudence que ses concurrents.
« Google va désormais mettre l’accent sur les partenariats qui mettent en place des garde-fous, ce que les modèles conversationnels comme ChatGPT ne font pas particulièrement bien », ajoute Dan Miller. « Il y a des lacunes dans ce qu’ils sont capables de faire ».
Les IA génératives prolifèrent
Par exemple, signal Dan Miller, en plus des problèmes de précision, les transformers pré-entraînés attelés à de grands modèles de langage tels que ChatGPT et Bard ne sont pas aptes à connaître les spécificités de beaucoup de choses, comme les entreprises et leurs marques et produits.
« Il y a beaucoup de travail à faire avant d’infuser ChatGPT ou Bard dans un centre de contact », illustre-t-il.
Avec l’émergence rapide de ChatGPT et de Bard, ainsi que d’une multitude de systèmes de conversion parole-image et texte-image, tels que Dall-E d’OpenAI, Midjourney et Stable Diffusion de Stability AI, ce que certains appellent l’IA générative est en pleine explosion.
Par exemple, Writesonic a lancé ChatSonic, un agent conversationnel semblable à ChatGPT qui, selon l’éditeur, remédie à certaines des limites de ChatGPT, comme son incapacité actuelle à fournir un contenu actualisé.