Guides Essentiels

Les théories et pratiques essentielles pour déployer l’IA générative

Introduction

Depuis l’apparition de ChatGPT en novembre 2022, l’IA générative a envahi l’actualité IT.

Du côté des fournisseurs et des éditeurs, deux approches voient le jour. Deux approches qui ne sont pas forcément antinomiques. Il y a le fait de proposer des boîtes à outils accessibles depuis une plateforme afin d’entraîner et de déployer de grands modèles de langage (ou Large Language Models). L’autre voie consiste à infuser des fonctions d’IA générative dans des produits afin de faire des modèles des assistants capables d’effectuer des tâches spécifiques.

Les acteurs engagés sur ces voies, Salesforce, Google Cloud, AWS, Microsoft – pensent que le cloud est la meilleure manière de répondre aux besoins liés à l’IA générative. Pour autant, il est loin d’être impossible de déployer une application sur site. C’est même l’une des raisons pour lesquelles Nvidia percevait une résurgence des stations de travail capables d’exécuter les modèles d’IA générative.

Si les fournisseurs tentent de tirer rapidement les fruits de cette technologie, les entreprises sont encore frileuses. Cela ne les empêche pas de lancer des PoCs pour se rendre compte des possibilités. Si les enjeux éthiques sont bien compris – ils expliquent en grande partie cette méfiance –, un ensemble de défis techniques demeurent.

Pour autant, un consensus fait jour. Les chercheurs le savaient déjà, mais pour déployer et maintenir en condition opérationnelle les grands modèles de langage, il s’agit de combiner plusieurs techniques. Il y a le recours aux méthodes de deep learning, comme le fine-tuning supervisé et l’apprentissage renforcé. Puis, il y a les techniques propres à l’exploitation des grands modèles de langage, à savoir le prompt engineering, le prompt tuning et la retrieval augmented generation (RAG).

L’une d’entre elles n’est clairement pas à la portée de tous. Les tutoriels pour mettre en pratique le fine-tuning des modèles ou le prompt tuning se multiplient sur le Web. En revanche, l’instauration d’une véritable approche d’apprentissage renforcé avec retour d’informations humain (RLHF) demande des moyens humains et techniques conséquents.

Les développeurs et les data scientists peuvent plus aisément maîtriser la création de prompts, les entrées pour obtenir les réponses souhaitées, et les bases de données vectorielles contenant les documents qui ancrent les contenus générés dans la réalité terrain de l’entreprise. Pour ce faire, les outils open source ou propriétaires pullulent.

Avant cela, il faut comprendre le fonctionnement des modèles d’IA générative. Ce guide essentiel vise à présenter les théories de conception et d’exploitation des grands modèles de langages ainsi que les éléments pratiques pour ce faire. Il met en exergue les efforts des éditeurs pour rendre possible la recherche vectorielle et évoque les risques induits par le choix de licence des fournisseurs de LLM.

Télécharger gratuitement ce dossier au format PDF

1Théorie-

Comprendre les rouages de l’IA générative

Conseils IT

« Petit » lexique de l’IA générative : les grands modèles de langage

L’IA générative est une technologie simple à comprendre, mais complexe à maîtriser. Ce lexique a pour objectif de lister et définir rapidement les concepts importants qui régissent le fonctionnement des grands modèles de langage. Lire la suite

Conseils IT

Prompt engineering et fine-tuning : quelles sont les différences ?

Le prompt engineering et le fine-tuning sont deux approches pour optimiser les résultats d’une IA générative. Toutefois, ces deux techniques jouent un rôle distinct dans l’entraînement d’un modèle LLM. Lire la suite

Conseils IT

Les leçons à retenir de l’entraînement de Llama 2

Llama 2 n’est pas la collection de modèles open source espérée. Il n’en reste pas moins que les méthodes décrites par les chercheurs de Meta devraient aider la communauté à y voir plus clair pour tenter de reproduire le succès de ChatGPT (et de GPT-4) sur des jeux de données privées. Lire la suite

2Pratique-

Les méthodes et outils pour exploiter les LLM

Conseils IT

Bien débuter son projet d’IA générative

Lors du salon Big Data & AI Paris 2023, Laurent Daudet, président et cofondateur de LightOn, a partagé l’approche de sa startup pour bien appréhender un projet d’IA générative. En découle une stratégie en cinq phases pour structurer les enjeux et les choix d’architectures nécessaires à la réussite d’une telle initiative. Lire la suite

Conseils IT

IA générative : les dix bonnes pratiques pour rédiger ses prompts

Poser les bonnes questions est essentiel pour utiliser efficacement l’IA générative. Découvrez 10 conseils pour rédiger des prompts clairs et utiles, et apprenez les erreurs communes à éviter ainsi que des conseils pour la génération d’images. Lire la suite

Conseils IT

L’essentiel sur LangChain

Quand il est question d’IA générative, LangChain revient souvent sur le devant de la scène. Qu’est-ce que c’est ? Comment cela fonctionne-t-il ? Ce conseil éclaircit les capacités principales de ce framework et ses cas d’usage. Lire la suite

Conseils IT

Application et IA générative : l’émergence d’une architecture type

L’architecture applicative universelle n’existe pas, mais un modèle s’impose quand il est question d’exploiter un grand modèle de langage (LLM). Il s’agit d’enrichir les résultats d’un modèle avec une base de connaissances. Une approche extensible, selon des data scientists employés de Red Hat. Lire la suite

3Zoom-

Le retour en grâce de la recherche sémantique

Actualités

Recherche vectorielle : Google Cloud mise sur AlloyDB (et PostgreSQL)

Lors de Google Cloud Next’23, le géant du cloud a annoncé la feuille de route consacrée à son portfolio de base de données. L’occasion pour le fournisseur de mettre l’accent sur l’adaptation des capacités AlloyDB à l’ère de l’IA générative. Lire la suite

Actualités

AI Vector Search : Oracle 23c se convertit à l’IA générative

Oracle 23c, la dernière version LTS de la base de données d’Oracle, est désormais entrée en disponibilité générale. Outre une meilleure prise en charge des objets JSON, le fournisseur se prépare à intégrer une fonctionnalité de recherche vectorielle pour enrichir les résultats des modèles d’IA générative. Lire la suite

Actualités

Knowledge Graph et IA générative : Neo4j se met à la recherche vectorielle

L’éditeur d’une base de données orientée graphes souhaite améliorer la recherche sémantique et les applications d’IA générative en permettant aux clients de mieux accéder aux données non structurées telles que le texte et les images. Lire la suite

Actualités

Les données non structurées encore trop délaissées, selon IDC

Les entreprises peinent à maîtriser et à exploiter leurs données non structurées, constate IDC dans une enquête menée pour le compte de Box. Une situation qui pourrait évoluer rapidement si les organisations souhaitent exploiter le potentiel de l’IA générative. Lire la suite

4Licences-

Exploiter commercialement l’IA générative, un défi

Actualités

Llama 2 : Meta confond open source et innovation ouverte

Contrairement à Google et Bard, Meta (Facebook) ne souhaite pas cacher ses efforts pour obtenir un grand modèle de langage capable de rivaliser avec GPT-4. Toutefois, si la licence associée au projet permet de l’exploiter commercialement, elle n’est pas open source, juge l’Open Source Initiative. Lire la suite

Actualités

IA Générative : Mistral AI ou la voie de l’open source avec « licence commerciale »

Pour contrer les supers modèles et leurs milliards de paramètres, la startup française Mistral AI mise sur l’open source et la spécialisation des modèles d’IA générative – grâce aux données des entreprises qui garderont la main sur l'ensemble de la stack. Lire la suite

Actualités

Éthique, MLOps, IA générative : la LF AI & Data fait le plein de projets

Au rythme moyen d’un nouveau projet incubé par mois, la LF AI & Data, la branche de la fondation Linux dédiée à l’intelligence artificielle, connaît un gain de popularité important. Outre des projets consacrés au MLOps et à l’explicabilité des algorithmes, l’ONG espère rallier les organisations autour de communs open source de l’IA générative. Lire la suite

5Glossaire-

Quelques définitions