ipopba - stock.adobe.com
Santé : Docaposte lance son offre d’IA générative à la française
Docaposte se prépare à commercialiser son premier chatbot propulsé par un grand modèle de langage. La solution proposée aux médecins repose sur des technologies et des services de trois entreprises de droit français.
La filiale numérique de la Poste lance sa première solution « souveraine » d’IA générative. Elle s’adresse particulièrement aux acteurs du secteur public « exploitant des données sensibles ».
Docaposte collabore avec un trio français
Docaposte s’appuie sur le consortium NumSpot dont elle se sert pour héberger les plateformes de deux startups françaises : LightOn et Aleia.
Aleia est une « plateforme collaborative » permettant de gérer le cycle de vie des projets d’IA, de la préparation de données, en passant par la conception de modèles de machine learning et de deep learning, jusqu’à leur suivi en production. Aleia reprend à son compte les approches DataOps et MLOps. « Aleia est déjà utilisée par de grands industriels (surtout la branche de contrôle des équipements de centrales nucléaires d’Omexom, N.D.L.R), et par différents data spaces comme le Campus Cyber, IA Cargo », précise Docaposte.
Elle dispose d’un espace pour piloter des jeux de données, des notebooks, des modèles, des modules et des services. Un outil d’orchestration permet la mise en production des jobs et des services. Aleia propose également une fonction de gestion de rôle et de gouvernance de données.
Aleia répertorie par ailleurs une liste de modèles préentrainés, des templates pour simplifier les déploiements, un espace collaboratif et une capacité d’administration des ressources et du stockage. Aleia était déjà sur OVHcloud, Scaleway, et sur site.
LightOn est considéré comme l’une des jeunes pousses françaises prometteuses dans le domaine de l’IA générative. Elle a développé la plateforme Paradigm consacrée à l’entraînement et à l’inférence de modèles LLM. Cet été, elle a présenté Alfred 40B, sa déclinaison du modèle open source Falcon 40B.
Paradigm permet plus particulièrement de guider la gestion des prompts, la collecte des retours des utilisateurs et le fine tuning des modèles.
NumSpot, issu du partenariat entre Docaposte, la Banque des Territoires, Dassault Systèmes et Bouygues Telecom est l’offre de cloud public qui a été choisie pour porter la solution.
Le nerf de la guerre avec l’IA générative n’est autre que la disponibilité des GPU. En la matière, NumSpot indique avoir à sa disposition des instances GPU « qualifiées SecNumCloud », reposant sur les architectures Kepler (K2), Pascal (P6 et P100), Tesla (V100) et Ampere (A100). Plus précisément, elle s’appuie sur les infrastructures de 3DS Outscale.
L’entreprise portée par Dassault Systèmes a d’ores et déjà prévu d’intégrer des GPU H100 à son catalogue.
Aider les médecins à mieux compléter les dossiers de leurs patients
Docaposte, qui se présente comme un spécialiste de la signature électronique, la sécurisation de documents et l’archivage de données, souhaite se concentrer – pour l’instant – sur le développement de deux cas d’usage concernant la santé et le domaine réglementaire.
« Je travaille beaucoup avec les acteurs américains, mais nous considérons que les données de santé doivent rester sur les clouds européens », insiste Guillaume Leboucher, coordinateur du pôle Data/IA chez Docaposte.
La première solution se nomme MyAssistant Santé. Elle est entraînée à partir des documents de référence qui encadre le dossier patient. « Notre chatbot doit aider le docteur à se renseigner sur le dossier d’un patient qu’il s’apprête à traiter et à mieux restituer des informations dans ce même dossier », résume-t-il.
Guillaume LeboucherCoordinateur pôle Data/IA, Docaposte
Guillaume Leboucher est le fondateur d’OpenValue, une entreprise de conseils et d’intégration créée en 2015, spécialiste des technologies Microsoft Azure et Databricks. Docaposte a racheté OpenValue en 2021. Aujourd’hui, le responsable orchestre les activités de « 450 experts » dans les domaines du traitement de données et de l’IA au sein de Docaposte.
Les petits modèles s’imposent
Le noyau dur de l’équipe consacrée à l’IA générative est constitué d’une dizaine de collaborateurs, dont des data architects et des spécialistes du DataOps et du MLOps. Au total, une cinquantaine d’employés gravitent autour du projet depuis huit mois.
Les équipes de Docaposte ont eu l’occasion de tester Llama 2, les modèles d’OpenAI, Dolly de Databricks et les LLM de MosaicML. C’est finalement Alfred de LightOn qui a été choisi.
« Pour faire Paris-Poitiers, il n’y a pas besoin d’un A380 », illustre Guillaume Leboucher. Par là, le responsable explique qu’il n’est pas forcément nécessaire d’adopter les LLM d’OpenAI, d’Anthropic ou de Google, qui sont dotés de plusieurs centaines de milliards de paramètres. « Avec les bonnes données et le bon entraînement, il n’y a pas besoin de faire la course à l’échalote ».
Les résultats sont satisfaisants. « Nous ne sommes pas aussi à l’aise que lorsque l’on fait de la détection de fraudes, néanmoins, l’on sait que cela va venir », déclare-t-il, confiant.
Vers une IA générative estampillée SecNumCloud
Il s’agissait de prouver qu’il était possible de proposer une solution française de pied en cap.
Guillaume LeboucherCoordinateur pôle Data/IA, Docaposte
« L’idée, c’était de “marquer le coup” en expliquant qu’il est possible de gérer des données sensibles dans un cadre souverain et de confiance avec des acteurs français », assure Guillaume Leboucher.
Si la couche de calcul et de stockage utilisée par Docaposte est certifiée SecNumCloud, ce n’est pas le cas des plateformes d’Aleia et de LigthOn, ni de l’orchestrateur qui les portent.
« Nous allons discuter avec l’ANSSI afin de voir comment monter sur la couche de valeur avec eux », signale le coordinateur. « Ce n’est pas un sujet simple, mais si l’on peut être SecNumCloud de la tête au pied, on le sera ».
Un autre secteur dans le viseur de Docaposte
Les premiers retours obtenus par Docaposte auprès de praticiens sont très positifs. « Nous avons vu des médecins et des urgentistes hier, ils veulent tous tester notre chatbot », se réjouit le coordinateur.
En ce qui concerne la deuxième solution développée par Docaposte, le responsable ne préfère pas détailler le cas d’usage réglementaire, mais celui-ci pourrait s’avérer utile pour un bon nombre de professions, s’il voit le jour.
« Nous ciblons deux secteurs d’activités pour démarrer : la santé et le secteur public », affirme Guillaume Leboucher. « Nous n’avons pas vocation à concurrencer OpenAI et Anthropic ».
En clair, la filiale de La Poste n’a pas pour objectif de proposer une solution packagée s’appuyant sur Aleia et LightOn pour aider les entreprises et les organisations à entraîner leurs propres modèles.
« Nous y avons pensé, mais nous n’en sommes pas là », signale Guillaume Leboucher.
« Nous avons de nouveaux outils entre les mains. Nous essayons d’en faire quelque chose. Nous voulons mettre à disposition des solutions sur étagère pour aider les acteurs du secteur public à gagner du temps dans l’administration quotidienne du traitement de l’information ».
Dans un premier temps, Docaposte propose son assistant en mode projet afin de les ajuster aux besoins de ses clients. Puis, les agents conversationnels seront livrés en mode SaaS.
« L’IA générative, c’est aussi de l’informatique de gestion, c’est aussi de l’informatique qui permet de couvrir des cas d’usage métier que l’IA et les solutions traditionnelles ne faisaient pas. C’est le chemin que nous souhaitons emprunter », résume Guillaume Leboucher.