Alexi TAUZIN - Fotolia

MarIAnne, l’IA d’Atout France pour les voyageurs

L’Agence de développement touristique de la France a déployé « MarIAnne » sur son nouveau site internet. En exploitant les modèles GPT-4o et Mistral 7B, l’assistant développé par la startup Genial propose des itinéraires de voyage.

Les Jeux olympiques de Paris 2024 s’annoncent comme un évènement sportif majeur, mais aussi touristique. La capitale table sur 15,3 millions de visiteurs sur la région francilienne – et 16,1 millions sur le territoire national.

Pour Atout France, l’agence de développement touristique du pays, le rendez-vous est préparé de longue date. En 2023, l’organisme a anticipé la refonte de son site France.fr et prévu dans ce cadre de déployer de l’intelligence artificielle générative.

L’interactivité, une caractéristique attendue des voyageurs

L’objectif était de se doter d’un « site efficace et fonctionnel à l’aube des Jeux olympiques », explique Eve Le Gall, sa directrice marketing adjointe. La nouvelle vitrine est en ligne depuis avril, d’abord en français et en anglais. Elle a ensuite été déclinée en 15 langues début juin.

« Avec cette refonte, nous voulions offrir une interface plus intuitive, immersive et accessible avec des fonctionnalités basées sur l’IA », poursuit la responsable d’Atout France.

Le coup de départ a été donné un an plus tôt.

Pour définir les contours de la refonte, l’agence s’est appuyée sur des ateliers et des études portant sur les habitudes de navigation des visiteurs. « L’interactivité est un point qui est beaucoup revenu lors des travaux préliminaires », explique la directrice marketing adjointe.

« Pour nous, en tant qu’opérateur d’État, il était primordial de travailler avec une startup française. »
Eve Le GallDirectrice marketing adjointe, Atout France

Les évolutions en matière d’IA, « très médiatisées », ont aussi été prises en compte dans le projet. Pour les traduire sous forme de fonctionnalités, Atout France a fait le choix de collaborer avec une startup bordelaise déjà connue dans l’industrie touristique : Genial.

« Pour nous, en tant qu’opérateur d’État, il était primordial de travailler avec une startup française », justifie Eve Le Gall. Atout France a aussi tenu compte des références « solides » de Genial dans le tourisme, parmi lesquelles Provence Tourisme et la Martinique.

MarIAnne, un générateur d’itinéraires de voyage sur la France

La startup a été chargée de développer la dimension interactive de la nouvelle version de France.fr au travers d’un générateur d’itinéraires touristiques personnalisés et d’un chatbot. Le nom de ce service basé sur des modèles d’IA générative : « MarIAnne ».

Atout France a développé son propre hub de données avec Cleyrop, mais l’assistant n’est pas exécuté on-premise sur sa plateforme. L’hébergement est géré par Genial via les services cloud d’AWS.

« Nous sommes dans une logique plutôt agnostique du choix des modèles. L’enjeu est celui de la performance et de la stabilité des réponses. »
Erwan SimonCEO, Genial

Pour concevoir MarIAnne et ses itinéraires à la carte, la startup exploite différentes briques technologiques, dont LangChain pour son système d’agents et Cloud Run pour la vectorisation des bases de données touristiques.

Sur la partie modèles de langage (LLM), deux sont utilisés et benchmarkés en parallèle : GPT-4o (et avant la sortie de la mise à jour 4o, GPT-4) et Mistral 7B (sans fine-tuning).

« Nous sommes dans une logique plutôt agnostique du choix des modèles. L’enjeu est celui de la performance et de la stabilité des réponses », explique Erwan Simon, CEO de Genial. Ce choix d’ingénierie est notamment justifié par l’ajout d’une UX non conversationnelle à MarIAnne. « Les réponses du modèle doivent nécessairement être en JSON, afin de pouvoir être exploitées ensuite dans une mise en forme ». Cette étape est exécutée avec des résultats qui varient selon le modèle mobilisé.

Mistral 7B et ses versions éprouvés et comparés à GPT-4o

La restitution au format JSON constitue « une des fragilités de Mistral ». C’est pour ce motif que la startup associe également le modèle d’OpenAI – tout en donnant la possibilité d’afficher un comparatif des performances des deux LLMs.

« Nous avons testé les versions Small, Medium et Large de Mistral. Les tests traduisent la supériorité de ces modèles en termes de rapidité sur OpenAI. En revanche, ils se montrent moins performants sur la pertinence des réponses », avance le dirigeant de Genial.

Pour traiter les hallucinations, l’assistant va qualifier le voyageur par le biais de questions multiples. Ces questions sont intégrées au sein d’un prompt – invisible pour l’utilisateur – qui permet de fabriquer le programme d’activités.

La proposition d’itinéraire « est consolidée avec un socle de données fabriqué » en puisant dans une base de données développée en amont intégrant des informations liées au tourisme (Data Tourisme), aux hébergements classés, des photos (80 000 lieux), etc.

« Nous avons créé et vectorisé un socle de près de 350 000 points d’activités », indique Erwan Simon. La proposition d’itinéraire émise par Mistral ou OpenAI est directement rapprochée des données de la base pour vérifier la pertinence de la réponse du modèle. Si la proposition ne correspond pas à des données existantes, elle est alors remplacée par un itinéraire équivalent figurant en base.

Un risque d’hallucination contrôlé

Le projet mené auparavant avec la Martinique – pour la conception d’un « travel planner » – avait permis de mettre en évidence l’importance des risques d’hallucination. « Plus on est précis sur la demande et plus le modèle risque d’halluciner sur les activités possibles », constate le cofondateur de Genial.

Pour réduire ces effets, il a fallu en amont « cadrer le besoin du compagnon de voyage pour la France ».

« Plus on est précis sur la demande et plus le modèle risque d’halluciner sur les activités possibles. »
Erwan SimonCEO, Genial

Le contrôle des hallucinations comme la qualité de l’expérience utilisateur reposent sur trois leviers principaux que sont les données (identification des sources), l’ingénierie du modèle et l’UX.

Genial s’est appuyé sur son « trip planner » existant qu’il a ensuite personnalisé pour intégrer des fonctionnalités supplémentaires demandées par Atout France, dont l’éditeur d’itinéraires et le hub pour le partage avec d’autres internautes.

Un module de supervision a aussi été ajouté pour le pilotage interne de l’assistant (indicateurs, volume de données, trafic, etc.). Afin de déterminer les capacités informatiques à allouer à l’exécution de MarIAnne, Genial est parti d’une estimation de trafic redirigé vers l’assistant, comprise entre 2 et 5 % et d’une prévision de volume d’itinéraires générés.

« Cela a permis de prévoir la charge des tokens et des coûts d’API pour les solutions. », commente Erwan Simon. Après quelques semaines, et sans campagne de communication auprès du grand public, Atout France dénombrait 3 500 sessions sur MarIAnne et 2 000 itinéraires générés.

Un service IA écoconçu pour réduire l’impact et les coûts

Dans une optique d’écoconception et de maîtrise des coûts, les itinéraires générés par l’IA (qui ne contiennent pas de données personnelles) sont conservés et constituent une bibliothèque d’itinéraires existants. Avant de générer une requête auprès des modèles, l’application interroge d’abord cette base.

Le site d’Atout France embarque un second agent IA (indépendant, mais interconnecté au premier) : un chatbot. « Le premier agent est dédié à la construction de l’itinéraire, le second à apporter des précisions sur cet itinéraire, par exemple pour calculer le budget des vacances associé », en spécifiant des critères.

Actuellement, le deuxième agent exploite GPT-4o – sélectionné pour la qualité des réponses. Parallèlement, le modèle 7B de Mistral est testé. Genial s’appuie sur de l’AB testing et les feed-back utilisateurs pour comparer la pertinence des réponses fournies.

Pour mesurer le succès de ses agents, Atout France prévoit une évaluation d’ici plusieurs semaines sous forme de « post-tests ». Le « reach », c’est-à-dire le nombre d’utilisateurs du service, reste le premier indicateur suivi par l’agence.

Pas de transactionnel et des données non personnelles

« L’objectif est de venir renforcer la promotion de la richesse du territoire français à l’échelle mondiale », souligne Eve Le Gall. Les données d’usage de l’assistant de voyage sont aussi très attendues pour nourrir la connaissance des touristes, en particulier leur origine géographique et leurs centres d’intérêt.

« Ces informations, comme la répartition des budgets et les destinations de prédilection, sont utiles pour nous permettre d’orienter nos actions de communication. »
Eve Le GallDirectrice marketing adjointe, Atout France

« Ces informations, comme la répartition des budgets et les destinations de prédilection, sont utiles pour nous permettre d’orienter nos actions de communication » étaye la directrice marketing adjointe.

Les investissements consacrés à MarIAnne relèvent de la promotion touristique. Le service n’intègre pas de volet transactionnel, par exemple via de la réservation. Cette dimension peut être couverte par une application de ce type cependant. L’assistant développé par Genial pour la Martinique est par exemple associé à de la location de voiture pour les croisiéristes. La commercialisation de CityPass peut également constituer un levier de monétisation et de rentabilisation d’un assistant génératif.

Atout France planche à présent sur la V2 de MarIAnne afin d’enrichir les données via la connexion avec d’autres bases du secteur..

Pour approfondir sur IA appliquée, GenAI, IA infusée