IA générative : Kiloutou a déjà sa plateforme à tout faire

Le spécialiste français de la location de matériel capitalise sur son choix de la plateforme Snowflake en 2018. Il met aujourd’hui en œuvre les fonctions les plus avancées de la plateforme Data, notamment en matière d’IA générative, avec un système RAG et l’analyse automatique des documents.

Il n’est sans doute pas sollicité par tout le monde, mais Kiloutou possède une marque emblématique. Le groupe français spécialisé dans la location de matériels et équipements de chantier est présent dans sept pays européens. Il y réalise 1,2 milliard d’euros de chiffre d’affaires et compte 6 715 collaborateurs. L’entreprise propose plus de 1 000 équipements et véhicules différents à la location.

En revanche, en matière de gestion de données, Kiloutou ne jure que par une seule plateforme. Il a fait le choix de la Data Platform Snowflake dès 2018 et fut le deuxième client en France à basculer son Data Warehouse vers l’offre du plus français des Américains.

« Le remplacement du Data Warehouse Oracle par Snowflake n’était qu’un premier pas de la transformation Data du groupe Kiloutou », explique Arnaud Maton, chief data & AI officer du groupe Kiloutou. « Depuis 2018, l’éditeur a apporté de grandes évolutions à sa plateforme. Nous les avons mises en œuvre au fur et à mesure que les nouvelles fonctionnalités étaient rendues disponibles. »

Arnaud Maton, Chief Data & AI Officer, KiloutouArnaud Maton,
Chief Data & AI Officer, Kiloutou

Parmi elles, la fonction de partage de données pour laquelle Kiloutou a reçu avec son partenaire Pricemoov le premier Award Data Sharing en France de la part de l’éditeur. Cette fonction de partage sécurisé avait permis de mettre en place la tarification dynamique au sein des agences. L’entreprise a ensuite mis en œuvre les frameworks Python et Streamlit.

Ce dernier est issu du rachat de la société éponyme. Streamlit doit faciliter la création d’applications écrites en python,  axées sur les données et nativement intégrées à l’écosystème Snowflake. Plus récemment, Kiloutou a commencé à mettre en œuvre les fonctions de la plateforme liées à l’IA et à l’IA générative, Cortex AI et Document AI.

Snowflake est devenu la pierre angulaire du numérique chez Kiloutou

Toute l’architecture de données de Kiloutou est aujourd’hui articulée autour de Snowflake. Tant et si bien que la plateforme, déployée sur AWS, s’est imposée comme le centre de l’écosystème de transformation numérique de l’entreprise.

« Nous utilisons toutes les capacités internes de la plateforme pour transformer la donnée et la mettre à disposition des différentes directions métier. »
Arnaud MatonChief data & AI officer, groupe Kiloutou

« L’ensemble de nos applicatifs métiers déversent leurs données sur la data platform par différents moyens », explique Arnaud Maton. Les partenaires qui exploitent également Snowflake utilisent le data sharing. D’autres intégrations de données sont réalisées via la solution Talend ou par l’outil d’ingestion automatisée des données Snowpipe. « Nous utilisons toutes les capacités internes de la plateforme pour transformer la donnée et la mettre à disposition des différentes directions métier », résume le responsable. « Toutes nos données sont accessibles en mode Data Mesh : elles sont organisées en domaines métiers et différents cas d’usage viennent consommer ces données. »

Parmi ces « consommateurs » de données figurent des outils de visualisation de données historiques. Kiloutou utilise encore Business Objects et Tableau, mais aussi de plus en plus de piles technologiques modernes d’échange de données à destination de clients. « Ces stacks nous permettent également de développer et de déployer des applications pour nos équipiers ou nos clients », ajoute Arnaud Maton.

L’IA générative à disposition dans la plateforme

L’annonce de Cortex AI, le volet de la plateforme Snowflake, consacré à l’IA générative fin 2023, était un véritable appel du pied pour le chief data & AI officer de Kiloutou. Un premier cas d’usage a été déployé. « Notre premier cas d’usage vise à améliorer l’expérience client sur Kiloutou.fr. Cette fonctionnalité n’est pas encore en production, mais elle est en cours de test », signale-t-il.

« Avec ce PoC, nous avons cherché à permettre une recherche via une requête en langage naturel et avoir une restitution permettant de trouver le bon produit ou une liste de produits potentiellement indiqués. »
Arnaud MatonChief data & AI officer, groupe Kiloutou

« Avec ce PoC, nous avons cherché à permettre une recherche via une requête en langage naturel et avoir une restitution permettant de trouver le bon produit ou une liste de produits potentiellement indiqués », poursuit-il. « Nous avons exploité les données de l’ensemble de nos fiches produits déjà chargées dans Snowflake, de même que les fiches techniques de notre site Web, ainsi que les pages produit de Kiloutou.fr. Toutes ces données sont fiables, maîtrisées et de qualité. »

Le module de Cortex AI en question (Cortex Search) dissimule une architecture RAG (Retrieval Augmented Generation). Celui-ci prend la question, lance une recherche dans un ensemble de données vectorisées et les données d’entraînement du système, puis délivre une réponse contextualisée. L’atout de la solution est que tout est intégré à la plateforme Snowflake.

Pour le PoC, une IHM a été développée sur le framework Streamlit, une solution qui présente l’atout de ne pas nécessiter le déploiement de conteneurs externes. L’utilisateur peut demander en langage naturel en français ou en anglais une nacelle à mât électrique montant à plus de 10 mètres. Cortex AI retrouve dans les données les machines qui répondent à ces contraintes et donne les produits possibles.

« La première réponse est mise en avant par le moteur, mais il donne aussi d’autres résultats répondant à la demande de l’utilisateur », précise Arnaud Maton. « Nous avons délibérément choisi ce format de réponse », signale-t-il. « Nous voulions donner un lien vers une de nos fiches matériel et éventuellement vers d’autres fiches potentiellement intéressantes. Nous avons aussi voulu donner accès à nos fiches techniques détaillées qui sont également accessibles sur notre site pour les techniciens. »

En cliquant sur le lien, l’utilisateur bascule sur la fiche produit du site Kiloutou.fr. Dans cette phase de PoC, la réponse est limitée à 10 produits maximum. Celle-ci n’est pas encore intégrée à la barre de recherche du site. Le ROI de la fonctionnalité doit encore être évolué pour que cette capacité soit intégrée au site public.

Un second cas d’usage est, lui, déjà en production. Celui-ci s’appuie sur une autre fonctionnalité d’IA générative délivrée par la plateforme Snowflake : Document AI. Ce service est issu du rachat d’Applica par Snowflake en 2022. Il permet à l’éditeur de fournir un outil d’extraction de contenus sur des documents. « Ce qui est intéressant pour nous, c’est que cette capacité est totalement intégrée aux données déjà présentes dans Snowflake », répète le directeur des données. « Si un document non structuré comme un pdf est nativement stocké sur la plateforme, alors on peut en extraire des données structurées. »

« Nous disposons du statut des documents validés et à chaque fois que l’on place des documents nouveaux dans le répertoire, le moteur va les traiter et générer des données. »
Arnaud MatonChief data & AI officer, groupe Kiloutou

L’équipe projet a travaillé avec le service Assurances du groupe pour extraire le contenu des procès-verbaux de stationnement. Ces données sont envoyées au format papier par l’ANTAI (Agence Nationale du Traitement Automatisé des Infractions). « Historiquement, les PV étaient soit traités manuellement par des équipiers Kiloutou, soit externalisés auprès d’un prestataire », informe Arnaud Maton. « Celui-ci “OCRisait” (sic) les documents et en extrayait les données pour nous fournir un fichier. Le niveau de fiabilité et d’exactitude n’étant pas toujours au rendez-vous, nous avons voulu tester Document AI sur ce cas d’usage. »

Pour apprendre au modèle à lire le PV, il suffit de définir les champs et les valeurs attendues, puis le module OCR de Snowflake extrait les informations dans le document, le lit et fait des propositions. Celles-ci sont validées par le data scientist ou le data analyst en phase d’apprentissage du modèle.

« Tous les avis de paiement du forfait post-stationnement (FPS) ont le même format, avec les mêmes informations aux mêmes endroits », précise Arnaud Maton. « Nous disposons du statut des documents validés et à chaque fois que l’on place des documents nouveaux dans le répertoire, le moteur va les traiter et générer des données ». Celle-ci sera confirmée ou infirmée si un écart est constaté.

« À partir du moment où nous avons suffisamment entraîné le modèle, l’automatisation peut se faire de bout en bout. »
Arnaud MatonChief data & AI officer, groupe Kiloutou

Le responsable souligne que Kiloutou reçoit suffisamment de PV tous les ans pour entraîner le modèle. « À partir du moment où nous avons suffisamment entraîné le modèle, l’automatisation peut se faire de bout en bout. Le flux est intégralement intégré dans Snowflake, depuis le dépôt de fichiers, la génération de données structurées et des métadonnées associées ».

Ces informations permettent au loueur de transmettre les demandes de paiement auprès du client de manière automatisée, sans intervention humaine et avec un niveau de fiabilité se rapprochant des 100 % sur ce type de document. Un taux de très loin supérieur au résultat obtenu par un prestataire externe, selon le responsable. Ce cas d’usage est en production depuis le mois d’octobre 2024.

Crédits photo : Kiloutou

Pour approfondir sur IA appliquée, GenAI, IA infusée