Le Crédit Agricole cultive son IA Générative
Depuis février, le groupe Crédit Agricole élabore et déploie un plan consacré à l’IA générative. La direction a fixé une trajectoire de transformation. Le DataLab, avec les métiers, planche sur l’exécution et l’industrialisation, avec comme ambition de maintenir le cap sur l’IA responsable.
Les dirigeants des banques et assureurs français – BNP Paribas, SG, Axa, Macif, Arkéa, etc. – étaient réunis en septembre à Paris à l’occasion de la conférence « AI for Finance ». L’IA générative occupait une place majeure, sinon centrale, dans leurs discours. Jean-Paul Mazoyer, le responsable de la division Technologie et Numérique du groupe Crédit Agricole, était l’un d’eux.
Le dirigeant est peu entré dans les détails des initiatives en cours dans l’entreprise. Mais après la classique classification des emails entrants grâce au ML et au Deep Learning, Jean-Paul Mazoyer confie tout de même qu’il ambitionne d’aller un cran plus loin pour « augmenter » ses collaborateurs et doper la personnalisation.
Des conseillers aussi à l’aise avec l’IA que Word
Comment ? En permettant aux conseillers « d’apporter des réponses circonstanciées et beaucoup plus personnalisées qu’avant aux mails de nos clients, que ce soit dans l’utilisation des informations ou dans le ton utilisé. »
Mais pour déployer véritablement les usages de l’IA générative, des conditions sont nécessaires. Dont la formation, qui doit à terme rendre l’utilisation « aussi naturelle qu’avec n’importe quel outil, comme un mail ou un traitement de texte. »
Jean-Paul MazoyerResponsable division Technologie et Numérique, groupe Crédit Agricole
« Nous testons, mais nous sommes surtout en train d’apprendre », explique Jean-Paul Mazoyer. Pour ses développements en IA, le groupe Crédit Agricole peut compter sur des compétences expertes dans ses rangs. Ces ressources résident notamment au niveau du DataLab, fondé en 2016 et complété depuis d’une IA Factory.
Malgré son nom, ce Lab n’est pas (ou plus) un pur centre de R&D, et encore moins une usine à PoC. Depuis plusieurs années, la mission de cette entité est de concevoir des solutions d’IA industrielles pour les entités du Crédit Agricole. Dans ce cadre, le DataLab s’efforce de concilier performances et confiance. Cette politique s’est d’ailleurs traduite en 2023 par l’obtention d’une double certification LNE et LabelIA.
Une taskforce IA générative constituée en février
Sur l’IA générative, les équipes du DataLab entendent maintenir ce cap ; une nécessité pour anticiper l’entrée en application de l’AI Act européen, comme le confirme Aldrick Zappellini, directeur Data et Chief Data Officer groupe du Crédit Agricole.
Cette approche est diffusée au sein des filiales. Par le biais de différentes offres (dont du développement délégué et du co-développement), le DataLab accompagne les différentes sociétés du groupe. Un de ses enjeux est d’accélérer le mouvement d’industrialisation des IA dans leurs métiers. Cela vaut également pour l’IA générative.
Lab et Factory se veulent aux avant-postes sur les aspects techniques et métiers. Leur but est d’être en mesure d’anticiper les impacts de l’adoption de l’IA Gen en interne, explique Aymen Shabou, Chief Technical Officer du DataLab groupe.
L’expert a pris la parole à l’occasion de l’IMAgine Day IA Gen Corporate de l’IMA afin de présenter le plan de tout le Crédit Agricole dans ce domaine. Sur l’IA générative, la volonté est en effet d’avancer groupé et de mutualiser.
Le plan d’action se décompose en plusieurs étapes. La première a été lancée en février 2023. Le point de départ a été de constituer un « groupe de travail cross-entités ». À l’intérieur de celui-ci, des experts techniques et métiers, mais aussi une feuille de route pour le 1er semestre.
Un cadre d’expérimentation et un blocage antifuite
Dans un premier temps, la taskforce IA Gen a piloté l’acculturation et le brainstorming autour des cas d’usage de l’IA Gen et sur la base d’une consigne claire : déboucher rapidement sur des expérimentations et définir des orientations précises.
Cet objectif était atteint en avril avec un premier livrable qui édictait des recommandations (dont le blocage des API grand public d’OpenAI pour prévenir les fuites de données) et un cadrage des cas d’usage prioritaires, ainsi que des conditions d’expérimentation.
Parmi les préconisations, fournies au Comex du Crédit Agricole SA, puis diffusées auprès des entités du groupe, figurait par exemple l’intensification de la pédagogie auprès des métiers sur l’utilisation de ChatGPT en particulier, et plus largement sur l’IA générative.
L’amplification de l’acculturation s’est traduite par « la création de l’équivalent d’un Mooc en partenariat avec notre institut de formation interne pour permettre aux collaborateurs de l’entreprise de maîtriser les outils d’IA Gen et les technologies sous-jacentes », ajoutait Aymen Shabou.
Pour les expérimentations, des environnements maîtrisés ont également été livrés. Il s’agit de « sandbox R&D » et de « landing zones » dans le cloud Azure. Grâce à ces solutions de test, le Crédit Agricole souhaitait permettre des expérimentations avancées qui faisaient ainsi appel à des données de production.
Ces initiatives ont démarré au 2e trimestre 2023. Elles ont impliqué des métiers et des Data Scientists du groupe. La finalité était claire : faire émerger « des conclusions pertinentes qui nous permettent de nous projeter dans le futur sur les cas d’usage que nous souhaitons approfondir dans le groupe. »
En juillet, le Crédit Agricole a bouclé un second livrable. Il portait cette fois sur le bilan des expérimentations et la formalisation de la feuille de route pour le 2e semestre. Au cours de cette deuxième étape, la banque a mené deux démarches en parallèle.
La première était de tester ChatGPT sur les cas d’usage prioritaires identifiés précédemment.
Pour lever les barrières réglementaires, les tests exploitaient uniquement des données publiques, ce qui excluait de fait certaines applications de l’IA générative nécessitant d’ingérer des données plus sensibles (dixit les juristes et le régulateur).
Résultat, le Crédit Agricole a conduit des tests dans les domaines de la communication pour produire du contenu et de la veille économique et financière (un type de contenus pour lequel l’IA permet de résumer automatiquement des sources en ligne et d’accélérer différentes tâches).
De la R&D pour préparer la méthode et se former au LLMOps
En travaillant sur ces usages, peut-être moins stratégiques, le DataLab a toutefois pu établir une méthodologie adaptée aux IA génératives, explique son CTO, par exemple pour l’étape d’évaluation.
Sur la conception même, le DataLab a dû s’adapter, en privilégiant au départ des modèles préentraînés (alors que son habitude est, au contraire, de concevoir en interne sur la base de briques open source). Les équipes montent aujourd’hui en compétence au gré des initiatives, en particulier sur le prompt engineering, et le pré-prompts (comme le one shot ou le few shot learning).
L’ambition pour le DataLab était – et reste – de gagner en maîtrise sur les performances et le cycle de développement des IA. Ces travaux ont mis aussi en évidence l’importance d’impliquer très en amont les métiers. En effet, en matière de développement d’IA Gen, les feed-back tiennent une place importante.
Moins axée métier, le DataLab a conduit un deuxième « stream » orienté R&D. Celui-ci poursuit plusieurs finalités, en particulier de dresser un benchmark des IA du marché (et pas seulement génératives). Le deep learning « classique » peut en effet, pour certains scénarios, s’avérer aussi, voire plus, performant que les Transformers des modèles LLM.
Pour mener ses comparatifs, divers cas d’usage sont développés, parmi lesquels l’analyse de verbatim client, les comptes rendus d’entretien de conseiller, l’extraction d’information dans des documents et le traitement d’emails (classification, priorisation, etc.).
Les experts techniques du Crédit Agricole s’attellent également à définir la meilleure façon de concilier les impératifs, parfois contraires, de performance et de frugalité des technologies d’IA générative.
Enfin, la recherche porte sur des pratiques et des outils de type LLMOps (MLOps appliqué aux LLM) à des fins d’industrialisation.