Programme IA2 : SystemX veut rapprocher IA et simulation numérique
D’un côté la simulation numérique, avec des modèles au plus proche des phénomènes physiques, les connaissances métiers, et de l’autre des modèles de Machine Learning dont l’apprentissage n’est réalisé que sur les données. L’IRT SystemX vient de lancer un vaste programme de recherche pour hybrider ces approches.
Le programme de recherche a été officiellement lancé le 5 février dernier. IA2, acronyme d’Intelligence Artificielle et Ingénierie Augmentée, va réunir académiques et industriels français afin de rapprocher les mondes de la simulation numérique et des modèles d’intelligence artificielle. Piloté par l’IRT SystemX, il comprendra 6 projets différents.
Avec ce programme de recherche, l’institut a fait travailler ses partenaires académiques, des industriels et ses équipes internes afin de produire une liste de verrous scientifiques et techniques à résoudre dans le cadre de projets collaboratifs. « Les sujets de recherche qui ont émergé de cette démarche collaborative ont été ensuite poussés auprès des industriels lors d’une série d’ateliers » explique Abdelkrim Doufene, Directeur Stratégie et Programmes de l’IRT SystemX.
Abdelkrim DoufeneIRT SystemX
« Nous nous sommes donné un semestre pour faire converger les besoins, ce qui a permis de définir le squelette d’un programme de recherche. Ce programme est estimé à 20 millions d’euros sur 5 ans, financé à 50/50 entre les secteurs public et privé ». Les 6 projets planifiés d’ici à 2025 regrouperont une quinzaine d’entreprises autour de chercheurs issus des principaux centres de recherche français.
HSA, premier des 6 projets du programme à démarrer
À l’issue de cette confrontation entre les chercheurs et des industriels déjà adeptes de la simulation numérique, 6 sujets de projets ont émergé dont le premier a été lancé en février dernier. Baptisé HSA pour Hybridation Simulation Apprentissage, ce premier projet vise directement à rapprocher les codes de calculs des industriels et les modèles d’IA issus de techniques d’apprentissage.
Mouadh Yagoubi, chef de projet HSA à l’IRT SystemX détaille le projet : « notre ambition est de concevoir de nouvelles approches d’intelligence artificielle afin de l’hybrider la simulation physique. Le challenge est que la modélisation physique est une filière aujourd’hui très ancrée dans le tissu industriel, une approche qui a plusieurs décennies d’expérience pour modéliser un phénomène physique au moyen de la simulation, et l’approche a démontré son efficacité ».
Le chercheur évoque la simulation des crash-tests qui a permis de notablement accroître la sécurité des voitures actuelles. Mais c’est aussi le cas de la simulation de la mécanique des fluides (CFD) sans laquelle plus aucun constructeur d’avions ne pourrait imaginer l’aérodynamique de ses appareils.
Néanmoins la simulation numérique nécessite une puissance de calcul colossale et demande un effort de recherche considérable, dès lors qu’il s’agit de simuler des phénomènes très complexes ou encore faire de la simulation multiphysique. C’est sur ce point que les modèles d’Intelligence Artificielle issus de l’apprentissage automatique (Machine Learning/Deep Learning) peuvent jouer un rôle : « avec l’avènement de l’IA, on veut améliorer le triptyque coût/qualité/délai de la simulation », ajoute Mouadh Yagoubi.
« La simulation délivre des résultats moyennant un certain coût, généralement directement lié au coût des infrastructures de calcul, c’est-à-dire le nombre de serveurs mobilisés et la durée du calcul. Le recours à l’IA permet d’espérer obtenir un résultat comparable en beaucoup moins de temps et donc accélérer les simulations. En exploitant des modèles entraînés sur des données existantes, cela doit permettre de prédire un comportement physique moyennant un coût de calcul très faible. C’est aussi potentiellement un moyen de résoudre des problèmes de simulation extrêmement difficiles à résoudre avec les méthodes classiques. En apprenant à partir de problèmes plus simples, on aurait la capacité de pouvoir prédire les résultats de problèmes plus difficiles ».
Le Machine Learning doit booster les chaînes de calcul traditionnelles
Un domaine où le Machine Learning bouscule le mode de la simulation numérique, c’est celui de la prédiction météo. Traditionnellement, les modèles de prévision sont très complexes et nécessitent d’énormes volumes de données afin de délivrer leurs résultats. Ceux-ci mobilisent des machines extrêmement puissantes et représentent une part non négligeable du marché des supercalculateurs. Une approche qui commence à être battue en brèche.
Ainsi, en janvier dernier, Google présentait Nowcast, un modèle de Machine Learning capable de délivrer une prévision de plus jusqu’à 6 heures à l’avance avec 5 à 10 minutes de calcul seulement pour une résolution au kilomètre près. Le modèle n’a aucune connaissance métier de la météorologie, mais analyse uniquement les images satellites pour délivrer sa prévision.
Si Météo France ne fait pas partie des partenaires impliqués dans le projet HSA, c’est le cas d’Airbus. L’avionneur européen qui a déjà mis en place une chaîne de calcul pour simuler l’empreinte acoustique de ses appareils en phase d’approche lorsque le train d’atterrissage et les volets sont descendus. « L’objectif est de disposer d’indicateurs qui permettront à l’avionneur de réaliser ses choix en termes de design afin de réduire le bruit généré par l’avion en phase d’approche », explique Mouadh Yagoubi.
Mouadh YagoubiIRT SystemX
« Toute une chaîne de calcul est mise en œuvre aujourd’hui pour produire ces données, mais certaines étapes du calcul sont extrêmement consommatrices en temps de calcul. Le Machine Learning va potentiellement remplacer certaines de ces briques et ainsi accélérer toute la chaîne de calcul. L’apprentissage des modèles d’IA sera réalisé à la fois à partir des données mesurées sur le terrain et des données des simulations précédentes. C’est que l’on appelle l’hybridation ou couplage ».
Le gain potentiel est énorme puisque le modèle de Machine Learning va délivrer l’information de manière quasi instantanée. Tout l’enjeu du projet, c’est de s’assurer que l’IA délivre des résultats de qualité équivalente.
Outre Airbus, Air Liquide et RTE se sont aussi associés au projet HSA, l’un pour la production d’hydrogène par reformage du méthane à vapeur, le second pour la modélisation énergétique des bâtiments et quartiers. Enfin, la SNCF souhaite coupler modèles mécaniques et données terrain pour calculer la fatigue des rails : « alors que les trois industriels exploitent des algorithmes de mécanique des fluides, la SNCF est un cas un peu à part », détaille le scientifique.
« En tant qu’exploitant d’un réseau de voies ferrées, la SNCF travaille sur la simulation de la fatigue des rails. Leur objectif n’est pas nécessairement de réduire le temps de calcul de la simulation, mais pour eux, la simulation n’apporte qu’une partie de la réponse, les données terrain en apportent l’autre partie. Pris séparément, les deux approches sont insuffisantes et ce n’est qu’en combinant les deux qu’ils parviendront à avoir une idée précise de l’état de fatigue d’une voie ».
L’IA ne se substituera pas à la simulation physique
À l’heure du Big Data et de la généralisation des usages de l’IA, il serait tentant de vouloir remplacer les très coûteux modèles de simulation par des inférences de Machine Learning, capables de délivrer un résultat en une fraction de seconde.
Pour Mouadh Yagoubi, le Machine Learning ne pourra jamais totalement remplacer l’approche classique : « le monde académique est convaincu que l’IA ne remplacera pas la filière simulation et il y a plusieurs raisons à cela. La modélisation physique embarque une finesse de compréhension du modèle qui va au-delà des seules données mesurées. En outre, le Machine Learning pose la question de la disponibilité des données. Pour la reconnaissance d’image, on dispose de données abondantes pour réaliser l’apprentissage des modèles, ce dont on ne dispose pas pour la modélisation physique. De même se pose le problème de l’exhaustivité des données disponibles pour réaliser l’apprentissage des modèles et l’impossibilité de les alimenter avec des données qui n’auront pas été expérimentées. La solution réside dans un couplage réussi entre simulation physique et modèles de Machine Learning ».
Avec ce projet de recherche résolument pragmatique et tourné vers la résolution de vraies problématiques des industriels, les chercheurs produiront des briques technologiques qui seront directement exploitables par les industriels. Seront-elles accessibles à tous et publiées sous licences Open Source ?
Abdelkrim DoufeneIRT SystemX
Ce point n’a pas encore été statué par les membres du projet, explique Abdelkrim Doufene : « nous aspirons à développer des briques technologiques qui seront exploités par nos partenaires. La façon dont seront diffusés ces logiciels n’a pas encore été définie. Open Source ou pas, cela dépendra de la volonté des industriels à partager les briques technologiques qui vont être développées lors du projet ».
Les cinq autres projets du programme IA2 vont être progressivement lancés au cours de l’année 2020. Le prochain à émerger devrait être le projet Smart Cockpit, en juin. Celui-ci porte sur l’étude d’assistants numériques autoapprenants devant assister le pilote. Ensuite devrait être lancé un projet dédié à une simulation multiagent, capable d’analyser des données terrain pour faire émerger des situations inhabituelles.
Viendront plus tard des programmes portant sur les outils d’aide à la décision dans la supervision d’installations industrielles, des logiciels pour valider les performances des simulateurs hybrides, ou encore un travail sur la sémantique métier pour faire le lien entre données hétérogènes et connaissances métier. Les partenaires industriels et académiques de ces projets seront peu à peu dévoilés dans le courant de cette année.