IRSN
L'IRSN indexe l'expertise nucléaire française avec Sinequa
Expert de la sécurité, l'IRSN compulse depuis le lancement du programme français une masse de données relatives au risque nucléaire. Des connaissances qu'il convient de mettre à disposition des jeunes ingénieurs qui n'ont pas connu la construction des centrales mais qui doivent aujourd'hui en assurer la sécurité.
Institut en charge de l'analyse et de la prévention des risques nucléaires et radiologiques, l'IRSN compte environ 1 800 personnes. Ses scientifiques réalisent des expertises pour les autorités et interviennent sur la sécurité des installations françaises. Son centre de crise peut être mobilisé en cas d'accident, comme ce fut le cas lors de la catastrophe de Fukushima.
Après avoir travaillé sur la construction du parc des centrales françaises, puis assuré le rôle de responsable de la sureté des réacteurs, Martial Jorel est aujourd'hui directeur du management des connaissances de l'IRSN, une direction créée en 2012. « Nous déployons un projet de gestion de la connaissance dans tout l'institut en nous basant sur une méthode éprouvée, la méthode MASK (Méthode d'Analyse et de Structuration des (K)Connaissances) ». Avec cette méthode, l'équipe de Martial Jorel réalise un inventaire des connaissances et anticipe les besoins dans les années à venir.
« Nous menons des analyses avec les opérationnels afin de connaitre leurs objectifs et de quelles connaissances ils auront besoin, ainsi que leur vision métier. En parallèle, nous menons des analyses plus transverses, ce que l'on appelle l'analyse du référentiel de connaissances, les questions posées étant : Où sont les connaissances ? Comment sont-elles utilisées ? Sont-elles facilement accessibles ? Sont-elles partagées ? »
L'une des premières analyses réalisées par l'IRSN a porté sur les documents relatifs aux réacteurs. Deux besoins sont alors apparus. L'institut devait se doter d'un outil de recherche performant pour indexer ses bases documentaires et il fallait mettre en place un portail des connaissances.
« Nous avons 40 ans d'expertises […]. Il s'agit de rapports d'analyse, d'avis émis auprès des autorités de sureté, ainsi que des rapports d'études et des rapports de recherche ». Ces documents sont essentiellement archivés au format papier et certains datent de l'époque de l'ISPN (l'Institut de protection et de sûreté nucléaire qui a précédé l'IRSN), créé en 1976. « La durée de vie d'une installation, c'est à dire entre le moment de la conception et de son démantèlement, est de l'ordre d'un siècle, soit deux générations et demi d'ingénieurs. Il s'agit donc d'un problème intergénérationnel que de retrouver des informations dans nos bases de données ».
Une donnée structurée et soigneusement référencée en base de données
Historiquement, l'IRSN stocke ses documents dans des bases. Ceux-ci sont classés par année, par service, avec des références documentaires très précises. Dans l'expertise de sureté nucléaire, il s'agit principalement de courriers, d'études qui peuvent compter jusqu'à 500 pages et, plus récemment, de présentations Powerpoint, soit environ 50 000 documents qui ont été produits par l'IRSN dans ce seul domaine de la sureté.
Plusieurs initiatives de mise en place d'un moteur de recherche se sont soldées par des échecs. « La tentation est grande de connecter toutes les bases disséminées à gauche à droite, mais je voulais que ce soit fait proprement », insiste Martial Jorel. « Les initiatives précédentes ont été des échecs avec des machines qui ont été abandonnées. J'ai préféré agir de manière pragmatique, en impliquant les opérationnels. Les gens ont été échaudés par des produits peu performants et cela à laissé des traces ils ne croyaient plus à ce type d'outils ».
Le responsable de gestion de la connaissance a donc privilégié une approche extrêmement structurée. Le moteur de recherche n'indexe que les bases dûment mises en place et contrôlées par les métiers. « Je tiens à ce que les gens fassent ces analyses de référentiels car cela suppose une vraie démarche ; il ne faut pas faire l'impasse là-dessus car c'est un travail exhaustif. Le diagnostic peut mener à dire qu'une partie des documents en archives doivent être numérisés et 'OCRisés', d'autres ne seront que numérisés. L'objectif est d'arriver à une base de données propre, validée par les opérationnels sur laquelle on connecte ensuite le moteur ».
Le processus de sélection donne le moteur Sinequa gagnant
Le responsable rédige alors un cahier des charges afin de disposer d'une outil capable de retrouver le raisonnement tenu dans un historique de 40 ans, à partir d'une phrase en texte libre.
Un membre de son équipe mène alors une étude d'opportunité avec un consultant afin de sélectionner les éditeurs les plus à même de répondre aux besoins de l'IRSN. En s'appuyant notamment sur le « Magic Quadrant » du cabinet Gartner pour effectuer une première sélection, l'équipe projet a ensuite fait passer des tests en grandeur nature aux moteurs sélectionnés.
« Nous avons retrouvé dans de vieux rapports des points précis, et nous voulions que les moteurs de recherche trouvent ces informations à partir d'une recherche en texte libre. Nous avons mis en place toute une série de cas et mis à disposition des éditeurs une base test. Chaque éditeur a pu connecter cette base à sa solution, l'indexer et les tests étaient menés dans l'après-midi ».
Plusieurs outils ne sont pas parvenus à passer cette phase de tests en conditions réelles et c'est finalement les futurs utilisateurs de l'outil qui ont été priés de tester les deux meilleurs.
« Sinequa est sorti largement en tête de leurs évaluations au niveau de la convivialité, de la rapidité, de l'efficacité, de ses performances. La capacité de réponse de l'éditeur a aussi joué en sa faveur » explique le responsable de l'IRSN.
Parmi les fonctions de la solution Cognitive Search de Sinequa - qui ont retenu l'attention du directeur du management des connaissances - le classement historique des réponses a été central.
« Pour prendre un exemple, nous devons être capables de retrouver pourquoi, lors de l'hiver 86, nous avions travaillé sur de nouvelles règles de conception pour faire face aux grands froids ». A l'époque, le froid avait paralysé plusieurs centrales nucléaires EDF. Le volet chronologie de Sinequa permet de faire apparaitre tout l'historique qui a mené à la mise en place de ces règles inspirées des leçons tirées de cet épisode climatique.
« En tapant "Grand froid" et en se plaçant sur 1986 dans le volet chronologique, on retrouve très vite les échanges de courriers réalisés avec EDF, leur demandant les raisons de l'arrêt des centrales, puis les demandes des autorités de sureté qui nous demandent de rédiger des règles pour faire face à ce type de situation. Puis on voit les règles publiées. Cela permet de recréer un historique. C’est un sujet très important dans le domaine de la gestion des connaissances, cela permet de transformer l'information en connaissance ».
Pour Martial Jorel, cette vision historique n'a rien d'anecdotique. « Il y a vingt ans nous recrutions encore des ingénieurs qui avaient construit ou mis en service les centrales nucléaires. Aujourd'hui, les jeunes qui sortent de des écoles n'ont pas été dans les installations. Ce type d'outil leur permettra de travailler efficacement sur des sujets de sureté qui s'étalent parfois sur une dizaine d'années entre la découverte, la caractérisation, l'identification des actions correctives ».
Vers un accroissement du nombre de bases de données indexées
L'équipe de Martial Jorel travaille désormais à l'indexation de la base de données des documents de recherche. Ainsi les experts pourront réaliser des recherches, à la fois sur les recherches menées sur un domaine précis et sur l'ensemble des faits et documents échangés. Un moyen de décloisonner l'information, même si, dans le nucléaire, les règles sont strictes et les marges de manœuvre très limitées.
L'outil de recherche a été ouvert à ses premiers utilisateurs en avril 2016, de même que le portail de gestion de la connaissance qui a été mis en ligne pour tout l'institut. Le moteur de recherche a été baptisé ASK avec le sigle « Always Seek Knowledge » pour inciter les jeunes collaborateurs à consulter ce qui a été publié avant d'écrire. Néanmoins « tout le monde n'y a pas accès, je voudrais faire évoluer cela mais cela pose des problèmes de sécurité, mais j'espère qu'à terme nous parviendrons à décloisonner les informations ».