Sergey Nivens - Fotolia
Big Data : comment Tracfin remonte les filières de blanchiment d’argent sale
Une fois n’est pas coutume, le directeur de la cellule anti-blanchiment de Bercy a livré quelques détails sur l’activité de son service qui vont bien au-delà des chiffres officiels. Ce sont plusieurs millions de documents financiers qui sont analysés chaque année par ses algorithmes pour remonter les filières mafieuses et terroristes, dont celles de Daech.
Les derniers chiffres officiels publiés par Tracfin, la cellule anti-blanchiment d’argent du ministère des Finances, semblent assez modestes. Ce sont 71 070 informations qui ont été adressées à Tracfin en 2017, en croissance de 10 % pour 12 518 enquêtes réalisées la même année et 2 616 notes de transmission adressées aux autorités judiciaires et administratives.
Pourtant, les chiffres communiqués par Bruno Dalles, directeur de Tracfin lors de la conférence Big Data Paris 2019 font état d’une activité bien plus importante. Outre ces déclarations de soupçon adressées par les notaires, comptables et institutions financières, ce sont des dizaines de millions de transferts financiers qui sont aujourd’hui analysés par les algorithmes de la cellule de renseignements.
La part des Data Sciences dans le travail des agents de renseignement financier s’accroît
Plus petit service du premier cercle du renseignement français aux côtés notamment de la DGSE, de la DGSI, Tracfin voit son activité croître à toute vitesse et les Data Sciences occupent une place de plus en plus importante dans le travail de ses agents.
Bruno DallesDirecteur de Tracfin
Comme l’a souligné Bruno Dalles avec un certain humour, « Tracfin, c’est une startup administrative, une petite structure qui connaît une très forte croissance et qui gère une masse de données exponentielle. » Cet ancien magistrat fut notamment chef du bureau de la lutte contre la criminalité organisée, le terrorisme et le blanchiment au ministère de la Justice jusqu’en 2003 avant de prendre la direction de Tracfin en 2015.
La cellule est un service à compétence nationale qui dépend du ministère des Finances et qui présente cette particularité d’être aussi un service de renseignement. Il y a 3 ans, celle-ci comptait 110 personnes, des effectifs atteignent désormais 160 personnes et 10 nouvelles personnes sont en cours de recrutement. « Le petit service informatique d’il y a 15 ans est devenu un département informatique avec un pôle Data Sciences. Il y a 10 ans, nous traitions 10 000 déclarations de soupçon, l’an dernier nous en avons traité 80 000. »
Il y a 7 ans, a été instaurée la communication systématique d’information (COSI) qui contraint les banques et institutions financières à transmettre les informations relatives à toutes les opérations financières menées en argent liquide.
« COSI représente 2,5 millions d’informations par an, ce qui constitue aujourd’hui pour nous un stock de 16 millions d’informations, ce à quoi est venu s’ajouter COSI 2 il y a 2 ans. Désormais, toute opération financière de dépôt ou de retrait d’espèces supérieure à 10 000 euros sur un compte génère un signalement automatique auprès de Tracfin. Cela représente 60 millions d’informations de plus à traiter chaque année pour les analystes de Tracfin. » Mise en place voici 2 ans, cette mesure a permis à Tracfin d’engranger environ 120 millions d’informations sur ses serveurs.
Du Big Data depuis… 10 ans
Afin de dématérialiser ses échanges de données avec les institutions financières, Bercy a mis en ligne le portail Ermes voici une dizaine d’années maintenant. « Lorsque la loi a imposé la transmission dématérialisée, nous avons créé un outil de stockage et de traitement pour ces données. S’il était encore très partiel, celui-ci a constitué un premier système d’information qui nous a permis de mettre en place des premières solutions de rapprochement et d’aide à la décision avant même que ces solutions apparaissent sur le marché. Nous avons démarré par ce que j’appellerais du Small Data qui s’est peu à peu développé. »
Bruno DallesDirecteur de Tracfin
Le directeur de Tracfin souligne que les besoins d’outils d’analyse de la cellule vont bien au-delà du seul traitement de données financières car les déclarations de soupçon sont accompagnées de multiples pièces attachées dont la nature est très diverse.
Un notaire va joindre à la déclaration un acte notarié, un comptable va fournir l’extrait de son livre caisse ou de la documentation comptable, une banque va joindre le relevé de compte correspondant à la transaction suspecte.
« Nous faisons face à une hétérogénéité forte de la donnée et comme nous travaillons aussi à l’international, nous devons aussi intégrer des données en diverses langues, des données qui ne sont pas normées. Nous avons eu à créer nos propres solutions il y a 10 ans et nous sommes toujours restés en veille pour détecter ce qui peut apparaître sur le marché afin de répondre au mieux à nos besoins. »
Tracfin a sélectionné la plateforme Dataiku
Pour mieux structurer l’activité de ses Data Scientists, Tracfin a fait le choix de se doter de la plateforme Dataiku. La solution du Français a été préférée à ses concurrentes car elle couvre la chaine complète du traitement de la donnée d’une plateforme Big Data.
Les critères de sélection de cet outil ont été fortement teintés par la nature même de l’activité de la cellule anti-blanchiment : « Compte tenu de la sensibilité du travail que nous menons, notre critère premier dans le choix d’une solution est la sécurité. Il nous faut des outils et des partenaires diversifiés : aucun ne doit avoir une vision complète de ce que nous faisons afin de protéger la souveraineté de notre activité. »
En outre, Tracfin se méfie de certains géants américains du Big Data très présents dans le milieu du renseignement. Sans jamais mentionner Palantir, Bruno Dalles a ainsi expliqué : « Nous nous sommes interrogés vis-à-vis de gros partenaires qui ont de fortes capacités aux Etats-Unis et que d’autres services de renseignement ont pu utiliser, mais comme nous traitons des données économiques et financières qui sont très sensibles, nous devons prendre des précautions vis-à-vis de partenaires “amis” américains notamment et de partenaires “moins amis”. Dans nos choix stratégiques et nos choix de partenaires, cette dimension souveraineté est importante. La dimension sécurité de l’outil est importante et nous testons les produits. C’est ce qui nous a conduits à opter pour Dataiku. »
La sécurité des données stockées sur les serveurs de Tracfin est une priorité et la cellule a appliqué les mêmes recettes que les autres membres du premier cercle du renseignement français. Une étanchéité complète a été mise en place entre son Data Lake et les systèmes d’alimentation des données externes, une architecture qui a été validée par l’ANSSI.
Tracfin met en œuvre les mêmes niveaux de chiffrement que ceux utilisés par la DGSE ou la DGSI et aucun prestataire français ou autre ne dispose d’un quelconque accès à distance à cette infrastructure. En outre, inutile de transmettre à Trafic une demande d’accès à vos données au titre du RGPD, la cellule est un service de renseignement et la loi de 1978 et même l’Union Européenne n’ont pas véritablement statué sur l’application du RGPD sur les services de renseignement ou de Police.
Le directeur de Tracfin plaide pour un rapprochement des Data Scientists et des métiers
Tracfin compte actuellement 4 Data Scientists sur un département informatique qui compte 20 personnes et un effectif total de 160 personnes. Le recrutement d’un cinquième Data Scientist est en cours. Selon son directeur, ce ratio démontre la priorité donnée aux Data Sciences par sa cellule.
Si le directeur de Tracfin s’amuse des jeans portés par les Data Scientists de Bercy, il insiste pour que ces derniers soient au plus proche des métiers. « Les Data Scientists ne doivent pas être isolés dans des locaux dédiés, dans un Lab, comme des rats de laboratoire. Ils doivent être en vraie connexion avec les opérationnels. Notre projet de création d’un nouveau système d’information est mené avec des référents métiers, et ces derniers travaillent avec les équipes d’évolution tout comme notre pôle Data Science. Ce pôle est à la disposition des métiers qui peuvent passer des commandes validées par la direction. C’est de cette manière que nous avons pu utiliser les technologies à notre disposition pour traiter des cas très concrets. »
De par la confidentialité intrinsèque des activités de la cellule anti-blanchiment, Bruno Dalles n’a pas livré beaucoup de détails quant à ces cas “très concrets”. Il a évoqué le tagging des données reçues afin d’aider les analystes à trier les très nombreuses informations reçues en entrée.
Il a aussi évoqué le rôle joué par la plateforme Big Data de Tracfin pour reconstituer les sources de financement du mouvement Daech.
« Grâce aux Data Sciences, Tracfin a été l’un des premiers services de renseignement financier à identifier les collecteurs de Daech, ces personnes qui, localisées au Liban ou en Turquie, recevaient des fonds du monde entier, notamment de France afin de financer le mouvement. Ces personnes et lieux étaient bien identifiés et c’est grâce aux outils de visualisation, de traitement de données relatives aux transferts de fonds, de liens avec des numéros de téléphone que nous avons pu identifier ces personnes. Sans ces outils de rapprochement, ces outils de remise en état de la donnée et ces outils de traitement qui ont pu éviter les faux positifs, nous n’aurions pas pu faire un travail aussi sérieux. »
Le directeur de Tracfin souligne que les résultats obtenus par les analystes français aidés de leurs algorithmes ont été confrontés avec succès à ceux des services américains : « Nous avions identifié les mêmes collecteurs qu’eux, ce qui signifie que même si nous n’avons pas travaillé sur les mêmes données, pas utilisé les mêmes outils qu’eux, nous sommes arrivés aux mêmes conclusions. » Si vous êtes Data Scientist, amateur de Tom Clancy et de son héros Jack Ryan, il pourrait bien y avoir un poste pour vous au Tracfin !