Cosmian, la pépite française qui sécurise l’analytique grâce à Intel
La startup, spécialiste du chiffrement, a mis au point un système qui permet de faire analyser les données par un tiers sans les partager. Son produit, qui intéresse jusqu’en Australie, repose sur une particularité des processeurs Xeon.
Cosmian est une future pépite française. Cet éditeur de logiciel a mis au point des solutions qui permettent d’effectuer des calculs sur des données sans pour autant les dévoiler. L’intérêt ? Tout simplement permettre à des banques, des groupes pharmaceutiques ou industriels, des institutions gouvernementales, de confier leurs données les plus secrètes à des tiers qui ont la puissance de calcul pour les filtrer, les transformer, en tirer des analyses, sans qu’à aucun moment aucune des parties ne puisse récupérer le patrimoine de l’autre.
Bruno GriederDirecteur technique et co-fondateur de Cosmian
« Les solutions que nous développons servent à exploiter des données sensibles sans avoir à les partager en clair. Pour ce faire, nous mettons en œuvre des techniques de pointe en chiffrement. De nombreuses entreprises sont très intéressées par nos travaux, que ce soit parce qu’elles sont dans un secteur très réglementé, comme celui des banques, ou parce qu’elles ont besoin de ressources chez des prestataires qui travaillent aussi pour leurs concurrents », explique Bruno Grieder, le directeur technique et co-fondateur de Cosmian.
Les solutions de Cosmian reposent sur deux techniques. La première consiste à utiliser les algorithmes de chiffrements mis au point au laboratoire de cryptographie de l’École Normale Supérieure, un partenaire de longue date de l’éditeur. Ces algorithmes permettent d’effectuer des calculs en clair sur des données chiffrées, moyennant un temps d’exécution plus long que d’ordinaire.
« Nous avons beaucoup travaillé sur les questions de performances, notamment en réécrivant nous-mêmes un compilateur. En effet, les entreprises veulent préserver le secret de leurs données, mais n’ont pas non plus systématiquement besoin de les analyser avec des calculs très compliqués. Il est donc contre-productif d’imposer des traitements longs pour venir à bout de travaux simples », indique Sandrine Murcia, la directrice générale et co-fondatrice de Cosmian.
La seconde technique consiste à importer la solution de calcul sur les ordinateurs de l’entreprise cliente afin que ses données ne sortent pas de ses locaux. « Le problème est que les fintechs qui développent ces solutions de calcul ne souhaitent pas que leurs codes puissent être récupérés par leurs clients. Nous avons donc mis au point une enclave : un serveur de calcul au sein duquel tout ce qui se passe est chiffré, algorithmes comme données. Mais encore fallait-il trouver comment nous pouvions matériellement réaliser ce serveur sans souffrir d’une chute des performances », ajoute-t-elle.
SGX, le jeu d’instruction d’Intel qui crée des enclaves
La solution a été trouvée il y a deux ans : le jeu d’instruction Software Guard Extensions (SGX) des processeurs Intel Core Skylake (lancés en 2015), qui ne fut pendant longtemps disponible que sur les Xeon E, et qui est désormais présent sur tous les derniers modèles de Xeon Ice Lake. SGX est un dispositif qui permet au processeur de réserver une partie de la mémoire d’un PC ou d’un serveur à l’application qui en fait la demande. Cette zone s’appelle elle-même une enclave.
Dès lors qu’une application réserve une enclave, toutes ses commandes suivantes s’y exécutent sans qu’aucun autre processus ne puisse y avoir accès. Seules des commandes lancées depuis l’intérieur de cette zone ont la faculté de publier les résultats de leurs analyses à l’extérieur, dans une zone du serveur accessible aux utilisateurs.
Outre le verrou qu’il pose sur ce segment de mémoire, le processeur chiffre par ailleurs tous les accès à cette enclave. Ainsi, même si un malware pouvait infecter les plus hauts niveaux d’exécution – l’hyperviseur, voire le BIOS du serveur – il ne serait pas en mesure de comprendre ce qui circule entre le processeur et sa mémoire.
Sandrine MurciaDirectrice générale et co-fondatrice de Cosmian
L’utilisation de SGX reste assez peu connue. Ce jeu d’instructions n’a existé pendant ses premières années que sur des processeurs pour PC où son usage n’avait pas grand intérêt et où les BIOS des machines n’étaient même pas capables d’en tenir compte. Manifestement, ces déploiements auront surtout servi à Intel à mettre son dispositif à l’épreuve des hackers qui se sont empressés de lui trouver des failles. Failles amplement documentées et, depuis lors, corrigées.
« Quand nous avons découvert SGX en 2019 sur certains PC portables, nous avons tout de suite compris comment en tirer parti. Nous avons mis au point un dispositif breveté qui se sert de ce jeu d’instructions pour générer des clés de chiffrement/déchiffrement qui ne fonctionnent qu’au sein de l’enclave, ce que nous appelons la cérémonie des clés », dit Sandrine Murcia.
Deux ans de mise au point pour le premier produit sur étagère de ce type
« Cette solution a beaucoup plu à nos interlocuteurs dans les grands groupes, qui sont en l’occurrence les équipes en charge des données. Ils pouvaient dès lors se passer les données de départements en départements, pour les analyser avec leurs propres algorithmes, sans remettre en cause la réglementation qui n’accordait l’accès à ces données qu’à un seul département. »
Le produit commercialisé depuis quelques jours à peine par Cosmian porte le nom de Cypher Compute. Il s’agit d’une machine virtuelle installable sur un serveur ou un PC portable qui génère des clés, récupère les applications et les données chiffrées avec ces clés, les déchiffre dans une enclave et les laisse interagir.
« Depuis deux ans, nous proposons des modules aux data scientists qui ont pu les mettre à l’épreuve. Nous avons également publié des articles dans les revues scientifiques pour valider notre concept sur le marché. »
« Notre volonté est véritablement de proposer un produit sur étagère, utilisable tel quel par tous nos clients. Nous sommes les seuls à avoir une telle offre dans ce domaine ; vous trouverez des prestataires israéliens ou américains qui vous proposeront de développer des solutions équivalentes, mais à façon, c’est-à-dire en réinventant la roue sur chaque projet. La clé de notre réussite est que les entreprises achètent la solution qui a déjà fait ses preuves ailleurs », assure-t-elle.
Avec l’appui d’Intel, une carrière internationale se dessine
Dans cette aventure, Sandrine Murcia se félicite d’avoir reçu le soutien d’Intel. « Nous les avons rencontrés en 2020 lors du FIC à Lille. Ils nous ont apporté leur aide pour prospecter les entreprises, notamment en nous prêtant des machines qui nous ont permis de réaliser des maquettes correspondant aux différents projets que l’on nous soumettait. Ces maquettes étaient importantes, car, au-delà des équipes en charge des données, nous devions surtout prouver aux équipes IT que la sécurité apportée par notre solution est bien réelle. »
Avec l’appui d’Intel, le bouche-à-oreille a fonctionné au-delà des attentes de l’éditeur. Ses contacts se sont rapidement élargis aux secteurs de la recherche, en particulier parmi les laboratoires pharmaceutiques, mais aussi au monde des objets connectés. Lorsque LeMagIT l’a interviewée, Sandrine Murcia venait d’être contactée par des banques allemandes et australiennes.
« En fait, notre solution résout un problème largement partagé par les entreprises : pour analyser certaines données, il faut les sortir des systèmes où elles sont stockées et les regrouper avec d’autres du même type dans un nouveau silo. Mais toutes les entreprises redoutent cette manipulation, car elle est dangereuse. Avec notre solution, ils déplacent et regroupent les données de manière virtuelle, ponctuelle », argumente Sandrine Murcia.
Dès à présent, le Cyper Server de Cosmian est utilisable en cloud, pour peu qu’il soit exécuté sur des machines chez AWS, Azure, GCP et consorts, qui disposent de processeurs Intel Xeon compatibles SGX. À terme, l’éditeur entend rendre sa solution encore plus simple à utiliser, en s’affranchissant des systèmes de gestion des identités qui alourdissent la mise en place d’un calcul. Il compte y parvenir en les remplaçant, une fois encore, par des algorithmes de chiffrement qui reposeront sur les enclaves de SGX.