Good Studio - stock.adobe.com

L’essentiel sur Cleyrop, la plateforme souveraine de données tout-en-un

Pour répondre aux besoins en matière d’indépendance technologique pour les données sensibles, le Français Cleyrop propose un « DataHub », une plateforme de bout en bout de gestion des données. L’éditeur mise aussi sur la « simplification » pour s’imposer face aux géants mondiaux.

« Premier DataHub européen ». C’est ainsi que se présente l’éditeur 100 % hexagonal Cleyrop. Afin d’offrir une plateforme de traitement des données bout en bout, la jeune entreprise a toutefois profondément remanié son projet d’origine. Initialement, le DataHub devait unifier les solutions de différents acteurs spécialisés du marché.

De ces alliances, n’en reste qu’une avec Toucan Toco, fournisseur sur la data visualisation. Cependant, l’ambition, elle, demeure : « proposer une solution clé en main permettant, avec simplicité, de couvrir toute la chaîne de traitement de la donnée », explique Lauren Sayag, la cofondatrice de Cleyrop (et auparavant de Kynapse avec Stéphane Messika, également de l’aventure Cleyrop).

Expérience utilisateur, indépendance et cloud de confiance

« Nous prenons en charge toute la partie évolution technologique, le choix de l’ensemble des briques, évitant ainsi de devoir contractualiser avec de multiples partenaires pour construire un parcours cohérent. Nous apportons aussi une UX agréable pour toutes les typologies d’utilisateurs dans l’entreprise », poursuit la dirigeante.

Photo de Lauren Sayag
Lauren Sayag, co-fondatrice de Cleyrop

Cleyrop fait surtout « le choix de se déployer uniquement sur des infrastructures françaises et européennes. » Outre un fonctionnement on-premise, Cleyrop est en effet compatible avec les environnements cloud d’Outscale (Dassault Systèmes) et OVHcloud.

La startup (une cinquantaine de collaborateurs) justifie cette stratégie de prise en charge des briques technologies par les difficultés que rencontreraient encore et toujours les entreprises dans la valorisation de leurs données et le passage à l’échelle de leurs projets, et ce malgré « la richesse technologique des offres actuelles ».

« L’objectif d’ici deux ans est d’être un des champions du numérique qui font l’indépendance technologique de l’Europe. »
Lauren SayagCleyrop

Par ailleurs, les organisations publiques et privées – manipulant des données sensibles – peineraient à trouver des partenaires européens avec qui travailler, et qui « présentent les mêmes niveaux de sécurité et de fonctionnalités que l’offre américaine ». L’ambition de Cleyrop est donc de répondre à cette lacune.

L’éditeur débute en se concentrant avant tout sur le secteur public (60 %) et la clientèle française (100 %). Mais ce n’est qu’une première étape. Grâce à sa levée de fonds (10 millions €), Cleyrop prévoit de se développer en Europe dès 2024 et vise 50 % de ses clients hors de France d’ici 2025.

« La stratégie de 2023, c’est la croissance en France et la prédominance du secteur public. L’objectif d’ici deux ans, c’est de devenir un acteur européen et d’être un de ces champions du numérique qui font l’indépendance technologique de l’Europe », résume Lauren Sayag.

D’ici un an, elle prévoit par ailleurs de doubler ses effectifs, et aussi de poursuivre la construction de la plateforme logicielle afin de basculer ses clients de la phase d’expérimentation à la mise en production.

L’ACPR, les Armées et la Caisse des Dépôts partenaires de R&D

Cleyrop collabore par exemple aujourd’hui avec l’Autorité de contrôle prudentiel et de résolution (Banque de France) autour d’un DataHub interbancaire destiné à la lutte contre le blanchiment. Avec le ministère des Armées, le projet concerne la traçabilité des données. La Caisse des Dépôts planche sur les données ESG et les cas d’usage écologiques.

Ces trois utilisateurs constituent « des partenaires de R&D ». Mais l’éditeur compte aussi des clients en production comme Atouts France (l’agence chargée du développement du tourisme en France). Le GIP est désormais équipé d’un « gros DataHub qui permet à tous les acteurs privés et publics de partager les données [en rapport avec le tourisme] et de les faire parler ».

L’éditeur a signé un autre GIP : le MiPih, un hébergeur HDS auquel Cleyrop fournit une solution d’analytics à destination des établissements hospitaliers. « Notre plateforme leur permet de piloter l’absentéisme, les stocks, d’améliorer le parcours patient », illustre Lauren Sayag. « Ces établissements ont en commun un fort enjeu de valorisation de données qui sont sensibles ».

Illustration de l'utilisation de Cleyrop pour prédire l'absentéisme
Cleyrop en action pour prédire l'absentéisme

Côté secteur privé, Cleyrop fournit sa technologie à l’industriel Poclain Hydraulics dans le cadre d’un PoC de plateforme Data.

Cette prééminence du public s’explique, dixit Cleyrop, par une plus forte sensibilité aux enjeux de souveraineté des données et de conformité aux réglementations, actuelles et à venir (IA Act, Data Act, etc.). La pression en faveur d’un cloud souverain y serait plus prononcée.

Mais la « souveraineté » n’est pas tout. « Le secteur a aussi de forts besoins d’industrialisation et des problématiques de valorisation des données », insiste la dirigeante. Les progrès dans ces domaines sont un préalable incontournable au développement de cas d’usage de l’IA, très largement sous-exploitée dans le secteur public, notait le Conseil d’État en 2022.

Pour Cleyrop, la prise de conscience d’un besoin accru de recourir à des acteurs européens ne serait cependant pas le monopole du public. Elle existerait désormais dans tous les domaines « où la donnée est sensible, comme la finance ou la santé, ou pour les données importantes en termes de propriété intellectuelle. »

La porte d’entrée : des données sensibles

L’éditeur cible donc des organisations qui ont « des sujets forts sur les données, sur leur industrialisation, avec des besoins avancés en matière de fonctionnalités, et qui ont des enjeux autour de la protection de ces données, vis-à-vis des lois extraterritoriales, et de l’indépendance technologique. »

Sur le cloud, la relation entre fournisseurs et clients est en effet souvent à l’avantage des offreurs, comme s’en émouvait récemment le président du Cigref. Cleyrop espère constituer une alternative pour ces utilisateurs dans la banque, l’assurance, la santé, l’énergie et les industries.

Côté taille, l’éditeur cible les grandes organisations (ETI et grands comptes), en tout cas aujourd’hui. Ce sont en effet elles qui ont un niveau de maturité suffisant. « L’offre, c’est un DataHub, donc une architecture assez sophistiquée (…) Nous ne nous interdisons pas d’exécuter une vague deux en proposant une data plateform à des entreprises un peu moins matures. »

Cleyrop : objectif simplicité

Cleyrop se positionne donc comme un spécialiste du tout-en-un, face à des spécialistes ou des géants des données qui affichent eux aussi la volonté de couvrir tous les besoins (comme un Databricks ou un Snowflake).

« Un de nos piliers, c’est de mettre les données à la main de chaque population d’utilisateurs, et de les rendre facilement accessibles et utilisables. »
Cleyrop

« Nous avons deux ans et demi. Notre roadmap de développement n’est pas achevée », concède l’éditeur. « Mais un de nos piliers, c’est de mettre les données à la main de chaque population d’utilisateurs, et de les rendre facilement accessibles et utilisables ».

« Nos équipes de développement construisent un parcours que nous voulons le plus intuitif possible pour toutes les personas que nous allons adresser », indique encore l’éditeur. Ces développements prennent la forme d’une plateforme, mais dont la consommation ne se fait pas service par service comme chez un fournisseur cloud.

Une même plateforme pour les techs et les métiers via du low code

« L’idée, c’est un parcours unifié qui simplifie les usages sans qu’il soit nécessaire au client de faire la glue entre toutes les briques pour s’assurer qu’elles fonctionnent entre elles. »

Ce parcours « reste à enrichir » et n’a pas nécessairement pour objet de remplacer tout un existant en mode big bang. Des connecteurs permettent ainsi de se connecter aux sources de données. Et la roadmap prévoit l’arrivée de nombreux autres connecteurs.

Ajouts de données dans Cleyrop
Exemple d'ajouts de données dans Cleyrop

Outre la collecte depuis les sources, la plateforme Cleyrop permet le stockage des données (uniquement structurées, à ce jour), leur exposition et leur traitement uniforme, quel que soit leur format.

« Nous ne serons peut-être pas à la pointe sur chaque sujet. Mais sur les plus importants, nous nous efforcerons de l’être. »
Lauren SayagCleyrop

La solution embarque aussi des outils d’orchestration des traitements de grosses volumétries de données. Les fonctionnalités de restitution, sous forme de datavisualisation, sont permises par l’intégration avec Toucan Toco. Elle comprend aussi la gestion des droits et un catalogue de données.

Dans sa mouture actuelle, Cleyrop vise les populations (personas) techniques, comme les data engineers et data scientists. La feuille de route prévoit aussi d’étendre cette cible pour accueillir des utilisateurs « plus métiers » grâce au low code. Cleyrop regarde aussi du côté des modèles LLM et de l’IA générative pour faciliter les interactions avec les données.

Sur la gouvernance et les règles d’accès aux données, Cleyrop prévoit en 2023 une plus grande finesse de paramétrage. En 2024 et 2025, il prévoit de travailler sur des « sectorisations » au travers de modules. Dans l’énergie, il pourra s’agir par exemple de traiter des données temps réel ou issues de l’IoT. Ces usages « nécessitent des capacités, notamment de stockage, de traitement ou de visualisation, qui ne sont pas forcément communes à tous les acteurs. »

Un pipeline de données dans Cleyrop
Un pipeline de données dans Cleyrop

Un généraliste souverain peut-il néanmoins trouver sa place face aux acteurs établis ?

Les quatre fondateurs de Cleyrop (Lauren Sayag, Stéphane Messika, Arnaud Mueller, auparavant créateur de Saagie et membre du Comité Stratégique de filière Numérique de confiance, et Jérôme Valat fondateur de Oxya) répondent « oui ». Ils parient sur une volonté de consolidation des outils de la part des organisations.

« Nous ne serons peut-être pas à la pointe sur chaque sujet. Mais sur les plus importants, nous nous efforcerons de l’être », promet Lauren Sayag. « Un parcours intégré présente par ailleurs des atouts, dont la facilité de gestion, la simplicité de contractualisation et de maintenance. Pour les utilisateurs, c’est un point d’entrée unique sur les données, à laquelle la plateforme unifiée garantit une cohérence ».

Pour approfondir sur Big Data et Data lake