rustamank - stock.adobe.com

Les espaces de données : la revanche européenne dans le cloud ?

L’Europe peine à revenir dans la bataille face aux États-Unis sur les infrastructures cloud. Elle pourrait en revanche regagner de la souveraineté numérique avec l’émergence d’espaces de données mutualisés dans les principaux secteurs économiques.

L’initiative Gaia-X, le SeLoger.com du cloud européen qui peine à s’imposer dans l’infrastructure, portait – et porte – aussi sur les données au travers de la création « d’espaces de données » mutualisés.

En France, ces chantiers en cours sont pilotés par le Hub France Gaia-X – qui associe le Cigref.

En septembre, ses membres se réunissaient pour faire un point d’avancement en présence de Jean-Noël Barrot, ministre délégué chargé de la transition numérique. Et pour ce dernier, pas de doute, « la révolution » de l’économie européenne de la donnée est déjà là.

Des espaces de données uniques bâtis sur la confiance

Pour contribuer à cette dynamique, le gouvernement revendique la reconduite et l’amélioration de l’appel à projets espaces de données mutualisés lancé en juillet. Les projets européens s’appuieront donc sur les spécifications de Gaia-X et ses grands principes, dont l’interopérabilité et la portabilité.

Mais que sont au juste ces espaces ? Le ministre les définit « comme une sorte de commun numérique propre à chaque filière » (l’énergie, l’automobile, l’agriculture, banque & assurance, etc.).

Francesco Bonfiglio, le PDG de GAIA-X AISBL, précise la définition. Il tient notamment à distinguer les espaces de données du Data sharing et des technologies de stockage comme le data warehouse ou le data lake. « L’espace de données est un écosystème logique ou physique appliqué à la donnée. La donnée constitue la représentation de cet écosystème. Vous n’échangez pas la donnée. Vous ne demandez pas la donnée. Vous y avez accès (…) Il s’agit d’un espace unique où les membres d’un écosystème se connectent pour disposer des données dont ils ont besoin », explique-t-il.

Mais pour exister, ces « data spaces » requièrent de la confiance entre partenaires. Cette confiance doit notamment être apportée par la plateforme et les technologies sous-jacentes, dont la blockchain et les composants de Gaia-X.

Fraude et blanchiment : des raisons de partager la Data dans la finance

Très actif, le secteur de la banque et de l’assurance mène une réflexion depuis 2020 au niveau européen pour constituer son propre espace de données. En France, le projet est copiloté par le DSI de la Caisse des Dépôts, Patrick Laurens-Frings.

Au départ du projet, les acteurs s’étaient accordés sur un périmètre large d’environ 20 cas d’usage. Il se ressert à présent autour de deux sujets majeurs : l’accélération du cloud dans la finance via la labellisation Gaia-X et le partage de données pour la lutte anti-fraude et anti-blanchiment, ainsi que pour les données ESG.

L’enjeu : « comment partager des données entre nous et éviter qu’à nouveau, ce soit des acteurs non européens qui les récupèrent gratuitement pour nous les revendre ensuite », souligne Patrick Laurens-Frings.

Dans l’énergie, ces mêmes questions se posent. EDF, en tant que membre fondateur de Gaia-X, promeut l’émergence d’un data space de filière. Sa motivation : partager les données dans « un socle de référence sécurisé et de confiance » afin de les protéger de l’intelligence économique et des lois extraterritoriales, explique Martine Gouriet, directrice des usages numériques d’EDF.

La filière embarque sur ces initiatives 70 entreprises de l’énergie, qui ont su s’entendre sur des cas d’usage « concrets et apportant de la valeur en s’appuyant sur les données de notre secteur. »

Vers une interconnexion entre espaces de données

« Le sujet à présent est celui du passage à l’échelle en passant de cas d’usage de recherche à des cas d’usage plus opérationnels », entrevoit la dirigeante de l’énergéticien français. Au niveau européen, des démarches sont plus matures, comme celles du Smart Connected Supplier Network (SCSN).

Né aux Pays-Bas il y a quelques années, le projet SCSN réunit des fournisseurs de composants électroniques, dont Thales et Philips, réunis pour optimiser la chaîne logistique. « Avoir une infrastructure Big Data unique comme un data lake n’aurait pas fonctionné. Nous avions besoin d’une solution plus fédérée », déclare Matthijs Punter, membre du SCSN.

Ces acteurs, plusieurs centaines, partagent ainsi des données entre eux de manière sécurisée et souveraine en recourant aux services de fournisseurs IT agréés.

SCSN mène des discussions avec des entreprises d’autres filières (NTT au Japon) et avec d’autres espaces de données, dont Catena-X dans l’automobile, pour créer des interopérabilités entre espaces.

Le plus important : identifier des cas d’usages sectoriels

Dans l’agriculture, une plateforme de données a aussi été constituée au travers de Agdatahub. La Data représente un enjeu majeur dans le monde agricole, « surtout sous l’angle de la répartition de la valeur et comme moyen pour les agriculteurs de récupérer des compléments de revenus », témoigne Sébastien Picardat, le directeur général du Agdatahub.

Lancé en 2017, le projet ne disposait pas encore de tous les composants technologiques nécessaires. Mais le point de départ n’était pas technique. « Pour réussir un data space, le principal au début, c’est un sponsor et un porteur de projet sectoriel et professionnel ». Pour l’agriculture, il s’agit de Sébastien Windsor, l’actuel président des Chambres d’agriculture.

Deuxième exigence : des compétences, c’est-à-dire des collaborateurs capables d’identifier des cas d’usage pour les données au niveau de l’entreprise, et aussi plus largement du secteur.

Mutualiser les investissements

Pour Antoine Couret, le président du Hub France IA, il est aussi stratégique pour l’émergence des espaces de données de favoriser la mutualisation des investissements.

C’est également, poursuit-il, une architecture en trois couches : cloud, data et IA de confiance.

« Une autre clé, c’est la collaboration entre les partenaires. [....] Google, Facebook, Amazon sont relativement autonomes sur tout le cycle de traitement des données. […] Dans les secteurs industriels, le niveau de complexité a beaucoup augmenté. Il faut donc collaborer. Pour cela, il faut de l’envie et de la confiance », note Antoine Couret. 

La standardisation des couches techniques, notamment au travers de Gaia-X, n’est cependant qu’une étape. Il convient d’aller au-delà du seul volet d’ingénierie pour aborder la dimension économique, signale le dirigeant du Hub France IA. Et cela passe en particulier par des échanges entre espaces de données, par exemple pour mutualiser les données liées à la logistique, communes à l’automobile, l’industrie et l’agriculture.

Accélérer malgré le poids de l’administration

Autre problématique de taille : faire aboutir ces discussions techniques et économiques dans un temps suffisamment court pour éviter aux acteurs européens d’être une fois encore pris de vitesse par les Big Tech.

La réussite sur ce point n’est pas garantie. Les industriels, dont EDF, regrettent ainsi des « blocages administratifs » qui viennent ralentir les réalisations. Le temps administratif n’est certes pas celui de la concurrence mondiale.

Pour approfondir sur Big Data et Data lake