Data Publica : ouverture de la première place de marché de la donnée en France

François Bancilhon, l’Ex Pdg de Mandriva, a officiellement inauguré sa nouvelle société Data Publica, la première place de marché des données publiques et privées en France. Surfant sur la vague Big Data et sur les modèles américains et britannique, Data Publica espère se faire une place sur un marché évalué à 1,6 milliard d’euros.

La société Data Publica s’est officiellement lancée hier soir sur le terrain, de plus en plus tendance et en profonde mutation, de l’ouverture des données publiques et privées. Une première en France qui s’inscrit en ligne droite des très vastes et très médiatisés projets de libéralisation des données inaugurés aux Etats-Unis par Barack Obama, data.gov, et son pendant britannique data.gov.uk, créé à l’initiative de Tim Berners-Lee (lire notre entretien à ce sujet), à la demande de Gordon Brown.  Et qui doit s’inscrire également dans un contexte de “Big Data”, où les entreprises bataillent avec l’arrivée massive de données, de sources hétérogènes.

Centraliser des données publiques et privées

Data Publica, c’est avant tout une place de marché de la donnée publique, qui vient centraliser au sein d’un portail datapublica.com, les données récupérées sur le Web par les équipes de la société, dans le but de créer un véritable annuaire ouvert à tous. Démarré en septembre 2010, avec l’aide des financements du secrétariat d’Etat à l’économie numérique, ce référentiel de la donnée publique hexagonale donne alors accès à un catalogue riche de quelque 2000 données publiques, collectées minutieusement auprès de 1380 organismes publics par une chaîne de traitement qui s’appuie sur des technologies conçues en partenariat avec Talend (éditeur Open Source d’outil d’ETL et de Datamagement) et de Nexedi (éditeur Open Source d’ERP 5 qui mettra en place à terme un module de paiement unifié).

Mais ce n’est pas tout. Data Publica entend également collecter des données auprès d’éditeurs privés. Il s'agit de permettre à des entreprises qui “auparavant ne pouvaient pas les vendre”, de commercialiser certaines de leurs données. C'est ce qu'explique  François Bancilhon, le Pdg de la société, également connu pour avoir dirigé l’éditeur Linux Mandriva. “Il s’agit de construire une place de marché généraliste pour vendre des données publiques et privées […] et de mettre à disposition des outils pour travailler”, ajoute-t-il.

Un raffinage de la donnée

Et force est de reconnaître que ce travail de fourmi n’est pas une mince affaire. C'est ce qu'explique Christian Frisch, le directeur technique de la société en présentant le moteur de Data Publica : des outils de crawling doués de mécanismes automatisés de classement et de qualification de la donnée, de re-structuration, de raffinage et d’enrichissement de la donnée et bien sûr d’indexation. Le tout soutenu notamment par des technologies propres au fameux Web sémantique, qui permettent une indexation très fine de l’ensemble. Derrière un objectif clair : celui de transformer une donnée brute afin d'en faire une donnée pré-digérée, enrichie, bref une donnée "comestible" susceptible d' être  vendue et exploitée par un tiers.


La valeur ajoutée de Data Publica résidera donc sur sa capacitéà raffiner les données afin de leur donner de la valeur : par exemple, en leur greffant des méta-données complémentaires, en juxtaposant des données payantes sur des données gratuites, bref en créant une donnée exploitable (gratuite ou payante) afin d’offrir la possibilité à des entreprises de développer, au dessus, des applications.  La cible ? Les grands comptes, le grand public, les chercheurs, la presse, mais également le secteur des TPE et PME. Un segment sur lequel nous souhaitons porter l’ouverture des données, commente François Bancilhon.

Pour illustrer son offre, Data Publica s’est entouré de partenaires, piochés dans les secteurs de la presse, de l’analytique et du décisionnel, de start-up technologiques, de la recherche (avec notamment le soutien de l’Inria)  qui doivent livrer des implémentations et des cas d’usages précis d’applications exploitant les données publiques, chassées par Data Publica. Citons  l’outil de visualisation des données  de la société Isthma, spécialiste des outils analytiques, qui livre un tableau de bord de l’ISF en France, en croisant les données relatives à l’imposition avec celles de l’Insee ; le site de presse Data News édité par StreetPress qui vient livrer une représentation de ce qu’est aujourd’hui le “data journalism”

Aujourd’hui en phase de démarrage, Data Publica entend gonfler son stock de données et atteindre “40 000 à 100 000 données” à la fin de l’année, souligne François Bancilhon. Objectif : devenir un des acteurs importants d'un marché français de l’ouverture des données évalué aujourd’hui 1,6 milliard d’euros.

Pour approfondir sur Open Source