CubicWeb : Logilab pousse le Web sémantique pour orchestrer l’Open Data
Coup de projecteur sur le projet CubicWeb, une plate-forme Open Source de développement d’applications sémantiques récompensée lors du dernier concours Dataconnexions 2. Développée par la société LogiLab, CubicWeb vise à proposer un standard du développement d’applications orientées données, à l’heure où la publication des données publiques et privées monte en puissance.
Dans un univers de l’Open Data où la donnée pure constitue le moteur principal, quoi de mieux que le Web sémantique. C’est ainsi que pourrait être résumée, très schématiquement, l’idée à l'origine de CubicWeb, une plate-forme de développement d’applications centrées sur la donnée, dont l’une des caractéristiques principales est de s’adosser aux si précieuses spécifications qui orchestrent le concept du Web sémantique. Développée par la société Logilab, cette plate-forme CubicWeb, à l’Open Source depuis 2008 (sous licence LGPL), a récemment reçu le prix Utilité Publique décerné lors de la 2e édition du concours Dataconnexions, organisé par Etalab. Ce « champion » du secteur est également membre du pôle de compétitivité francilien Systematic et animateur de la communauté du Web sémantique en France - on lui doit par exemple l’organisation de l’événement SemWeb Pro.
Ce concept du Web sémantique, cher à Tim Berners-Lee, l’un des pères du Web, consiste à donner au Web une approche centrée sur la donnée et son sens (via des méta-données), plutôt que centrée sur les documents. Dans le Web sémantique, les données disposent ainsi d’un identifiant unique (URI), comme l’ont aujourd’hui les pages Web, facilitant ainsi leur échange et leur manipulation. Les briques technologiques qui forment les mécanismes du Web sémantique sont standardisées par le W3C - RDF pour la description des données, OWL pour la définition des ontologies (des vocabulaires qui donnent une logique à des groupes de données ), ou encore SPARQL qui permet de réaliser des requêtes.
Pour Logilab, cette technologie a justement toutes les qualités requises pour exploiter la toute puissance de l’Open Data et du très tendance Big Data. Dans cet environnement, « ce qui est important, ce ne sont finalement pas les applications, explique Nicolas Chauvat, fondateur et Pdg de Logilab, mais bien les données en elles-mêmes. Ce qui est utile, c’est la manipulation et les échanges de données ; les applications ne sont que des rouages pour favoriser cet échange et pour en retirer quelque chose ».
Une plate-forme à vocation générique
C’est donc là que se positionne CubicWeb. Cette plate-forme de développement permet « aux développeurs de se concentrer sur les spécificités de leur application plutôt que d'avoir à réinventer les briques essentielles de l'import, la fusion, la publication, l'interrogation et la visualisation de données », indique la société. Une plate-forme de développement générique, en somme, qui permet non seulement d’accélérer les phases de développement (en se reposant notamment sur la ré-utilisation de composants - les cubes de CubicWeb), mais également, pour les entreprises, de se concentrer sur leur métier et les données associées.
Car pour Nicolas Chauvat, l’ère de l’Open Data n’en est qu’à ses débuts. « Les données ouvertes, on a pas fini d’en voir et l’Etat a entrepris une politique pour en favoriser l’ouverture. Mais il y aura également encore plus de données du côté des entreprises [...] Des données seront partout et on ne va pas pouvoir passer notre temps à développer des applications spécifiquement à chaque fois », souligne-t-il. Une plate-forme générique, et surtout à l’Open Source, fait ainsi sens, dans l’esprit de Logilab. Car mutualiser les développements de ce socle permet certes de créer un standard de développement et donc de mutualiser les coûts de développement, mais également de créer une communauté, favorisant l’émergence d’applications liées à l’Open Data.
Et justement, cette communauté autour de CubicWeb doit aujourd’hui grandir, lance Nicolas Chauvat, afin de pouvoir profiter de cette mutualisation et donner de l’élan aux services. Aujourd’hui, la société compte des grands comptes dans son portefeuille clients qui, assure-t-il, ont tous contribué à l’évolution du code de la plate-forme. « Dans le contrat, on détermine quels sont les composants libres et lesquels ne le sont pas » . De quoi alors attirer la BNF (Progilab a remporté l’appel d’offres portant sur la fusion des catalogues de l’institution), EDF, GDF, le CEA et le CNES notamment.