Sémantique : Fise séduit les éditeurs et part chez Apache pour grandir
Pas concret le sémantique ? Réunie les 9 et 10 décembre derniers à Amsterdam pour son 4e Community Workshop, la communauté du projet de moteur sémantique européen IKS, et de son implémentation Fise, a prouvé le contraire en démontrant que les technologies sémantiques pouvaient attirer les éditeurs de CMS, et les faire plancher sur des modèles de gestion de contenu de demain. Démarré sous financement européen, le projet prend désormais seul son envol auprès de la Fondation Apache.
Le projet européen Open Source de moteur sémantique IKS (Interactive Knowledge Stack), dont la première implémentation sous le nom de Fise avait vu le jour en septembre 2010, termine l’année en fanfare. Implémentations en constante progression, accélération des développements, le projet, qui réunissait les 9 et 10 décembre derniers sa communauté d’utilisateurs lors de son 4e “Community Workshop” à Amsterdam, a démontré tout son potentiel devant un parterre de membres qui ne cesse ne grandir.
C’est ainsi que, installé dans le cadre enchanteur du centre culturel du Felix Meritis Center d’Amsterdam, que les développeurs cadres d’IKS ont posé leur ligne de code afin de faire avancer un projet qui doit désormais, deux ans après sa création, livrer ses plans concrets. “Il est vrai que cette 4e édition témoigne de l’intérêt que suscite ce projet”, explique un développeur français - qui a souhaité rester anonyme - présent lors de la manifestation, venu pour le compte d’un grand compte du secteur de l’énergie. Une évolution flagrante du projet qui dépasse aujourd’hui les grandes lignes un peu vagues posées lors des premiers ateliers. “Le projet rassemble désormais plus d’utilisateurs venus chercher des réponses à des cas d’utilisation concrets que de chercheurs, qui formaient initialement le noyau dur lors de la création du consortium en charge du projet”.
Inauguré en janvier 2008, le projet IKS, financé par la Commission Européenne à hauteur de 8,5 millions d’euros sur 4 ans, vise à développer un moteur sémantique Open Source interopérable, à destination du monde des éditeurs de solutions de contenu - comme les CMS ou les Wiki - , et capable de servir de socle pour le développement de plug-ins. Il repose sur une architecture modulaire basée sur Rest. Il réunit quelque 6 éditeurs de CMS, 7 centres de recherche et 40 utilisateurs “early adopters” dont une implémentation est en cours.
Et force est de reconnaître que Fise a déclenché chez les utilisateurs présents à ce 4e Community Workshop des cas d’usage très concrets et - un avantage pour un projet en recherche d’”early adopters” - relativement diversifiés. Si le projet d’implémentation très avancé du français Nuxeo, éditeur d’outil de gestion documentaire Open Source, a été remarqué - Nuxeo est l'un des fondateurs historiques du projet - pour sa facilité d’utilisation dans le monde de la GED, celui de l'institut de recherche de Salzbourg (Salzburg Research), Rick (Reference Infrastructure for Content and Knowledge) ou encore du Semantic Technology Laboratory du National Research Council italien, Kres (Knowledge Representation and Reasioning framework), ont posé les jalons d’architectures globales, exploitant dans ses derniers retranchements le principe des ontologies (qui décrit les liaisons logiques entre les données, grosso modo).
Nuxeo a développé un outil permettant d’extraire des entités depuis de simples documents HTML, PDF ou texte (tous les formats supportés par Nuxeo), via un simple “glisser-déposer” dans l’interface de la plate-forme de GED de l’éditeur (voir la vidéo sur YouTube)
La démonstration offerte par Henri Bergius (Nemein Oy / Midgard) et Haymo Meran (Gentics) a quant à elle permis de comprendre que l’environnement du sémantique pouvait également toucher un écosystème plus étendu, comme celui des éditeurs HTML. Leur projet : doter Aloha, un éditeur HTML 5, de possibilités d’annotations sémantiques simples, avec pour objectif de démocratiser l’usage des tags et annotations. ”Si nous devons démocratiser le sémantique, il faut pouvoir réaliser facilement de l’intégration sémantique ”, ont-ils alors martelé. Une évidence finalement. Dans un même ordre d’idée, citons également le projet de plug-in pour Confluence, un outil de Wiki collaboratif, ou encore le projet d’extension à OpenSAGA Wiki, illustrant au passage que le Wiki collaboratif demeure l’un des outils les plus propices à recevoir des technologies sémantiques.
“Si lors de deux premières éditions, il s’agissait de créer de l’intérêt auprès de la communauté des acteurs des CMS, sur leurs besoins, leurs attentes et la nature de leurs propositions pour ce stack, la 3e édition témoignait de l’arrivée des premiers éditeurs de CMS en tant que early adopters et, donc, des premières démonstrations. Depuis juin, nous avons décroché 8 early adopters, chez les éditeurs de CMS et les intégrateurs, qui sont aujourd’hui sous contrat avec le projet”, se félicite John Pereira, en charge de la gestion du projet. Prochaine étape - probablement à Paris - en juin 2011, date du prochain raout de la communauté, il s’attend à ce que la communauté monte un peu plus en puissance.
Un refuge au sein de la Fondation Apache
Et pour cause. Initié dans le cadre d’un projet européen IKS, le moteur sémantique Fise a aujourd’hui trouvé un havre de paix auprès de la fondation Apache, où il fera parti d’un ambitieux programme (placé pour l’heure dans l’incubateur de la fondation) baptisé Stanbol. Outre Fise, ce projet réunit plusieurs briques Open Source de la fondation pour créer une vraie pile logicielle d’infrastructure sémantique. “Le fait que la fondation Apache héberge le projet assure une pérennité au delà des quatre années initiales. On peut désormais compter sur une solution fiable pour les 10 ou 15 prochaines années”, commente Encolpe Degoute, consultant de la SSII lilloise Quadra Informatique, spécialisée dans l’intégration de système CMS Plone et de commerce en ligne Magento, présent lors de l’événement.
Pour John Pereira, cette arrivée au sein de la fondation Open Source a de quoi rassurer la communauté. Non seulement sur la pérennité du projet, mais également en matière de maturité du projet. “Avec Apache, nous héritons d’un écosystème complet dans lequel le projet pourra évoluer et bénéficier d’une importante infrastructure. Cela nous permettra de nous concentrer sur le développement de solutions, et sans trop passer de temps à créer une communauté”, explique-t-il. Un bienfait évident, notamment pour les éditeurs qui ont construit une offre commerciale sur Fise. Dans le giron d’Apache, le projet gagne assurément en fiabilité.
D’autant que Stanbol est appelé à grossir. La sortie d’une version bêta en juin prochain devrait donner de la visibilité au projet pour, dès 2012, réunir entre 10 et 12 “Early Adopters”, nous confie John Pereira. A partir de 2015, l’objectif est de rallier plus de 25 éditeurs, membres du programme “Early Adopters”. A cette date, des briques technologiques se seront un peu plus empilées dans le projet Stanbol. Et les technologies du sémantique prendront naturellement de l'embonpoint.
En complément
- L'entretien de Encolpe Degoute - (Quadra) : “ Le marché du sémantique est très morcelé”