François Bourdoncle, Exalead : "stocker information structurée et non structurée ensemble"

Le co-fondateur et directeur de la stratégie d'Exalead, un des principaux moteurs de recherche français, revient sur Squarred, une interface où Google présente ses résultats de recherche en tableau. Selon François Bourdoncle, le signe clair de l'orientation de la recherche Internet vers des fonctions décisionnelles, virage également entamé par sa société (165 pers., 15,5 millions d'euros en 2008).

francois 300dpiLeMagIT : Quels sont vos commentaires après la sortie de Squarred, nouvelle interface de présentation des résultats de recherche proposée par Google la semaine dernière ?

François Bourdoncle : Après avoir mené un petit travail de reverse engeneering sur le sujet, je pense qu'il s'agit d'un outil encore très syntaxique, et non sémantique. Les entités retournées dans les lignes et les colonnes ne sont par exemple pas typées. Squarred semble s'appuyer sur Wikipedia : quand les données structurées existent sur l'encyclopédie online, les résultats sont bien meilleurs. Mais le tout reste largement perfectible : c'est une bêta qui apparaît surtout comme une réponse à la sortie de Wolfram Alpha (un mix entre pur moteur de recherche et Wikipédia lancé mi-mai, ndlr).

LeMagIT : Cette sortie est aussi révélatrice d'une évolution en cours de la recherche, notamment dans la manière de présenter les résultats à l'utilisateur...

F.B. : C'est effectivement dans cette direction que regardent Google, Wolfram Alpha ou nous. Nous essayons tous de stocker l'information structurée et non structurée au sein du même entrepôt de données, pour proposer des résultats de recherche mixant ces deux catégories d'information. Fin 2009 ou début 2010, Exalead sortira un produit répondant à cette attente. Il s'appelera CloudView 360.

LeMagIT : sur quels principes repose-t-il ?

F.B. : Nous avons bâti une "semantic factory", une ligne d'assemblage des éléments métiers utiles à la création de l'application d'accès et de leurs relations. Identifier les données liées est un premier pas vers le Web sémantique et donne la capacité de réaliser des agrégats, comme dans le décisionnel. Même si nous ne nous voyons pas venir concurrencer les éditeurs de BI sur la couche de reporting, Exalead a plutôt vocation à se positionner sur le datawarehouse, en fournissant, en complément de la "semantic factory", le cube sémantique.

Cette approche est déjà déployée chez certains de nos clients comme Gefco ou La Poste. Chez ce dernier, le service 36 31, qui gère les appels relatifs à la distribution de courrier, exploite un moteur qui va chercher de l'information dans les bases existantes de l'entreprise. Nous déstructurons cette information pour effectuer des recherches en texte libre. C'est ce type de solution que nous rendrons plus accessible. Car tout l'enjeu de CloudView 360 consiste à simplifier le paramétrage, en remplaçant les méthodes sémantiques par une approche statistique.

LeMagIT : Cette approche est-elle réservée à des applications très ciblées ou peut-elle aussi concerner des moteurs généralistes comme Google.com ou Exalead.com ?

F.B. : Tenter d'amener le bon niveau de pertinence sur un moteur généraliste me paraît illusoire. Avec cette approche, Exalead ambitionne plutôt de créer des moteurs spécialisés. Mais ce type de fonctionnalités sera également exploitée - comme un complément aux algorithmes actuels - par les moteurs généralistes pour améliorer la pertinence de leurs résultats. Même si elles resteront cachées.

En complément :

Lire notre article sur la sortie de Google Squarred.

Pour approfondir sur Editeurs