Web sémantique : Google, Yahoo et Bing font enfin route commune
Google, Yahoo et Microsoft, les trois plus gros moteurs de recherche de marché, ont décidé de s’associer au sein de projet schema.org afin de travailler ensemble sur des spécifications communes de tags sémantiques, supportées dans leurs technologies d’indexation. Un grand pas en avant pour le concept du web sémantique, qui doit viser notamment à simplifier la tâche des développeurs Web, jusqu’alors aux prises avec une politique trop floue des moteurs sur le sujet.
Désormais, les développeurs Web ont un bonne raison d’ajouter les technologies du Web Sémantique dans leurs pages Web. Google, Yahoo et Microsoft, les trois acteurs qui font la pluie et le beau temps dans la recherche en ligne dans le monde, ont décidé de s’entendre sur des spécifications communes en termes de tags sémantiques à greffer aux pages HTML. Les trois moteurs de recherche ont ainsi décidé de collaborer au sein de schema.org, un projet qui entend livrer une série de vocabulaires et de schémas types sur lesquels les développeurs pourront se reposer pour structurer leurs données dans HTML. Un grand pas en avant dans la démocratisation des usages du web sémantique dans le grand public qui jusqu’alors peinait à trouver son véritable élan, freiné notamment à cause d’une politique relativement floue des grands moteurs de recherche sur le sujet. C’est donc aujourd’hui un des derniers verrous qui saute, après celui de la technique qui semblait avoir atteint un niveau de maturité suffisamment élevé pour encourager les entreprises à l’adoption. La conférence SemWeb Pro de janvier dernier nous avait permis de le confirmer.
Microdata au lieu de RDFa ou des microformats
Selon la FAQ du site Schema.org, “il existe actuellement de nombreux schémas et standards pour tagguer différents types d’informations sur des pages Web. Il est donc difficile pour les webmasters de décider lesquels sont les plus pertinents et quel standard supporté doit être utilisé”. En coordonnant leur travaux, les trois moteurs principaux du marché - d’autres acteurs du marché pourraient ensuite soutenir le projet - veulent ainsi simplifier la tâche des développeurs, en créant un nouveau schéma type qui sera assurément supporté, et en documentant efficacement son intégration pour les développeurs et les webmasters (qui pourront alors optimiser leur référencement).
Selon les trois partenaires, Schema.org s’inspire de www.sitemaps.org, un standard qui permet aux développeurs Web de référencer leur site en cartographiant chaque page du site, et va plus loin que l’Open Graph Protocol de Facebook, qui permet d’intégrer les célèbres mécanismes de partage et de mise en relation du réseau social dans les pages Web.
Un énième schéma type
Reste que tout n’est pas si rose car, comme le site l’indique clairement, Schema.org livre un nouveau type de schéma de structuration de données - un standard d’usage en somme - à un marché en dispose déjà, parfois standardisés. Mais surtout, et c’est un point important, Schema.org a décidé de reposer son choix sur les micro-données, et pas sur les micro-formats ou encore RDFa. Ce dernier∞ par exemple, est déjà standardisé par le W3C qui milite pour une étroite intégration du standard à HTML 5. Le consortium a par ailleurs ouvert un groupe de travail sur RDFa afin de plancher sur l’évolution de la norme (actuellement dans sa version 1.1). Les micro-formats, à l’image de hcalendar (qui permet de structurer des données événementielles) ou de hcontacts (pour les données liées aux contacts), ne sont pas intégrés à un organisme de standardisation, mais sont supportés par une communauté influente, microformats.org.
Pour Schema.org, ce choix des micro-données relève du pragmatisme. Comme l’indique la FAQ, "les microformats sont concis et faciles à comprendre mais ils n’offrent pas un mécanisme ouvert d’extensibilité et la ré-utilisation des classes de tag peut provoquer des conflits avec les sites Web en CSS. RDFa est modulable et très expressif, mais l’importante complexité du langage a contribué à ralentir son adoption. Le microdata est le standard récent le plus populaire, créé aux côtés de HTML5. Il assure un équilibre entre extensibilité et simplicité et il est le plus approprié pour développer schema.org”.
Etonnament, comme l’indiquent nos confrères de Technologyreview, le W3C n’aurait pas été consulté pour la création de schema.org. D’ailleurs, l'un de ses responsables estime que se concentrer sur les micro-données, certes soutenues par le W3C, mais pas encore standardisées, semble quelque peu réducteur, en termes fonctionnels, par rapport à RDFa. Tout en confirmant que voir les trois plus gros moteurs de recherche rallier publiquement l’approche sémantique est favorable pour l’adoption du concept.