Tableau lance son catalogue de données
Tableau ajoute un nouvel outil pour tracer et lister les jeux de données d'une entreprise. Après la Data Prep, cette nouvelle fonctionnalité s'inscrit bien dans sa stratégie de conquête des backends BI et de séduction des responsables IT.
C'est fait. Après la préparation de données (Data Prep), Tableau ajoute une nouvelle corde à son arc pour répondre aux exigences de qualité et de gestion des données des entreprises avec un Data Catalog.
Le but est double. L'éditeur qui a débuté dans la Data Viz pure veut aujourd'hui séduire l'IT avec des fonctionnalités « entreprises » (pour bouter Cognos, SAP et autres MicroStrategy hors des backends BI). Il veut aussi diversifier son champ fonctionnel et, donc, son chiffre d'affaires - Tableau Catalog ne sera pas inclus en natif dans Tableau Server, mais sera disponible sous forme d'extension (la même que celle de Tableau Prep).
La présentation de ce catalogue de données a été faite lors de la grand-messe européenne de Tableau, mi juin, à Berlin.
Indexation et découvertes de données
« Dans Tableau Catalog, vous verrez toutes les bases de données et toutes les tables que vos collaborateurs utilisent. Tableau Catalog indexera automatiquement [toutes vos sources]. Vous serez en mesure de comprendre quelles données sont utilisées par qui », lance le Chief Product Officer (CPO), François Ajenstat sur la scène de la Tableau Conference Europe.
« Nous le faisons automatiquement, c'est intégré », ajoute-t-il dans un échange avec le MagIT. « Une fois que vous le lancez, il fait tout ce travail. Aucune installation [ou paramétrage] n'est nécessaire ».
Le but d'un tel catalogue est de centraliser toutes les métadonnées de toutes les sources pour les indexer, les classer, les rendre plus simplement disponibles aux utilisateurs (de préférence avec le bon vocabulaire métier), les suivre dans le temps (Data Lineage) et s'assurer de la qualité des informations de départs.
« Le catalogue améliore la découverte [de données] », vante d'abord logiquement le responsable sur scène. « Désormais, chaque [titulaire d'une licence] Créator ou Explorer pourra rapidement chercher et trouver les bonnes données pour ses analyses [...] Au lieu de se connecter à telle ou telle base, puis de trouver quelle table utiliser, il est maintenant possible de passer par le catalogue pour trouver les bonnes données au bon moment pour une analyse beaucoup plus rapide ».
Concrètement, dans une optique à la Ask Data, l'utilisateur pourra « simplement dire : "Dis-moi quelle base contient mes magasins, mes marges, mes ventes". Et il trouve ces données », précise-t-il au MagIT.
Gouvernance et curation
Comme tout bon Data Catalog, Tableau Catalog pourra pousser des sources en fonction de rôles (accéder à des données clients ne sera pas pertinent - voire non autorisé d'un point de vue réglementaire - aux services RH) ou en fonction de la qualité des jeux de données, suite à l'évaluation des Data Stewards (fonction de curation).
Tableau ne s'en cache pas, un de ses grands chantiers en cours est de bâtir une offre complète autour de la gouvernance.
« A mesure que les clients sont en train de standardiser [leur BI] sur Tableau, ils ont à la fois besoin de self-service et de gouvernance », confirme François Ajenstat dans son échange avec le MagIT. « Ils veulent autonomiser les utilisateurs, mais dans le même temps, ils ont besoin de contrôle et de visibilité pour s'assurer que les données sont sécurisées. Et c'est là que certaines nouveautés - comme le catalogue - aident énormément, parce qu'elles donnent une nouvelle vue d'ensemble des données qui existent [dans l'entreprise] »
Autre atout destiné à séduire l'IT, les catalogues sont utiles pour les analyses d'impact. Autrement dit, ils servent à évaluer - du côté IT - les conséquences éventuelles sur les jeux de données d'une montée de version applicative ou d'une migration.
« Je viens de parler avec des clients. Les professionnels de l'IT étaient tout simplement enthousiasmés », nous assure François Ajenstat. « Le catalogue leur donne un aperçu du monde de la BI en libre-service qu'ils n'ont jamais eu. Et ils sont aussi emballés, parce que maintenant, comme ils permettent à plus de gens d'utiliser l'analytique, ils se sentent plus à l'aise ».
Spécificités (revendiquées) : un catalogue intégré, pour l'utilisateur, et le prix
Rien de révolutionnaire pour un Data Catalog, diront certains. Et de fait, ces fonctions sont plutôt classiques. Mais François Ajenstat souligne tout de même deux différences.
D'après lui, ce qui est « vraiment unique » (sic) dans Tableau Catalog, c'est que les métadonnées qui y sont définies sont acheminées jusqu'aux utilisateurs.
« Lorsqu'ils regardent des visualisations ou des tableaux de bord, comment savent-ils ce qu'ils regardent vraiment ? Doivent-ils faire confiance [à ces visualisations] ? Que signifie ce champ ? Avec le catalogue intégré, toutes les métadonnées font partie intégrale de l'expérience [analytique]. Les utilisateurs peuvent non seulement voir leurs données, mais aussi les comprendre et leur faire confiance au moment où ils les consomment ».
D'après le CPO de Tableau, « personne n'avait fait cela auparavant ».
« La plupart du temps, les catalogues sont conçus pour l'IT, afin de l'aider à comprendre les données. Ce que, nous, nous essayons de faire, c'est d'apporter la valeur du catalogue aux utilisateurs ».
La deuxième différence est d'ordre financier. L'add-on « Data Management » de Tableau - qui regroupe le catalogue et Tableau Prep - est facturé 5,5 $ par mois et par utilisateurs, avec un double minimum de 100 utilisateurs et de douze mois.
« Si vous avez cent utilisateurs, c'est 6.000 $ à l'année. C'est très peu. Les alternatives sur le marché coûtent des centaines de milliers de dollars ».
Une API pour dialoguer avec les autres Data Catalogs
Tableau Catalog bénéficie également d'une API pour le connecter à d'autres catalogues « d'entreprise ».
« Si vous utilisez Collibra, Alation, Informatica (NDR : trois partenaires de Tableau) ou tout autre catalogue, ces catalogues d'entreprise pourront lire les métadonnées depuis Tableau et pousser leurs métadonnées dans Tableau. Vous pouvez ainsi enrichir votre catalogue et votre glossaire d'entreprise et améliorer les deux catalogues », explique François Ajenstat.
« Avec les APIs, la transaction des données peut se faire dans les deux sens. C'est très important. Nous voyons aussi des clients qui ont leur propre catalogue. Ils créent quelque chose d'unique pour leur entreprise. Avec l'API, ils peuvent transférer les méta-datas dans Tableau », résume-t-il pour LeMagIT.
Plusieurs Data Catalog ?
Dans ce domaine des Data Catalogs, Tableau a des partenaires historiques - qu'il considère toujours comme tel. L'éditeur de BI ne va-t-il pas leur prendre des parts de marché avec sa nouvelle offre ?
La question se pose d'autant plus que Collibra propose par exemple déjà des fonctionnalités comme l'extension On-the-Go qui permet - comme Tableau Catalog - d'afficher les métadonnées à l'utilisateur.
Pour François Ajenstat, il n'y aura pas de cannibalisation. Les deux sont « très complémentaires », juge-t-il, et il existerait bien un intérêt à avoir deux Data Catalogs - un dans Tableau et un d'« entreprise ».
« [Alation, Collibra, Informatica] sont de très forts partenaires [de Tableau]. Ils ont ces catalogues d'entreprise destinés aux responsables de la gestion des données (Data Stewards) et à l'informatique. Ils liront les métadonnées de notre catalogue et rempliront les leurs avec », avance le CPO de Tableau qui illustre cette complémentarité avec un exemple qu'il qualifie de « très classique ».
« Si je crée un calcul dans Tableau, il existe dans Tableau. Mais comment l'ajouter au catalogue principal ? Maintenant je peux le faire. Et si j'écris un glossaire dans un Alation, et que je le certifie, je peux aussi le pousser dans Tableau ».
Le Product Manager de Collibra, Yulia Prylypkode, vante d'ailleurs lui aussi au MagIT le fait que son catalogue « permet de relier les métadonnées d'un rapport aux termes tirés du glossaire d'entreprise », ce qui « donne aux rapports des informations supplémentaires significatives ».
Ceci étant, la remontée des données de Tableau dans un ces catalogues n'est pas une nouveauté aussi nouvelle que cela... « Depuis plus de trois ans, nous collaborons avec l'équipe de développement de Tableau pour nous assurer que les métadonnées des rapports et des dashboards de Tableau sont disponibles pour les catalogues de données d'entreprise », nous explique Satyen Sangani, le CEO d'Alation.
Il considère néanmoins - tout comme François Ajenstat - que les deux sont complémentaires. « Tableau redouble d'efforts dans ce domaine en lançant son propre catalogue pour les actifs data dans Tableau [...] En s'associant en parallèle avec des fournisseurs de catalogues de données d'entreprise comme Alation, Tableau s'assure que ses utilisateurs disposent d'une visibilité totale sur toutes les ressources de données disponibles ».
En clair, Tableau se concentre sur Tableau. Alation a une vocation plus généraliste. « Les écosystèmes analytiques sont en pleine transition du sur site vers le cloud. Ces transitions signifient que les données ne vivent pas toutes dans Tableau. Elles sont réparties entre Tableau Servers et de multiples instances cloud, des bases de données et des outils de Data Science », analyse Satyen Sangani.
Conclusion ? « Alation complète Tableau Catalog en fournissant une gestion des données [...] qui capturent la complexité nuancée des données d'entreprise à travers ces systèmes distribués, pour permettre à tout utilisateur d'analytique en libre-service d'avoir confiance dans le résultat de ses requêtes ».
Mais comme Tableau a vocation à devenir l'épine dorsale de la BI des groupes, son catalogue pourrait bien, lui aussi, devenir d'« entreprise » dans un futur proche. La question se reposera alors peut-être en d'autres termes.