Catalogue de données : quelle différence entre Tableau Catalog, Collibra et Alation ?
Avec son catalogue, Tableau pouvait empiéter sur les terres de ses partenaires historiques. D’après son CTO, l’objectif n’est pas d’en devenir concurrent, mais de fournir au plus grand nombre un outil clef en main, qui peut être complémentaire des offres de Collibra et d’Alation.
Lors de son évènement européen, Tableau Software avait lancé depuis Berlin son catalogue de données. Baptisé logiquement « Tableau Catalog », cet outil ajouté à l’extension Data Management de Tableau Server, traduisait la volonté de l’éditeur de DataViz de devenir, de plus en plus, un backend à la place des Cognos, BO et autres MicroStrategy – et plus seulement un outil de BI en self-service au bout de la chaîne analytique.
Mais il posait également une question sur l’articulation avec les Data Catalogs du marché – ou leurs remplacements.
Dans cet entretien accordé au MagIT, Andrew Beers (CTO de Tableau) revient sur la genèse de ce catalogue, précise les différences avec ceux de ses partenaires Collibra et Alation, et éclaircit leur complémentarité possible via une nouvelle API (MetaData).
LeMagIT : Quelle est votre stratégie avec Tableau Catalog ?
Andrew Beers : L’idée derrière ce Data Catalog, c’est que la révolution de [l’analytique] en libre-service – à laquelle Tableau a sans aucun doute participé – est un tel succès qu’à l’intérieur des entreprises, une énorme quantité de contenus sont créés autour de la donnée. Et aujourd’hui, nous devons faire attention à plusieurs choses.
La première, c’est qu’il faut être sûr que les gens puissent trouver les données dont ils ont besoin, et qu’elles soient bonnes. Et donc nous voulons être sûrs que les organisations, dans leur ensemble, puissent s’occuper de leurs données et bien les gérer.
Tableau Software s’adresse à la fois aux utilisateurs métiers (notre cible historique) et à l’IT – parce que c’est l’IT qui prend soin des données, qui promeut les bonnes pratiques de gouvernance, et qui rend possible la visibilité et la découverte des données, ainsi que, au final, la confiance que l’on peut avoir en elles.
C’est ce double objectif - métier et IT - qui nous a poussés à lancer Tableau Catalog. Nous voulons que la BI en libre service continue de progresser côté métiers. Mais pour qu’elle continue, il faut aussi fournir de bons outils de gouvernance et de gestion des données – ce que demandent les entreprises en premier quand elles font passer leurs projets analytiques à l’échelle.
LeMagIT : D’accord sur l’intérêt d’un catalogue de données. Mais comment va s’articuler Tableau Catalog avec ceux d’Alation, de Collibra ou d’Informatica ? Vous avez d’ailleurs un partenariat avec les deux premiers. En résumé, quelle est la différence entre votre catalogue et ceux qui existent déjà ? Sont-ils complémentaires ? Va-t-il y avoir des chevauchements fonctionnels ?
Andrew Beers : Il y aura inévitablement quelques chevauchements. Mais nous voyons surtout des complémentarités.
En fait, nous avions bien en tête ces partenariats quand nous avons conçu notre catalogue. Mais laissez-moi repréciser une chose sur le nôtre.
Noter catalogue est très centré sur les données que les métiers consomment dans Tableau. Les utilisateurs pourront aller dans le catalogue pour voir tout ce qui a été publié aujourd’hui. Et ils pourront voir les données, derrière ces publications, qui ont été utilisées pour les générer.
Ils pourront, par exemple, regarder une table particulière. Ils verront tous les contenus qui l’ont utilisée, tous les flux de Tableau Prep, tous les workbooks et tous les dashboards. Ils pourront aussi voir toutes les personnes qui ont manipulé ces données. Et ils verront toutes les sources de données – les bases et les tables et les champs individuels, etc. – qui composent tous ces flux et toutes ces analyses. Et ils verront les autres sources qui ont été impliquées par ailleurs dans ces flux et ces analyses.
C’est un catalogue très lié à Tableau. Les catalogues d’Alation et de Collibra ont un horizon plus large. Ils ont vocation à lister toutes les données [d’une entreprise], mais en allant peut-être un peu moins en profondeur dans chacune d’elles.
D’ailleurs, une des choses que nous avons faites dès la conception de notre catalogue, c’est de le faire reposer sur une nouvelle API Metadata. Nous avons beaucoup échangé avec nos partenaires. Le résultat c’est qu’ils pourront utiliser cette API pour entrer plus profondément dans Tableau et en extraire les métadonnées qui enrichiront encore leurs catalogues.
LeMagIT : Je ne sais pas si j’ai bien compris le sens de l’histoire, mais il me semble que Tableau veut de plus en plus être un backend BI. Ce qui implique que vous allez vous connecter à plus de sources et à plus de données des entreprises. Et donc vous serez amenés au fil tu temps, vous aussi, à être un catalogue plus large. Votre stratégie de croissance n’implique-t-elle pas que vous deveniez concurrents de vos partenaires du jour dans le Data Catalog ?
Andrew Beers : Je pense que c’est une situation assez classique que vous voyez souvent – et qu’elle est très semblable à ce que nous avons déjà vécu. Par le passé, nous avons ajouté notre propre base et notre propre moteur de données. Et on nous a posé la même question à l’époque : allez-vous concurrencer les éditeurs de bases de données ? Et la réponse était clairement : non ! Mais nos clients avaient absolument besoin ce cela, donc nous l’avons ajouté [en natif]. C’est la même chose pour le catalogue.
Nos clients en ont besoin. Vous avez de plus en plus d’entreprises qui déploient Tableau à grande échelle. Ils se posent des questions du style : quelles données sont utilisées, et comment le sont-elles ? Ils ont besoin de réponses et que ces réponses soient le plus possible « incluses en natif » dans Tableau. Notre catalogue fait partie de notre extension Data Management, mais il est hautement intégré à Tableau Server.
Si vous êtes un gros client de Tableau – et que vous voulez développer le libre-service, l’accès à la donnée et la gouvernance qui va avec – alors, n’hésitez pas à utiliser notre catalogue. Mais vous savez, nous ne sommes pas péremptoires. Si un de nos clients utilise déjà un catalogue – que ce soit Collibra, Alation ou un autre – évidemment, nous respectons son choix. En revanche, l’arrivée de Tableau Catalog va améliorer ces catalogues plus globaux parce que c’est ce que nous voulions : nous voulions que l’expérience qu’ils ont avec leurs catalogues soit la meilleure possible. Nous ne voulions surtout pas être un truc un peu opaque à l’intérieur duquel on ne peut pas aller regarder.
Entretien réalisé le 18 septembre 2019