sdecoret - Fotolia
TIBCO pousse la collaboration autour des métadonnées
Lors de son événement TIBCO Now, en octobre 2019, l’éditeur avait présenté TIBCO Cloud Metadata. Cette solution de gestion de métadonnées vise à la fois les métiers, les responsables de la donnée et les experts IT.
TIBCO Software n’a de cesse de rappeler que sa stratégie commerciale s’appuie sur trois piliers : Connect, Unify, Predict. TIBCO Cloud Metadata entre dans la gamme de produits Unify (ou data management). Cette solution de gestion de métadonnées sera disponible le 30 avril 2020.
L’offre SaaS TIBCO Cloud Metadata est basée sur la solution TIBCO EBX. Elle est issue du rachat d’Orchestra Networks, un spécialiste français du MDM, en décembre 2018
Une seule solution pour gérer toutes les métadonnées
Philippe Assunçao, Directeur avant-vente EMEA & APJ produits Unify chez TIBCO Software, est un ancien d’Orchestra Networks. Selon lui, la solution de gestion de métadonnées adaptée au cloud a « un périmètre fonctionnel assez large ».
La gestion de métadonnées permet de décrire les informations qui sont gérées au sein de l’entreprise de manière technique dans le but de répertorier les applications qui les utilisent ou les génèrent, de quelles technologies elles dépendent. Cette gestion doit également faciliter la description des données utilisées par les métiers dans une application et la définition de concepts, par exemple la qualification d’un client dans un système d’information.
« Nous essayons de répondre à ces trois sujets avec un seul outil, ce qui est un grand différenciateur par rapport à la plupart des produits de gestion de métadonnées disponibles sur le marché », vante Philippe Assunçao. « À l’inverse, nos compétiteurs proposent différents outils pour répondre à ces cas d’usage ».
L’équipe derrière TIBCO Cloud Metadata est principalement constituée d’anciens d’Orchestra Networks. « Nous adaptons une approche consacrée aux métadonnées que nous avions déjà appliqué au marché du MDM chez Orchestra Networks », ajoute-t-il.
Philippe AssunçaoDirecteur Avant-vente produits Unify EMEA & AJP, TIBCO Software
Comme avec EBX, il est possible de définir des règles de qualité, de mettre en place de la gouvernance, du dédoublonnage ou encore des workflows pour les développeurs.
Pour répondre aux besoins des différents utilisateurs TIBCO Cloud Metadata intègre d’abord une fonctionnalité de découverte (data lineage) et d’extraction des métadonnées afin de décrire les tables, les objets et autres éléments issus d’une base de données. Cette méthode automatisée doit couvrir deux des trois cas d’usage identifié par l’éditeur. Toutefois, les populations techniques doivent gérer les connexions vers les différents outils, applications et bases de données localisés sur une infrastructure.
Ce sont des agents qui vont assurer la connexion aux applications sur site et dans le cloud, la collecte des métadonnées et les envoyer « de manière sécurisée » vers TIBCO Cloud Metadata. Un data model générique et des règles d’automatisation doivent faciliter la classification.
« Nous avons effectué un gros travail sur le modèle de données qui régit la classification pour couvrir l’ensemble des usages en entreprise », relate Philippe Assunçao.
Impliquer l’ensemble des collaborateurs
Une fois les informations extraites, les utilisateurs peuvent les labéliser manuellement via un outil collaboratif pour alimenter un glossaire métier. Il rassemble les concepts qui définissent l’activité d’une entreprise. « Il y a toujours des risques avec la classification automatique des données. Il ne faut pas hésiter à impliquer les utilisateurs de temps à autre pour vérifier la validité de ce processus », explique Philippe Assunçao.
L’éditeur propose de corréler ces informations techniques et les descriptions opérées par les métiers via du machine learning. TIBCO Software adopte une approche linéaire, basée sur la classification naïve bayésienne. Cet algorithme supervisé s’appuie sur les probabilités conditionnelles afin d’effectuer des rapprochements automatique ou suggérer des correspondances entre des données.
La fonctionnalité aiderait à trouver les doublons, optimiser l’usage de certaines applications ou vérifier la cohérence entre le data model et le glossaire métier.
TIBCO Cloud Metadata a été conçu pour répondre à des besoins des équipes BI et analytique.
« Aujourd’hui nos clients génèrent énormément de données, mais les data analysts ont parfois du mal à trouver des jeux de données pertinents. Nous voulons fournir un Data Catalog qui décrit l’ensemble des jeux de données afin que les utilisateurs puissent y accéder depuis une seule interface en libre-service », affirme le directeur avant-vente.
L’outil doit également faciliter la gouvernance des données et la conformité. Après avoir fait l’inventaire des data sets et de leurs dépendances, il serait plus facile de faire respecter le droit à l’oubli, selon notre interlocuteur.
L’éditeur y voit aussi un moyen de déployer de nouvelles applications.
« Il est possible d’établir les règles d’utilisation et les jeux de données associés à une nouvelle application à travers TIBCO Cloud Metadata, de créer un data model personnalisé en somme à travers de l’interface utilisateur », estime le dirigeant.
Ces indications de la part des métiers peuvent être traduites techniquement par les développeurs et les administrateurs dans un dictionnaire de données pour appliquer un schéma spécifique sur un SGBD.
« Nous voulons impliquer toutes les populations au sein de l’entreprises, des métiers aux experts IT », assure Philippe Assunçao.
Concernant les applications existantes, il n’est pas question de modifier leur comportement. La solution doit simplement lire et aider à répertorier les données de l’entreprise.
Philippe AssunçaoDirecteur Avant-vente produits Unify EMEA & AJP, TIBCO Software
Les éditeurs misent sur la cartographie des données
Le programme bêta lancé en fin d’année 2019 aurait permis de finaliser le produit disponible dans quelques jours. Le directeur avant-vente évoque des modifications du data model générique et de l’interface utilisateur provoquées par les commentaires des « early adopters ».
Une version d’essai de TIBCO Cloud Metadata sera disponible à la fin du mois. La tarification est modulée suivant des packs d’utilisateurs.
D’autres éditeurs et startups proposent des solutions similaires afin de cartographier l’ensemble des données et d’optimiser leur exploitation. Par exemple, Orange utilise la solution de la startup française DataGalaxy pour gérer les métadonnées de l’une de ses PaaS de manière collaborative. Informatica, Aliation, Infogix et Collibra suivent cette même trajectoire.