Konstantin Emelyanov - Fotolia

Talend Data Fabric se dote d’un Data Catalog dans le cloud

La mise à jour de Talend Winter’20 intègre des nouvelles fonctionnalités de catalogage de données dans le cloud ainsi que des capacités améliorées de conception de pipeline de données.

Talend présente de nouvelles fonctionnalités pour sa Data Fabric, une suite d’outils d’intégration et de gestion de données. L’éditeur basé en Californie a fait grandir son portefeuille de solutions autour de son ETL afin de prendre en charge des applications BI et analytiques de plus en plus complexes. 

Présentée à la fin du mois de février, la mise à jour Winter’ 20 sera disponible à la fin mars.

Selon Steward Bond, analyste chez IDC, cette mise à jour reflète la maturité des offres de Talend d’intégration de données dans le cloud. L’éditeur introduirait davantage d’automatisation basée sur l’intelligence artificielle dans son portfolio.

« Les organisations recherchent davantage de capacités d’ingénierie de données, de collaboration, de renseignement et d’intégration dans des environnements hybrides », déclare l’analyste. « Elles souhaitent également plus d’automatisation basée sur l’IA au sein de leurs outils d’intégration et de renseignement sur les données pour les aider à simplifier les environnements de données à l’ère de l’économie numérique ».

Parmi les nouvelles fonctionnalités de la Talend Data Fabric, l’inventaire de données entre dans une catégorie appelée « Data Intelligence ».

« La Data Intelligence renseigne sur les données et non à partir des données », avance Steward Bond. « IDC classe le profilage, la gouvernance, le catalogage de données et les logiciels de Data Lineage dans la catégorie Data Intelligence ».

Talend Data Inventory apporte des fonctionnalités de catalogage de données dans le cloud, mais « il ne faut pas le confondre avec l’offre Talend Data Catalog dédiée à la gestion de données sur site », souligne l’analyste d’IDC.

Aller au-delà du Data Catalog

Selon Michel Franco, directeur senior marketing produits chez Talend, Data Inventory est différent de Data Catalog parce que la technologie ne s’intègre et ne s’utilise pas de la même manière.

« Nous pensons que l’avenir du catalogue de données consiste à l’intégrer dans toutes les applications possibles » vante Michel Franco. « Vous pouvez exposer les données, vous pouvez apporter de la transparence sur les données, et aussi avec toute l’intelligence et les métadonnées, nous pouvons rendre les choses plus automatiques ».

Les utilisateurs peuvent également labelliser les jeux de données afin de les évaluer ou de les certifier pour un usage particulier.

D’une certaine manière, Talend Data Inventory n’est pas un simple Data Catalog, mais beaucoup de produits de ce type sont bien plus que des systèmes de gestion de métadonnées. Les plus modernes offrent des capacités d’automatisation, de crowdsourcing, de renseignement et de collaboration pour faciliter le travail des entreprises. Talend s’inscrit dans une tendance naturelle du marché. Il entend maintenir son rang sur un marché fortement concurrentiel. 

Nettoyer les données dans les pipelines

L’éditeur entend améliorer également les capacités de son Pipeline Designer. Cet outil sert à développer et déployer les pipelines de données. Dans la mise à jour Winter’ 20, l’éditeur ajoute la possibilité d’inspecter la qualité des données avant qu’elles ne soient consommées par une application. L’outil affiche les mises à jour des données en temps réel au sein des pipelines.

Selon Michel Franco, Pipeline Designer peut être utilisé pour connecter différentes sources de données, dont des lacs de données ou des flux de streaming, à des applications ou des processus analytiques.

L’éditeur a par exemple mis à jour pour prendre en charge le runtime 5.5 LTS de DataBricks sur Azure et AWS, HortonWorks Data Platform 3.1, Apache Kafka 2.2.1, Google Dataproc 1.4 ou encore Azure Data Lake Gen 2. Enfin, les moteurs de traitement au plus près des sources (Remote Engines for pipelines) ont été mis à niveau pour supporter nativement les modèles de ressources Azure.

Pour approfondir sur Editeurs

Close