arthead - stock.adobe.com
La couche de gouvernance de DBT Labs convainc davantage que son assistant IA
La plus récente mise à jour du spécialiste de la transformation des données introduit de nouvelles fonctionnalités de gouvernance et de gestion des métadonnées, ainsi qu’un copilote alimenté par l’IA. Les analystes estiment que l’assistant IA est moins convaincant que l’intégration des fonctions de gestion des données.
Basé à Philadelphie, DBT Labs – dont le nom signifie « Data Build Tool » – a commencé par développer un ensemble de fonctionnalités open source pour aider les data engineers à nettoyer, valider et joindre des jeux de données à partir de données brutes.
L’éditeur propose toujours une version open source de sa plateforme, mais il mise se concentre désormais sur deux versions commerciales : Team, pour 100 dollars par poste et par mois, ainsi qu’une édition Enterprise, soumise à une « tarification personnalisée ».
Cette semaine, il a présenté DBT Assist, un assistant propulsé par l’IA générative qui se concentre sur l’amélioration de la productivité des experts de données plutôt que sur l’aspect conversationnel. Actuellement en phase de bêta test, l’outil génère automatiquement de la documentation et des tests afin d’éliminer une partie du travail manuel nécessaire au cours du processus de développement.
DBT Assist, un début timide dans le monde de la GenAI
En dévoilant des capacités d’IA générative, peu importe si elles sont en disponibilité générale ou en cours de développement, DBT Labs montre à ses clients qu’il est à la pointe de la technologie, selon Kevin Petrie, analyste chez BARC U.S.
« Le copilote GenAI (bien que le concept n’ait plus grand-chose d’inédit) est essentiel pour rester compétitif dans cet espace », assure Kevin Petrie. « DBT Assist est en version bêta, ce qui témoigne d’une certaine prudence. De nombreux fournisseurs prennent le temps d’assimiler les commentaires des utilisateurs sur ces fonctionnalités avant de les rendre [généralement disponibles]. »
En plus de DBT Assist, les nouvelles fonctionnalités de gouvernance, de gestion des métadonnées et d’expérience de développement low-code sont des ajouts significatifs à la plateforme de l’éditeur, selon Doug Henschen, analyste de Constellation Research.
Ces fonctions intégrées à la couche sémantique de DBT incluent des contrôles d’accès et des permissions granulaires, des connexions avec Tableau et Google Sheets, et des améliorations de MetricFlow. D’après l’éditeur, MetricFlow aide les usagers à développer et à consommer des métriques complexes avec plus de rapidité et de précision. Tous ces éléments – à l’exception des contrôles d’accès et des autorisations qui seront bientôt disponibles en préversion – sont entrés en disponibilité générale.
Dans DBT Explorer, les capacités de gestion de métadonnées présentées cette semaine affinent les capacités de traçabilité des données, améliorent le contrôle des performances des algorithmes et des LLM, et rapportent des informations sur la qualité des données intégrées dans les outils d’analytiques pour s’assurer que les données sont fiables. Tous ces éléments feront bientôt l’objet d’un bêta test.
L’expérience de développement « low-code », actuellement en phase de bêta test, inclut un éditeur visuel en « glisser-déposer » qui génère lui-même du code SQL, permettant aux habitués des outils ETL concurrents et aux néophytes de collaborer avec les ingénieurs de données.
Doug HenschenAnalyste, Constellation Research
« Tous les éditeurs présentent des assistants GenAI, de sorte que DBT Assist me semble moins important que la combinaison des mises à jour consacrées à la gouvernance, la gestion des métadonnées, et à la démocratisation de ses outils », remarque M. Henschen.
Kevin Petrie insiste également sur les améliorations apportées à la couche sémantique de DBT Labs. Leur existence démontrerait que DBT Labs se développe au-delà de son périmètre d’origine.
« Les améliorations apportées à la couche sémantique renforcent aussi la position concurrentielle de DBT. De nombreuses entreprises luttent pour que les consommateurs de jeu de données distribués soient sur la même longueur d’onde », observe-t-il.
Ce faisant, l’éditeur marche sur les plates-bandes d’acteurs bien en place, selon Doug Henschen. « DBT Labs est l’un de ces éditeurs qui ont su gagner l’adhésion et une base de fans fidèles parmi les professionnels de l’IT », déclare-t-il. « À partir de cette base solide, DBT Labs se développe maintenant dans des domaines adjacents qui conviennent naturellement à ses clients, mais où d’autres solutions sont déjà disponibles et en place. Il sera intéressant de voir jusqu’où il peut aller ».
Simplifier l’expérience des développeurs
Parmi les autres nouvelles fonctionnalités, citons :
- Advanced CI, une vue qui permet aux équipes de visualiser et de vérifier les changements apportés à la base de code pendant le développement de pipeline de données, pour s’assurer qu’ils répondent aux normes de qualité avant d’être mis en production ; la bêta sera bientôt disponible.
- Unit Testing, une fonctionnalité en disponibilité générale qui améliore la couverture des tests pendant le développement sans augmenter les coûts en validant la logique du modèle de données plus tôt que ce n’était le cas, auparavant.
- DBT Cloud CLI, un outil en disponibilité générale qui offre aux développeurs la possibilité de contribuer à des projets dans DBT Cloud à travers l’IDE de leur choix, plutôt que de les forcer à développer dans l’environnement de DBT.
- La disponibilité de DBT Cloud sur Microsoft Azure, avec une bêta à venir, ainsi que des intégrations avec Azure Synapse, en préversion, et Microsoft Fabric (GA).
- L’exposition automatique, une fonctionnalité qui sera bientôt en version bêta et qui permet aux utilisateurs d’automatiser et de tracer le cheminement des données de bout en bout entre les tableaux de bord Tableau et les modèles DBT, afin d’aider les utilisateurs à se fier aux données qui alimentent leurs visualisations.
- La disponibilité générale de DBT Mesh, une fonctionnalité qui permet aux entreprises de gérer des projets interconnectés à travers des domaines plutôt que de devoir gérer tous les projets de manière centralisée.
Bien que chacune des nouvelles fonctionnalités réponde à des besoins différents des utilisateurs, dans l’ensemble, elles doivent permettre aux clients de DBT Labs de développer efficacement des pipelines de données, rappelle Kevin Petrie.
C’est important, car les pipelines de données alimentent les applications d’analytique et d’IA.
« L’étude BARC montre que le premier critère de réussite des entreprises en matière d’IA est la rapidité et la précision des informations, qui dépendent directement de l’efficacité des pipelines de données », signale M. Petrie. « Les améliorations apportées par DBT aident les entreprises à répondre aux exigences de plus en plus rigoureuses des initiatives d’analyse, en particulier celles qui impliquent l’IA ».
IA générative et gouvernance de données font bon ménage, selon DBT Labs
« Nous sommes à l’écoute des commentaires de nos clients, mais nous avons également observé qu’ils accordent de plus en plus d’importance à l’alignement des données dans l’ensemble de leurs entreprises », affirme de son côté Luis Maldonado, vice-président des produits chez DBT Labs, en évoquant les mises à jour de la couche sémantique de DBT. « L’étape suivante consiste à faciliter la connexion et la collaboration autour des données pour les parties prenantes ayant des aptitudes techniques diverses ».
DBT Labs prévoit tout de même une série de mises à jour consacrée à l’IA générative, l’une des priorités de l’éditeur, selon Louis Maldonado.
Dans une étude récente menée par l’éditeur, un tiers des personnes interrogées ont déclaré qu’elles utilisaient actuellement l’IA générative. Cependant, plus de la moitié d’entre elles prévoient de le faire bientôt. Pour répondre aux besoins des clients qui souhaitent ajouter ou étendre leur usage de la GenAI, la feuille de route de DBT Labs mentionne des fonctions de transformation des données pour alimenter des outils tels que des assistants conversationnels entraînés sur les données internes des clients.
« De nombreux clients souhaitent… pouvoir poser des questions sur leurs données internes à l’aide de LLM, mais reconnaissent le risque opérationnel d’alimenter les réponses avec des données inexactes », explique M. Maldonado. « Nous nous engageons à veiller à ce que les données qui alimentent ces modèles soient exactes et fiables. »
Doug Henschen, quant à lui, pense que DBT Assist n’a pas assez évolué par rapport aux solutions concurrentes.
« Je pense que [DBT Labs] va dans la bonne direction sur de nombreux fronts, mais les fonctionnalités de DBT Assist sont plutôt limitées », avance l’analyste de Constellation Research Henschen. « Davantage d’assistants ou un assistant unique plus polyvalent aideraient l’entreprise à soutenir une base plus large d’utilisateurs ».