Petya Petrova - Fotolia
Confluent veut améliorer la qualité et la sécurité des données dans Kafka
Après avoir mis à jour la version open source de Kafka en 2.4 en décembre dernier, Confluent apporte des changements à sa plateforme de streaming pour faciliter la gestion des données.
Le contributeur principal de la technologie open source Apache Kafka a amélioré les capacités de son produit commercial afin de le rendre plus robuste et sécurisé.
La version 5.4 de la plateforme Confluent est en disponibilité générale depuis le mercredi 22 janvier 2020. Elle bénéficie de modifications d’abord disponibles dans Kafka 2.4, une version accessible depuis le 18 décembre 2019.
L’éditeur ne s’est pas contenté d’ajouter les nouveautés de l’outil open source. Confluent Platform 5.4 dispose maintenant d’un système sécurisé de contrôle d’accès basé sur les rôles (RBAC), d’une meilleure reprise après sinistre (introduite dans la version 5.0) et d’une validation des schémas pour améliorer la qualité des données.
« Confluent est en bonne voie pour améliorer la gestion et l’utilisation de Kafka », déclare Maureen Fleming, analyste chez IDC.
La mise à jour 5.4 introduit également le support pour CloudEvents. À l’instar d’OpenAPI pour les API, il s’agit d’une spécification open source qui décrit les données issues d’événements. L’analyste d’IDC explique que les améliorations des logs d’audits et la prise en charge de la spécification CloudEvents fournissent des mécanismes permettant une surveillance et une utilisation avancée des algorithmes de détection d’anomalies de sécurité.
« Le perfectionnement des logs permet également de répondre aux exigences réglementaires auxquelles sont soumis les clients de Confluent », affirme Maureen Fleming.
Sécuriser les données tirées d’événements
Le RBAC est un mécanisme de sécurité voulu comme essentiel par Confluent. Il peut être utilisé pour garantir que seuls les utilisateurs autorisés ont accès à un service donné. Addison Huddy, responsable produit chez Confluent remarque que la plateforme s’intégrait auparavant avec des systèmes de sécurité comme des services d’annuaires, notamment Microsoft ActiveDirectory. Addison Huddy assure que le nouveau RBAC offre davantage de contrôle.
« Ce que fait le contrôle d’accès basé sur les rôles, c’est qu’il vous permet de prendre les groupes que vous avez déjà définis dans Active Directory, et de les lier à des rôles que nous avons définis dans le système », explique le responsable produit.
Confluent Platform 5.4 possède un composant qui permet aux administrateurs de définir des rôles et de faire appliquer des politiques sur ces rôles dans toute la plateforme, a-t-il ajouté.
Valider les schémas de données
Le Confluent Schema Registry est un espace centralisé où les équipes peuvent télécharger leurs schémas de données. « La plateforme Kafka compte généralement plus d’utilisateurs qui lisent et consomment les données d’un flux d’événements que d’utilisateurs qui écrivent des données », note Addisson Huddy.
« Donc maintenant, si j’écris une application, je n’ai pas à demander le format de sérialisation pour me connecter à un consommateur de données », dit le responsable produit. « Je peux atteindre directement le registre des schémas pour récupérer ces informations ».
« L’introduction du Confluent Schema Registry est en adéquation avec les efforts des entreprises pour s’assurer de la fiabilité de leurs informations », assure Maureen Fleming.
Pour aller plus loin, le registre de schémas peut également être utilisé pour aider à renforcer la qualité des données, en n’acceptant que les informations qui respectent des modèles prédéfinis dans l’espace centralisé.
KsqlDB disponible en préversion
Confluent Platform 5.4 comporte également une préversion de ksqlDB, une base de données spécialement conçue pour l’event streaming. Celle-ci est disponible en tant que projet open source depuis le 20 novembre 2019.
« L’un des objectifs principaux des clients de Confluent est de créer des applications basées sur le streaming d’événements », assure Praveen Rangnath, directeur général marketing produit, chez Confluent. « Sans ksqlDB, construire ce type d’applications est un processus beaucoup plus complexe qui implique de rassembler plusieurs systèmes distribués ».
« Ce que nous essayons de faire avec ksqlDB consiste essentiellement à intégrer ces systèmes dans une solution unique pour faciliter le travail des développeurs », conclut Praveen Rangnath.