Anatoly Stojko - stock.adobe.com

InfluxDB Clustered : InfluxDB 3.0 débarque sur site

InfluxData a présenté mercredi InfluxDB Clustered, une version self-managed de sa base de données time series. Il complète ainsi sa gamme d’offres établie sur la nouvelle mouture d’InfluxDB propulsée par l’écosystème Apache Arrow.

InfluxDB Clustered, conçue pour les déploiements sur site et en cloud privé, complète la gamme de produits d’InfluxData établi sur InfluxDB 3.0.

Dévoilée pour la première fois en avril 2023, InfluxDB 3.0 est une version remaniée de la base de données de séries temporelles d’InfluxData. Celle-ci doit considérablement améliorer l’ingestion, le stockage et le traitement des séries chronologiques, assure l’éditeur.

InfluxDB Clustered doit, à terme, remplacer InfluxDB Enterprise, la plateforme jusqu’alors déployée par les clients d’InfluxData sur site et dans des instances de cloud privé.

Outre InfluxDB Clustered, la gamme de produits 3.0 de l’éditeur comprend InfluxDB Cloud Serverless, pour traiter de petites charges de travail, et InfluxDB Cloud Dedicated, un service cloud dédié aux entreprises ayant des besoins plus importants. Il s’agit dans les deux cas d’options entièrement gérées (managées), d’ores et déjà disponibles.

Pour rappel, l’éditeur californien avait lancé la version 3.0 de sa base de données peu après avoir récolté 81 millions de dollars lors d’une série E conclue en février. Cette mouture n’est toujours pas disponible dans sa déclinaison open source, contrairement au projet iOx dont elle est issue.

InfluxDB 3.0 : des atouts indéniables, selon les analystes

Selon Rachel Stephens, analyste chez RedMonk, InfluxDB 3.0 est plus simple et plus polyvalente que les itérations précédentes d’InfluxDB.

Selon elle, l’un des principaux avantages de cette mouture concerne l’accélération substantielle des requêtes sur les données à cardinalité élevée.

Pour rappel, la cardinalité des séries chronologiques fait référence au nombre de valeurs uniques contenues dans une colonne d’une TSDB. « Plus il y a de séries uniques dans vos données, moins votre base de données est performante », constate l’éditeur concernant InfluxDB 1.x et 2.x.

En outre, Rachel Stephens note que la prise en charge du langage SQL par InfluxDB 3.0 ouvre des portes à l’éditeur à un plus large éventail d’utilisateurs. Pour rappel, InfluxData ne fournissait jusqu’alors que son langage spécifique et propriétaire, FluxQL.

Au-delà de la prise en charge du langage SQL et de l’accélération des requêtes sur les données à forte cardinalité, reste à savoir ce qu’apporte InfluxDB Clustered aux clients existants.

Là encore, l’éditeur promet des ingestions de données accélérées et des coûts de stockage réduits grâce à la compression des données, à la prise en charge des systèmes de stockage objet et à la séparation du calcul et du stockage.

Par ailleurs, InfluxData vante la possibilité de chiffrer les données en transit et au repos.

Selon Carl Olofson, analyste chez IDC, l’ensemble de ces fonctionnalités constitue des ajouts importants pour tenter d’attirer davantage de clients grand compte.

« Ces fonctionnalités font d’InfluxDB un produit plus adapté aux entreprises, notamment en ce qui concerne la prise en charge d’une plus grande cardinalité, des temps de chargement plus rapides et des coûts de stockage réduits, autant de facteurs critiques pour leur segment de marché », assure-t-il. « La sécurité est également au cœur des préoccupations de la plupart des entreprises, et il est donc essentiel de s’attaquer à ces questions ».

InfluxDB sur site : une exigence des clients traitant des données sensibles

Ce serait d’ailleurs la raison principale pour laquelle les clients de l’éditeur déploieraient des offres sur site, selon Rick Spencer, vice-président responsable des produits chez InfluxData.

« Les déploiements sur site et sur des instances de cloud privé ne garantissent pas une plus grande sécurité des données, mais ils réduisent leur exposition à certains types d’attaques ».
Rick spencerVP of product, Influxdata

« Les entreprises qui collectent des données sensibles ont besoin de savoir que ces actifs sont sécurisés », déclare-t-il. « Les déploiements sur site et sur des instances de cloud privé ne garantissent pas une plus grande sécurité des données, mais ils réduisent leur exposition à certains types d’attaques ».

« De même, ils permettent aux entreprises de rester plus facilement en conformité avec les réglementations, de contrôler les coûts et de conserver leurs données près de leur source », poursuit Rick Spencer.

C’est aussi un moyen de se distinguer de ses coopétiteurs, dont AWS, Microsoft et Google qui fournissent, eux aussi, une ou plusieurs TSDB entièrement managées. InfluxData veut par ailleurs se différencier des autres acteurs comme Hazelcast, Timescale, de Grafana et des distributeurs de Prometheus comme Aiven.

Des modalités de déploiement à préciser

Reste à éclaircir les modalités d’achat et de déploiement. Le coût de la licence d’InfluxDB Clustered dépend de la quantité de CPU et de RAM associé à la configuration. Pour le moment, l’éditeur ne présente pas d’architecture hardware, ni de configurations minimales et recommandées. Concernant le choix de l’équipementier, InfluxData entend laisser ses clients décider.

Les instructions d’installation ne sont pas encore totalement disponibles. L’éditeur s’attelle à détailler, pour l’heure, les fonctions de base de son SGBD et l’architecture logique.

Pour rappel, InfluxDB 3.0 repose sur un object store de type S3 et l’implémentation de la technologie orientée colonnes Apache Arrow, du framework de plannning de requêtes in-memory DataFusion en sus de Flight et de gRPC pour requêter les données en SQL, ainsi que du format de fichiers Parquet. Comme toute TSDB, InfluxDB met en cache les données dans la mémoire vive avant de les stocker sur un espace persistant.

Pour le moment, un groupe limité de clients peuvent déployer InfluxDB Clustered.

InfluxData doit simplifier les déploiements

Néanmoins, les clients auraient désormais la possibilité de déployer InfluxDB 3.0 comme bon leur semble, juge Rick Spencer.

Le responsable évoque pour la suite la nécessité d’ajouter des fonctionnalités réclamées par les entreprises en matière d’exécution des requêtes et d’exploitation des données.

L’éditeur doit également simplifier les déploiements, probablement en ajoutant une option de déploiement « en un clic ».

Carl Olfoson, quant à lui, suggère que InfluxData pourrait améliorer son SGBD en facilitant l’analyse de données géographiques et en optimisant l’analyse des données temps réel.

« Il serait intéressant de pouvoir réaliser l’analyse interrégionale des distributions géographiques et la comparaison des événements en temps réel », suggère l’analyste d’IDC.

Pour approfondir sur Base de données