Africa Studio - stock.adobe.com

DbaaS : DataStax met Cassandra au régime serverless

DataStax change le mode de fonctionnement de son DBaaS, offrant aux utilisateurs un moyen d’augmenter et de diminuer plus facilement les ressources IT dont ils ont besoin, ainsi que de ne payer que pour celles qui sont réellement consommées.

DataStax a indiqué que sa plateforme de base de données dans le cloud bénéficiera d’une mise à jour majeure, en disponibilité générale le 4 mars 2021.

Astra, la DBaaS en question, est accessible depuis mai 2020. Pour rappel, il s’agit d’une version managée d’Apache Cassandra. La société californienne a accordé le SGBD NoSQL à Kubernetes, mais il souhaite aller plus loin.

Jusqu’à présent, le déploiement d’Astra demandait aux utilisateurs de sélectionner le bon niveau d’approvisionnement. Suivant cette approche, il faut configurer une certaine quantité de ressources de calcul et de stockage. Ce ne sera plus nécessaire : l’éditeur a choisi d’adopter une architecture serverless afin de simplifier ces opérations en fonction des besoins des usagers.

« Le serverless va devenir une tendance forte sur le marché des bases de données ».
Carl OlofsonAnalyste, IDC

L’idée d’une base de données serverless devrait séduire de nombreuses organisations, estime Carl Olofson, analyste chez IDC.

« Je pense que cela gagnera en importance à mesure que les gens seront plus sensibles aux nuances des modèles “pay-as you-go” et “pay-as-you-grow” lorsque, dans de nombreux cas, les factures augmentent, mais ne baissent pas », anticipe Carl Olofson. « Le serverless va devenir une tendance forte sur le marché des bases de données ».

En la matière, AWS a déjà sauté le pas avec Aurora Serverless et sa TSDB Amazon TimeStream. Surtout, il fournit Amazon KeySpaces, un service serverless « compatible avec Apache Cassandra » pour en faciliter la gestion. Google Cloud administre également deux DBaaS NoSQL sans serveur : Google Firebase et Google Cloud DataStore. Dès le lancement d’Astra, DataStax avait prévu une fonctionnalité de ce type, selon les propos de Matt Kennedy, Senior Director, Cloud Solutions chez DataStax, interrogé par LeMagIT.

Une option serverless pour les clients existants

Se pose tout de même la question pour les clients existants d’Astra. Ed Anuff, directeur produit chez DataStax, explique que les bases de données des nouveaux utilisateurs seront approvisionnées via le modèle serverless.

Pour les usagers actuels de DataStax Astra, qu’Ed Anuff a qualifiée de plateforme « classique », les clients auront une option de mise à jour pour adopter l’approche prochainement accessible.

« D’un point de vue opérationnel, vous ne souhaitez pas faire de changements sous les yeux de quelqu’un sans qu’il le sache », déclare le responsable. « Mais nous pensons que la plupart des utilisateurs voudront migrer, car les économies réalisables sont assez importantes ».

Un mode de facturation en principe plus avantageux

Avec l’édition classique, ainsi qu’avec la distribution open source de Cassandra, les administrateurs doivent définir une certaine quantité de calcul et de stockage pour un déploiement. Traditionnellement, le SGBD NoSQL a besoin d’un cluster composé de trois nœuds pour démarrer.

Au fur et à mesure que l’usage de Cassandra prend de l’ampleur, un utilisateur peut ajouter des ressources supplémentaires pour supporter les clusters, les nœuds et leur réplication. Le vrai défi, cependant, c’est que par défaut la base de données ne disposait pas de la capacité de réduire la taille du déploiement quand la charge diminuait. C’est un problème bien connu des entreprises de la grande distribution qui emploient Cassandra à large échelle.

Habituellement, « les retailers déterminent leur besoin en ressources suivant le pic d’affluence maximum estimé sur leurs sites web, ce qui peut correspondre à une période de vacances ou de soldes, par exemple », indique Ed Anuff. « Cela signifie donc que 90 % du temps, vous disposez de bien plus de capacités que vos besoins réels ».

Le modèle serverless couplé à une facturation à la consommation doit résoudre ce problème.

Kubernetes aide à activer le modèle serverless de DataStax

DataStax s’est employé, ces derniers mois, à optimiser le déploiement et les processus de Cassandra avec Kubernetes notamment en développant l’opérateur custom K8ssandra.

Kubernetes permet d’augmenter et de réduire les capacités de calcul en fonction des besoins. C’est une partie essentielle de la plateforme serverless, mais ce n’est pas la seule, considère le directeur produit.

Ed Anuff évoque un autre élément clé de la mise en place du mode serverless.

« Ce que nous avons fait, c’est prendre Cassandra et nous avons réorganisé la couche de stockage pour la séparer des nœuds de calcul », affirme-t-il. « Le travail que nous avons fait pour adapter Cassandra à Kubernetes a été en grande partie rendu possible par l’adoption du FaaS, mais c’est aussi cette séparation des ressources qui nous permet de l’appliquer ».

Ainsi, l’éditeur espère résoudre enfin la complexité de gestion de Cassandra à large échelle, tout en promettant de réduire de 3 à 5 fois le coût total de possession du SGBD.

Pour approfondir sur Base de données