Cassandra : la version managée d'AWS interroge la concurrence
Les distributeurs de la base de données NoSQL Open Source Cassandra expriment leurs inquiétudes sur l’arrivée d’AWS sur ce marché avec une version managée dans le cloud.
Amazon Web Services a récemment dévoilé une offre managée pour Cassandra (Amazon Managed Apache Cassandra Service ou AMCS). Elle n’est pas passée inaperçue auprès des concurrents.
« L’annonce d’AWS valide encore une fois la portée et l'importance croissante de Cassandra », déclare Jonathan Ellis, cofondateur et CTO de DataStax, l’un des distributeurs les plus en vogue de cette technologie. Il ajoute que beaucoup d’entreprises dans tous les secteurs d’activité ont largement bénéficié de l’utilisation de la base de données. Celle-ci serait conçue pour répondre aux besoins des déploiements hybrides et multicloud.
Comme tout projet Open Source, plusieurs éditeurs le proposent dans une version managée. Selon Donald Feinberg, vice-président et analyste distingué chez Gartner, AWS propose le catalogue le plus complet de services de base de données managés dans le cloud (SGBD). L’analyste considère que seule Cassandra manquait au portfolio d’AWS avant l’annonce effectuée lors de Re:Invent.
« Non seulement, ils [AWS] ont ajouté Cassandra, mais c’est surtout la seule version disponible dans le cloud en mode serverless », affirme Gartner. « Le serverless permet d’éviter l’obstacle posé par la gestion d’un environnement composé de nombreux clusters ».
Des débats concernant l’architecture
Instaclustr fournit une version hébergée et managée de Cassandra « as a service ». Ben Slater, le Chief Product Officer de cette société voit lui aussi l’arrivée d’AWS sur ce marché comme une forme de confirmation. En conséquence, il s’attend à voir une croissance et un intérêt continus pour les offres d’Instaclustr. En revanche, selon lui, la solution du géant du cloud ne repose pas véritablement sur le code open source d’Apache Cassandra.
« C’est une version propriétaire d’une portion de code d’Apache Cassandra qui agit comme une couche de traduction/transition sur DynamoDB. Le service est partiellement compatible avec la database open source », déclare Ben Slater.
AWS réfute cette déclaration. Selon Herain Oberoi, Directeur général marketing base de données, analytique et blockchain, le service utilise bien le code source disponible sous la licence Apache 2.0.
« Nous avons modifié Apache Cassandra afin de proposer une offre hautement évolutive, serverless et entièrement gérée », défend-il.
Herain Oberoi explique qu'AWS a construit DynamoDB de sa propre initiative pour fournir à ses clients un service de base de données NoSQL rapide et évolutif. Il affirme que, lorsque son employeur a conçu AMCS, les clients réclamaient un service compatible avec Cassandra disposant des mêmes qualités, « mais les deux sont différents », assure-t-il.
L’approche serverless, un sérieux coup de pouce pour Cassandra
ScyllaDB, un autre éditeur, a récemment mis à jour sa base de données open source afin d’en améliorer les performances. Celle-ci est compatible avec Apache Cassandra.
Dor Laor, PDG de ScyllaDB, souligne lui aussi que l’approche serverless est la partie la plus intéressante d’AMCS.
« L’utilisateur n’a pas besoin de provisionner de serveurs et il est possible de créer des tables immédiatement », affirme-t-il. « Les forces de l’offre d’AWS sont l’approche « as a service » et la facilité d’utilisation et je suis sûr que les utilisateurs qui subissent la complexité de Cassandra vont l’apprécier ».
Même si elle peut faire de l’ombre à ScyllaDB, Dor Laor voit d’un bon œil la solution d’AWS. Il s’attend à ce que le prix et les performances offertes par ScyllaDB attirent de nouveaux clients parce que le géant du cloud a semble-t-il réussi à simplifier la gestion de Cassandra pour les clients.
Le PDG anticipe cependant que le nouveau service d’AWS provoquera un bon nombre de défis techniques, tels que la compatibilité avec les déploiements existants de Cassandra.
« Sans surprise, AWS veut faire passer les utilisateurs de Cassandra vers sa version managée, cependant plusieurs fonctionnalités clés sont absentes – le multi-région, la modélisation, des limitations de taille d’objet, etc. », avance-t-il. « Evidemment, ces problèmes peuvent être résolus avec le temps ».
AWS confirme le fait que la préversion d’Amazon Managed Cassandra Service ne dispose pas de toutes les fonctionnalités attendues. Elles seront ajoutées au fur et à mesure des mises à jour, selon Herain Oberoi. Toutefois, le responsable affirme que les clients peuvent déjà utiliser le service sans modifier grandement le code de leurs applications existantes.
« Au cours de l’aperçu et au moment de la disponibilité générale, nous continuerons d’ajouter des fonctionnalités à AMCS qui aideront les clients à exécuter des workloads en production, telles que le support des réplications multi régions, assure le directeur général.
« Nous avons conçu cette offre pour fournir des performances de l’ordre de la milliseconde à n’importe quelle échelle. Par conséquent, nous avons pris la décision de ne pas supporter les fonctionnalités expérimentales ou spécifiques que les utilisateurs ne considèrent pas stables, vraiment utiles ou faciles à déployer. Cela inclut la modélisation, les fonctions d'agrégations et les tables compteurs ».