Tom Wang - Fotolia
L’essentiel sur Apache Cassandra
LeMagIT fait le point sur les principales bases de données du marché. Aujourd’hui le SGBD NoSQL open source Apache Cassandra.
Apache Cassandra est un SGBD NoSQL clé-valeur open source distribué. Initialement développée par Facebook, l’application a ensuite été publiée en tant que projet open source. Une distribution intégrée gratuite d’Apache Cassandra – DataStax Community Edition – et une édition commerciale d’Apache Cassandra sont également disponibles sur DataStax.
Apache Cassandra a été créé pour les applications en ligne exigeant des performances rapides sans temps d’interruption. Ce système de base de données clé-valeur excelle lorsque la plupart des accès, voire tous, ont pour objet la recherche de données d’après une valeur de clé primaire. Il a été pensé pour gérer de très grands volumes de données réparties sur des serveurs basiques, avec une disponibilité élevée et sans point de défaillance.
Disponible pour les systèmes d’exploitation Linux, Windows et Mac OS X, Apache Cassandra est un logiciel open source en téléchargement libre.
Fonctionnalités d’Apache Cassandra
La dernière version d’Apache Cassandra, 2.1.6, offre plusieurs améliorations concernant la stabilité et un certain nombre de corrections de bogues. Le téléchargement et l’installation du package configurent Apache Cassandra pour une exécution sur un seul nœud. Bien que cette configuration soit prise en charge, Apache Cassandra est plus souvent exécuté en tant que cluster multinoeud, ce qui exige une configuration supplémentaire que les fichiers de configuration de Cassandra permettent.
DataStax Enterprise, la version entreprise d’Apache Cassandra, s’appuie sur Cassandra et fournit des fonctionnalités supplémentaires telles que la recherche, l’analytique et les performances. DataStax Enterprise, tout comme Apache Cassandra, est conçu pour les applications en ligne qui ont besoin d’une vitesse et d’une disponibilité élevées, mais propose en outre des fonctionnalités de développement et de gestion d’entreprise.
Licences Apache Cassandra
Les abonnements à DataStax Enterprise sont ouverts aux environnements de production et hors production. Tous deux incluent les logiciels certifiés et l’assistance DataStax.
DataStax Enterprise est utilisable gratuitement dans les environnements de développement. L’exécution du produit nécessite l’achat d’une licence ou l’inscription au programme de démarrage.
Le programme DataStax Start-up est ouvert aux startups réalisant moins de 2 millions de dollars de bénéfices annuels et moins de 20 millions de dollars de mobilisation de fonds. Il permet d’utiliser DataStax Enterprise gratuitement et de façon illimitée. Le nombre de nœuds n’est pas limité et il n’existe pas de restrictions cachées. Les services d’assistance de DataStax incluent des accords de niveau de service 24/7/365, des Service Packs certifiés qui assurent l’actualisation continue du logiciel, et la prise en charge des correctifs pour la maintenance d’urgence.
DataStax n’est pas la seule option d’assistance commerciale pour Apache Cassandra : d’autres entreprises assurent des services de support.
Types de données Apache Cassandra
Le SGBD NoSQL Apache Cassandra prend en charge les types de données les plus courants : ASCII, bigint, BLOB, valeurs booléennes, données de compteurs, nombres décimaux, double, virgule flottante, int, texte, horodatage, UUID, VARCHAR et varint.
TNotre Dossier sur les bases NoSQLe
Le modèle de données de Cassandra propose des index en colonne, des mises à jour structurées en journaux, une prise en charge renforcée des vues de dénormalisation et matérialisées, ainsi que la mise en cache intégrée.
L’accès aux données est réalisé à l’aide du langage de requête Cassandra Query Language (CQL), proche de SQL.
Tests d’évaluation des performances Apache Cassandra
Les ingénieurs de l’université de Toronto ont réalisé des tests de performance en 2012 sur les moteurs de base de données NoSQL. Leurs conclusions indiquent que « le débit de Cassandra domine dans tous les tests, mais [que] sa latence est particulièrement élevée dans tous ces tests ».