Definition

HBase

Apache HBase est un Data Store orienté colonnes utilisant des paires clé/valeur. Il est conçu pour s'exécuter sur le système de fichiers HDFS (Hadoop Distributed File System). Hadoop est une infrastructure qui permet de gérer des ensembles de données volumineux dans un environnement informatique distribué.

HBase est conçu pour prendre en charge des rythmes élevés de mise à jour des tables, et pour évoluer horizontalement (par scale-out) dans des clusters informatiques distribués. L'approche de ce dépot de données centrée sur l'évolutivité lui permet de prendre en charge des tables de base de données extrêmement volumineuses, par exemple, des tables contenant des milliards de lignes et des millions de colonnes. Actuellement, l'une des principales utilisations de HBase est celle de gestionnaire de données structurées pour l'infrastructure de messagerie de base de Facebook.

HBase est connu pour assurer une grande cohérence des données au cours des opérations de lecture et d'écriture, ce qui le distingue des autres bases de données NoSQL. Aspect important de l'architecture de HBase, à l'instar d'Hadoop, elle fait appel à des noeuds maîtres pour administrer des serveurs régionaux qui distribuent et traitent des parties de tables de données.

HBase figure sur la longue liste des composants additionnels d'Apache Hadoop, au même titre que des outils tels que Hive, Pig, Spark et ZooKeeper. Comme Hadoop, HBase se programme typiquement avec Java, et non SQL.

HBase est un projet open source dont le développement est géré par l'Apache Software Foundation. En 2010, HBase est devenu un projet Apache de premier plan.

Cette définition a été mise à jour en mars 2016

Pour approfondir sur Big Data et Data lake