Sergey Nivens - Fotolia
MariaDB mise sur InfiniDB pour attaquer le Big Data
MariaDB crée ColumnStore, un fork d’InfiniDB pour se positionner sur le marché du Big Data. Il sera le moteur analytique et Big Data de MariaDB.
MariaDB a décidé d’épingler officiellement la gestion des Big Data à sa feuille de route. La société qui développe la base de données Open Source éponyme, a levé le voile sur un moteur de stockage en colonne qui projette la base de données sur les terres de la gestion des données en gros volume. Sobrement intitulé MariaDB ColumnStore, ce moteur formera le second moteur de l’appareil MariaDB, qui devient une plateforme unique pour gérer analytique et transactionnel, supportant SQL et ACID. Une base hybride dont la vocation est une nouvelle fois de jeter une pierre dans le jardin d’Oracle.
Il faut noter que ce lancement suit une étape clé dans la vie de MariaDB. Début 2015, la société a restructuré son socle autour de son fondateur Monty Widenius, qui a repris les rênes technologiques de la solution au poste de CTO. Cela a été accompagné d’une levée de fonds de 9 millions de dollars et de la nomination d’un nouveau CEO Michael Howard. C’est dans ce contexte de relance que s’inscrit la présentation de ce second moteur taillé pour le Big Data dont la mise à disposition en bêta est prévue pour mai prochain.
MariaDB avait certes gravi les échelons, en préparant la base pour le clustering ou le dimensionnent des données (MaxScale). La gestion des données en volume, propre à des scenarii de Big Data, n’était pas formellement inscrite dans le marbre.
Un fork d'InfiniDB
Autre point à noter : L’arrivée de ColumnStore marque l’intégration concrète du moteur Open Source InfiniDB, suite à la reprise du projet par MariaDB (à l’époque SkySQL), après la banqueroute de la société InfiniDB (ex Calpont). Comme l’indique le site du projet, le moteur avait été placé sur GitHub, et SkySQL avait alors recruté les ressources du projet et formalisé une offre de support. Il faut dire que MariaDB était déjà partenaire d’InfiniDB - InfiniDB se connecte au dessus de MySQL ; MariaDB est entièrement compatible MySQL.
MariaDB ColumnStore reprend donc les caractéristiques d’InfiniDB (il en est un fork) auxquels ont été ajoutés des développements de la communauté. Il s’agit donc un moteur en colonne distribué et massivement parallèle reposant sur MariaDB 10.1, explique la société sur son site. Il autorise des requêtes multi-threadées. Ce moteur a la capacité de streamer des données à un rythme de 30 millions de ligne par minute.
Enfin autre atout dans sa manche, une intégration étroite à HDFS, et donc – là est un point clé – la possibilité d’effectuer des requêtes SQL sur Hadoop (on parle dans ce cas de SQL-On-Hadoop). MariaDB y voit des cas d’usages liés à la fois au temps réel, batch, et algorithmique.