CrazyCloud - Fotolia

Avec RecoverX, Datos.io propose une solution de sauvegarde pour les bases NoSQL

Datos.io, une start-up basée à San José, a développé une solution de protection de données spécifiquement conçue pour la sauvegarde et la restauration des données stockées dans les bases de données NoSQL comme Cassandra et MongoDB.

Datos.io, une start-up californienne basée à San José, a récemment dévoilé la version 1.5 de sa plate-forme RecoverX, dont la première mouture avait fait une première apparition discrète au mois de juin 2016. La société, qui a levé 15 M$ (pour l’essentiel auprès de lightspeed ventures) a développé la première solution au monde, conçue pour la protection des données stockées dans les bases de données NoSQL distribuées comme Cassandra ou MongoDB.

Protéger les données des bases de données NoSQL distribuées

RecoverX est une solution de backup distribuée qui permet de gérer, protéger et restaurer les données stockées dans ces bases de données, qu’elles soient utilisées en local ou déployées dans des clouds publics.

Comme l’explique la firme, les bases de données comme Cassandra, DataStax DSE et MongoDB sont conçues pour assurer une haute disponibilité des données, mais elles ne protègent pas les données contre une erreur humaine, contre une éventuelle corruption ou contre des attaques malveillantes. Il est donc tout aussi nécessaire de protéger le contenu de ses bases que sur les SGBD traditionnels.

La principale difficulté pour protéger ces bases NoSQL est leur nature distribuée, qui a contraint Datos.io à concevoir un moteur  de sauvegarde scale-out baptisé CODR (Consistent Orchestrated Distributed Recovery). Ce moteur permet de protéger les données des bases NoSQL et de restaurer leurs données à n’importe quel point dans le temps avec RTO de l’ordre de 15mn. Afin d’optimiser les besoins de stockage, RecoverX met en œuvre un algorithme de déduplication de données sophistiqué optimisé pour chacune des applications supportées.

Architecture typique d'un déploiement de RecoverX (cliquer pour agrandir)

Plusieurs options de restauration sont proposées par le logiciel. L’option dite Basic recovery permet de restaurer les données à l’identique sur le cluster de production. L’option dite Orchestrated recovery permet de restaurer les données sur un cluster différent du cluster source.

Une feuille de route bien garnie pour 2017

Actuellement en version 1.5, RecoverX se concentre pour l’instant sur les tâches de sauvegarde et de restauration des bases Cassandra et MongoDB, mais les ambitions de l’éditeur sont d’ajouter progressivement des fonctions avancées de gestion de données à sa plate-forme. La prochaine mouture, attendue en 2017, devrait dans un premier temps apporter le support de plus de bases comme HBase mais aussi celui des SGBD traditionnels (MySQL, SQL Server et Oracle). Elle permettra aussi d’effectuer des requêtes sur les sauvegardes pour ne restaurer qu’une partie des données. Selon Datos.io, il sera également possible de cloner une base vers le cloud et de masquer certaines données (cartes bancaires, numéros de sécurité sociale…) pour les applications de test et de développement.

RecoverX est proposé sous la forme d’une licence avec abonnement annuel et est facturé en fonction de la quantité de données protégées. La solution est actuellement utilisée par 10 grands clients américains et plus d’une quarantaine sont en phase d’évaluation du logiciel.

 

Pour approfondir sur Backup