kovaleff - Fotolia
Cloudera Operational Database : Cloudera déploie HBase à la demande
Cloudera a annoncé la disponibilité générale de Cloudera Operational Database sur Microsoft Azure et sur AWS. La dbPaaS élastique basée sur HBase doit à la fois prendre en charge les besoins opérationnels et analytiques sans sortir de l’écrin Cloudera Data Platform.
Cloudera s’éloigne peu à peu de son statut de distributeur d’Hadoop et devient l’éditeur d’une plateforme de data science. Il est désormais reconnu comme un « acteur de niche » dans ce domaine par Gartner. L’entreprise américaine qui a fusionné avec Hortonworks veut elle aussi prouver que les technologies de l’écosystème HDFS sont pertinentes à l’ère de la centralisation des traitements de données dans le cloud.
Parmi les nouvelles offres de sa Cloudera Data Platform (CDP), l’éditeur avait présenté en septembre dernier Cloudera Operational Database (OpDB, désormais nommé COD), une version managée de la base de données NoSQL HBase.
COD reste dépendante de la PaaS de la version entreprise de CDP. « Cette solution est managée par Cloudera dans le cloud public, nous allons administrer le déploiement, la sécurisation et l’optimisation », assure Denis Fraval-Olivier, directeur, Solutions Engineering EMEA chez Cloudera. « Cette base de données opérationnelle est aujourd’hui disponible sur Azure et AWS. Nos clients qui employaient CDH et HDP vont pouvoir reproduire leurs environnements HBase ou les compléter en profitant des subtilités du cloud, c’est-à-dire l’élasticité : l’autoscaling et la réparation automatique », vante-t-il.
Cloudera Operational Database : HBase, mais à la demande
En outre, COD intègre nativement Apache Phoenix, un moteur de base de données relationnelle qui permet d’effectuer des traitements OLTP sur HBase. « L’objectif n’est pas de proposer une solution de data warehouse, nous avons une autre offre dédiée, mais cela permet de rapidement exécuter des analyses SQL à l’aide d’Apache Phoenix », précise notre interlocuteur.
Dans sa documentation, Cloudera évoque les cas d’usage comme l’analyse de l’attrition chez des clients dans une approche « Customer 360 », la possibilité de créer des dépôts de contenus accessibles par les utilisateurs, de traiter des données time series, de servir d’espace de stockage de paires clés-valeurs pour des applications mobiles ou web, d’être la base de modèle d’algorithme de scoring ou de détection de fraude, ou bien encore d’application de traitement de données IoT. En soi, la plupart de ces usages sont largement couverts par MongoDB, CouchBase, DataStax, InstaClustr ou d’autres éditeurs spécialistes des SGBD NoSQL. « COD est une brique au milieu de la plateforme Cloudera. L’environnement de base de données opérationnelle peut s’enrichir à la demande de la partie Apache Spark avec Data Engineering, de la partie injection de données avec NiFi ou Kafka ainsi que de la gouvernance des informations avec SDX », insiste-t-il.
HBase serait un candidat idéal pour ces usages et ne nécessiterait pas l’adjonction d’une couche de cache in-memory pour les traitements en temps réel. « La problématique vient plutôt de la manière de construire la chaîne d’alimentation de données de manière à bien utiliser la base de données NoSQL », prévient Denis Fraval-Olivier. « C’est pour cela que nous avons investi dans Apache Flink.
Par ailleurs, le fait que les ressources de calcul et de stockage de COD ne dépendent pas de celles de la plateforme permet d’obtenir des bons temps de réponse », assure-t-il en donnant l’exemple d’un opérateur télécom qui utilise la base de données comme une brique de son moteur de recommandation pour son système de vidéo à la demande de ses box Internet.
Dans le cloud, les clients ont d’autres obligations qui touchent directement à la robustesse et la sécurité.
Denis Fraval-OlivierDirecteur Solutions Engineering EMEA, Cloudera.
« Nos clients sont extrêmement exigeants sur la disponibilité. Nous avons en test le déploiement sécurisé de COD multizone d’un cloud public. Nous le faisions en mode IaaS, mais nous allons le proposer de manière automatisée », promet notre interlocuteur.
« Nous ne voulons pas contraindre nos clients à choisir une infrastructure. De plus, nous garantissons l’uniformité des services et l’indépendance à l’opérateur d’infrastructure », affirme Denis Fraval-Olivier. Pour autant, le déploiement de HBase sur site dépend de l’installation des différents paquets du runtime CDP Private Cloud Base et ne découle alors plus d’un processus en quelques clics. Les clients concernés auraient d’autres impératifs.
Les clients du secteur public poussent Cloudera vers le cloud hybride
« La partie cloud public est en croissance permanente, mais les solutions on premise et hybrides sont fortement demandées. Cloudera a l’avantage d’avoir une base installée importante. Nous couvrons des secteurs d’activité critiques que ce soit auprès des acteurs publics comme les gouvernements ou des secteurs extrêmement sensibles dans lesquels le cloud public, pour des raisons internes ou de régulations, n’est pas toléré. Nous ne souhaitons pas laisser ces clients sans solution : nous leur proposons une expérience utilisateur unique [entre les environnements] », martèle-t-il.
Selon le dirigeant, 90 à 95 % des clients de Cloudera sont « hybrides au sens premier du terme », c’est-à-dire qu’ils ont d’un côté des solutions sur site séparées de celles déployées dans le cloud. « Nous souhaitons apporter la glue qui va permettre de simplifier cette jonction. Nous considérons que la situation n’est pas idéale, car cela génère de vrais problèmes de régulations pour nos clients. Ils ont des règles extrêmement rigoureuses appliquées au sein de leurs instances privées et elles ont tendance à devenir poreuses au contact du cloud public, parce que les acteurs de ce monde-là privilégient l’innovation ».
La possibilité d’utiliser la CDP et COD à la demande sur un cloud européen, elle, n’est pas encore d’actualité. « Nous avions des partenariats actifs avec des acteurs comme Atos, mais concernant les offres à la demande, il appartient aux fournisseurs de cloud européens d’avoir la volonté de les développer », juge Denis Fraval-Olivier. « Pour l’instant, nous avons des partenariats avec des opérateurs intermédiaires tels Claranet qui exploitent nos solutions pour nos clients dans le cloud public ou des environnements on premise, pour ceux qui veulent reproduire l’expérience à la demande du cloud public », ajoute-t-il.
Les relations entre Cloudera et les géants du cloud public sont au beau fixe, puisque l’éditeur et ses clients sont de « gros consommateurs de ressources », selon le responsable français. D’ailleurs, Cloudera Data Platform rejoindra très prochainement Google Cloud Platform.