markrubens - Fotolia
CDP : Cloudera expose les chemins de migration à ses clients français
Lors de son forum français, Cloudera a détaillé sa feuille de route. Le spécialiste d’Hadoop a spécifié les chemins de migration des plateformes existantes datant d’avant la fusion avec Hortonwork vers sa Data Platform. Quelques subtilités sont à prendre en compte.
Le Cloudera Forum France a rassemblé plus de 300 participants, selon l’organisateur. Le rendez-vous virtuel comprenait des interventions préenregistrées des dirigeants américains du groupe, des cas clients présentés par Engie et AG2R La Mondiale et des interventions rapides de l’équipe française.
Mick Hollison, Chief Marketing Officer chez Cloudera s’est félicité des évolutions de la Cloudera Data Platform (CDP), l’architecture issue de la fusion de Cloudera et d’Hortonworks. « Cloudera est une puissante plateforme de traitement de données, qui offre une expérience cloud hybride permettant d’accomplir de nombreux cas d’usage, comme prévenir l’attrition chez un opérateur télécom, aider à retenir les clients d’une banque, d’effectuer de la maintenance prédictive dans une usine, […] », vante-t-il.
Le CMO assure que la plateforme supporte l’ensemble du cycle de traitements de données de manière sécurisée et ouverte, ce que ses concurrents ne feraient pas, tout du moins pas aussi bien. « Nous sommes la seule entreprise à fournir de véritables cas d’usage de bout en bout. Les autres éditeurs sur le marché doivent relier les différentes briques que nous avons profondément intégrées, pour obtenir le même résultat ».
Fred Koopmans, VP Product Management chez Cloudera a dévoilé la feuille de route concernant cette Data Platform. Outre des améliorations déjà évoquées en septembre dernier, il est revenu sur les possibles chemins de migration vers CDP.
Bon nombre de clients n’ont pas encore migré leur plateforme CDH ou CDP vers la nouvelle plateforme annoncée l’année dernière. Lors de la conférence, les modérateurs français répondaient aux questions des utilisateurs sur la messagerie instantanée embarquée.
Sans véritable surprise, certains utilisateurs ont multiplié les questions concernant les chemins de migration qui s’offre à eux alors que la fin du support pour CDH 6.3 est annoncée pour mars 2022, tandis que HDP 3.1 sera en fin de vie en décembre 2021.
Des options de migration multiples, mais subtiles
L’éditeur, maintenant plus attiré par le cloud (et parce que son architecture de prédilection est cloud native), pousse ses clients dans cette direction : CDP est disponible sur AWS, Azure et la date de disponibilité de la plateforme sur Google cloud platform sera annoncée en fin d’année. « Il y a également une version de CDP pour les centres de données, qui s’appuie sur la même architecture séparant le stockage du calcul et permettant des déploiements hybrides », rappelle Fred Koopmans.
Annoncée en juin 2020, celle-ci se nomme CDP Private Cloud (anciennement CDP Data Center). Elle est divisée en deux parties : CDP Private Cloud Base et Private Cloud. « Base ressemble à un cluster traditionnel CDH ou HDP, cela fonctionne sur des serveurs bare-metal ou des VM existants (une vingtaine au minimum), permet de stocker les données, de contrôler la gouvernance et la sécurité (via le control plane SDX). Base est le chemin de migration naturel pour tous les clusters CDH et HDP existants » vante le VP Product Management. Cependant, ce form factor reprend l’architecture d’origine et n’offre pas la séparation du stockage et des ressources de calcul, comme le propose Private Cloud.
Cette solution arrive tardivement. Cloudera propose pourtant des méthodes et des outils pour la migration vers CDP, mais tous les clients, dont ceux basés en France, n’ont pas encore franchi le pas.
La majorité des clients français ont une stratégie de migration, assure Cloudera
Denis FravalDirecteur avant vente EMEA, Cloudera
« La base installée n’a pas encore migré entièrement sur CDP. La plateforme unifiée sur site n’est disponible que depuis le début de l’année », expliquait Denis Fraval, directeur avant-vente EMEA chez Cloudera, à la fin du mois de septembre dernier. « Les projets de migration prennent un petit peu de temps. En France, nous avons une stratégie de migration bien définie pour environ 80 % de nos clients pour qu’ils adoptent cette plateforme unifiée. Ensuite, un calendrier s’étale jusqu’à la fin de l’année prochaine », ajoute-t-il confiant.
Selon le directeur avant-ventes, « Très peu de clients vont conserver une plateforme monolithique on premise ».
Les questions posées par les participants du forum montrent que certains cherchent encore la meilleure voie pour y arriver. On peut les comprendre, car Cloudera propose finalement plusieurs chemins de migration, avec quelques subtilités.
En effet, si Private Cloud Base n’offre pas directement une séparation compute/storage et que les ressources sont toujours gérées via YARN, il est possible d’y adosser un environnement containérisé permettant de s’affranchir de cette limite pour le développement de nouvelles applications.
En ce sens, Private Cloud Base Experiences rassemble les briques de data warehousing (Cloudera Data Warehouse – CDW) et de machine learning (Cloudera Machine Learning – CML). « Nous allons apporter des applications de visualisations issues du rachat d’Arcadia comme nous allons le faire dans le cloud. De plus, nous allons dans moins de six mois faciliter la manière de déployer ces applications sur site », assure Fred Koopmans. Les briques CDE (Cloudera Data Engineering) et Data Flow arriveront plus tard. CDE est pour l’instant inclus dans les clusters de base de Private Cloud Base et Private Cloud.
Les clients peuvent également retrouver ces deux environnements (Base et Experiences) réunis dans l’offre Private Cloud.
« Pour les clients qui ne veulent absolument pas basculer dans le cloud public, quelle qu’en soit la raison, nous apportons le self-service, les environnements containerisés et la gestion avancée dans l’offre Private Cloud », vante Denis Fraval.
Seulement la séparation du stockage et des ressources du calcul résulte du choix de placer les briques CDW, CML, et bientôt CDE dans un cluster OpenShift de Red Hat. « Nous avons effectué un partenariat avec Red Hat qui fournit la brique d’orchestration sur Kubernetes de CDP Private Cloud », nous assure Denis Fraval.
Denis FravalDirecteur avant vente EMEA, Cloudera
Pour autant, tous les clients n’ont pas fait le choix de Red Hat et des infrastructures compatibles avec OpenShift. « Ce n’est pas un partenariat exclusif. Le multicloud est l’ADN de Cloudera, on ne peut pas avoir une dépendance à l’infrastructure », défend le directeur avant-ventes EMEA. « Nous en créons une petite là avec Red Hat OpenShift pour amorcer, car nous n’avons pas trouvé de moyens de faire autrement. Il nous fallait travailler avec un acteur sérieux à notre disposition et qui trouve également son intérêt dans ce partenariat. Pour nos clients ayant fait des choix différents, nous travaillons également avec d’autres fournisseurs et des alternatives seront disponibles l’année prochaine », promet-il.
Hybride à la marge ?
Cloudera pousse désormais son offre managée, mais certains clients avaient déjà déployé CDP sur un IaaS hébergé sur le cloud public. Cela ne les empêcherait pas de s’intéresser à ce que propose l’éditeur.
« Nous avons signé un certain nombre de clients français qui adoptent l’offre CDP cloud public. Certains ont expérimenté notre solution Data Warehouse en complément de ce qu’ils avaient déjà déployé sur AWS EC2 en mode IaaS pour accéder à notre offre BI interactive, par exemple », illustre Denis Fraval.
Les utilisateurs des plateformes Cloudera sur site sont également ciblés. L’offre cloud public peut être utilisée en complément pour des expérimentations, ou éviter des effets néfastes des voisins bruyants, selon le responsable. Par exemple, AG2R La Mondiale a essayé les capacités de Cloudera Machine Learning sur Azure en complément de son workbench data science déployé sur CDH.
Au vu des profils des clients de Cloudera qui se vante de desservir des entreprises régulées (banques, institutions, OIV, secteur public, etc.), il semble logique que l’offre managée soit principalement employée pour du débord, en tout cas en Europe.