SDX : Cloudera ajuste son architecture au multi-cloud
Cette architecture SDX met en place un concept de catalogue de données partagées pour unifier les capacités de gouvernance, de gestion et de sécurité d’un Cloud à l’autre.
Partager pour mieux contrôler. C’est un peu le concept derrière SDX, le modèle architectural qui habitera désormais la plateforme Cloudera Enterprise, présentée ce mois-ci à l’occasion de la conférence Strata Data qui se tenait à New York. Sur SDX repose en fait le principe d’une couche de données partagée (Shared Data Experience, dans le langage de Cloudera), où leur stockage, les métadonnées et donc le contexte de ces données, sont purement isolées de leur traitement et de leur exploitation. Et ce, quelle qu’en soit la source : un Cloud public, privé ou encore sur site (voire tout cela ensemble). Une volonté d’unifier pour en faciliter la gestion.
Cette approche peut certes rappeler celles mises en place par Hortonworks ou encore MarkLogic, le premier avec le lancement d’un nouveau produit nommé Data Plane Service, et le second avec son concept de hub de données opérationnel. Chez Cloudera, cela se traduit aujourd’hui par une modification de l’architecture même de la plateforme.
Avec cette approche, Cloudera compte ainsi permettre aux entreprises d’appliquer plus facilement à ces données désormais centralisées, des politiques de gouvernance, de gestion et de sécurité, et ce quel que soit l’environnement source. Une gestion commune sur des données éparpillée, en somme. « Le Big Data est partout et vous devez avoir la flexibilité nécessaire pour l’analytique », résume Tom Reilly, le Pdg de Cloudera en visite à Paris pour l’événement Cloudera Sessions. « SDX vous permet de mettre en place des processus analytiques dans votre datacenter, sur AWS, Azure et Google, et dans un Cloud privé et de disposer de la même expérience et des mêmes possibilités de sécurité. » Mais, encore une fois sur des sources et des formats de variées, qu’elles soient structurées ou non structurées.
SDX crée en fait une couche d’abstraction entre l’analytique et le stockage des données, résume-t-il en substance. Mais surtout, « cette nouvelle architecture permet aussi aux équipes d’ingénieurs de Cloudera d’innover plus rapidement ».
Ancrer fortement le Cloud dans la plateforme…et Altus
L’un des points forts de SDX, est de pouvoir faire la même chose sur site et dans le Cloud, ajoute à son tour Alvin Heib avant-vente pour la France chez Cloudera, pointant du doigt les capacités de portabilité multi-cloud et d’hybridation des applications. Si cela était certes faisable auparavant, l’approche restait peu efficace en matière de coûts. Car si SDX existait déjà sur le on-premise – comme le précise un billet de blog sur le site de Cloudera -, sa valeur est que l’architecture comporte désormais les environnements Cloud, et surtout « permet de s’adapter à la complexité des applications multi-Cloud », où se mêlent services et plateformes hétérogènes.
Techniquement, l’idée derrière SDX est de dissocier la couche de stockage de données et la couche qui gère le cycle de vie de la workload. Les données sont stockées avec leur contexte (au sein d’un Shared Data Catalog). Avec ce mécanisme, ces données sont exposées ainsi, de façon commune, aux applications. Des clusters sont créés à la volée au-dessus pour soutenir les workloads. « Il s’agit ici de favoriser le modèle à la demande du Cloud », commente Alvin Heib, mais tout en évitant d’avoir à re-créer des données. SDX centralise la gestion des métadonnées, et surtout les rend persistantes d’une workload à l’autre, précise encore le responsable.
En ce sens, SDX apporte une fondation architecturale clé pour Altus, le Paas du groupe, souligne Tom Reilly. Ce Paas constitue d’ailleurs un fort levier de croissance pour Cloudera. « Aujourd’hui l’approche de la société a été d’accompagner leurs clients à migrer leusr workloads analytiques dans le Cloud (20% des workloads Cloudera sont dans le Cloud), avec une approche centrée sur le Iaas, avec Altus, la société va un cran plus loin ». On comprend que ce socle de données partagées est une fondation, voire un accélérateur, pour le développement d’Altus.
Des scenarii de placements intelligents de workloads sont également évoqués par Clouder pour illustrer les capacités de SDX. Une workload pourrait s’exécuter sur un Iaas et, en fonction de la volumétrie ou du type de workloads à lancer, passer sur une autre plateforme lorsque le coût y devient plus favorable.