Avec Serengeti, VMware s’attaque à la haute disponibilité d’Hadoop
Nos partenaires de SearchCloudComputing sont allés interroger plusieurs analystes suite à l’annonce par VMware de son projet Serengeti. Un projet Open Source, hébergé à la fondation Apache, qui consiste à adapter Hadoop aux environnements virtualisés et surtout à vSphere. Un constat en demi-teinte.
Il est un constat : même si une grande partie des départements informatiques souhaitent placer dans le cloud le traitement des données en volume, la plupart des plates-formes de Big Data, elles, nécessitent encore du matériel dédié, pouvant ainsi conduire à des problèmes de fiabilité, notamment.
La situation pourrait bien changer grâce au projet Open Source Serengeti, soutenu par VMware auprès de la Fondation Apache. Ce projet permet aux entreprises de déployer et de gérer Hadoop sur vSphere 5.0, à la fois dans un environnement virtualisé et Cloud.
Le fait de placer Hadoop sur une infrastructure virtuelle pourrait gommer tous risques liés à la fiabilité ; avec vSphere, une application Hadoop pourrait par exemple re-démarrer automatiquement en cas de noeud défaillant, souligne VMware dans un communiqué. D’autant que le spécialiste de la virtualisation collabore avec les membres influents de la communauté Hadoop, comme Cloudera, Greenplum, Hortonworks, IBM, MapR, dans le but de proposer à la communauté des extensions afin d’adapter le framework Java à la virtualisation.
Certains affirment qu’il s’agit là d’un projet clé pour VMware, tout comme celui de devenir un acteur du secteur du Big Data. «Avec l’explosion des données, il est évident qu’il existe des opportunités en matière de virtualisation, notamment pour les importants traitements de données», souligne Al Hilwa, directeur de programme Développement, chez IDC.
Les plates-formes Big Data comme Hadoop ou les bases de données distribuées forment la pièce manquante dans la pile vFabric de VMware, ajoute Jeffrey Reed, directeur, Développement d’applications, chez Logicalis Group, un fournisseur de Cloud britannique. «Il est critique pour VMware de proposer à son écosystème de distributeurs une stratégie autour de Hadoop», souligne Reed. Une opinion qui n’est parfois pas partagée.
«L’approche de VMware qui consiste à rendre Hadoop hautement disponible n’est pas judicieux, tranche Shlomo Swidler, CEO d’Orchestratus. Ce projet place le support de la haute disponibilité au niveau de la couche infrastructure, tandis que la norme la positionne davantage au niveau de l’application», poursuit-il.
Toutefois, insiste un analyste, cette initiative représente les deux pans d’une même stratégie qui consiste à cimenter le positionnement de VMware sur les terrains de la haute disponibilité et de Hadoop. «Le plus important est de faire d’Hadoop une brique pour l’entreprise, affirme Tony Baer, analyste principal au sein du cabinet Ovum. Hadoop supporte assez peu la tolérance de panne et la virtualisation est l’un des éléments pour répondre à ce besoin.»
Serengeti, disponible en téléchargement dans une licence Apache 2.0, permet de déployer une cluster Hadoop en quelques minutes, via un simple clic, soutient par ailleurs VMware.
Notons également que VMware travaille avec ses partenaires à reverser à la communauté Hadoop les modifications opérées sur Hadoop Distributed File System et Hadoop MapReduce.
Adapté de l'anglais par la rédaction.