MapR veut pousser Hadoop plus loin dans les entreprises
A l’occasion de la Strata Conference 2014, le spécialiste du monde Hadoop, MapR Technologies, a multiplié les annonces dont la vocation est de lever les barrières à l’adoption du framework dans les entreprises. A la clé, une nouvelle distribution qui mise sur la compatibilité, une intégration avec HP Vertica et un bac à sable Hadoop pour accélérer la prise en main du framework.
L’un des pure-players indépendants du monde Hadoop, MapR, a profité de la Strata Conference 2014 qui se tient actuellement à Santa Clara en Californie, pour démontrer sa capacité à donner aux entreprises les moyens d’utiliser un environnement Hadoop dans leur SI.
MapR constitue avec Hortonworks et Cloudera, l'un des 3 acteurs indépendants qui ont basé leur modèle économique sur Hadoop. Avec certes une approche un peu différente. Par exemple, Si Hortonworks se base sur une notion de services autour de sa distribution Hadoop, Cloudera tend volontiers à s’extraire du monde de l’édition Hadoop pour développer une sphère de technologies adjacentes, compilées dans ce que la société baptise « un hub de données en entreprise ».
De son côté, MapR a depuis son origine concentré ses efforts pour faire d’Hadoop un composant d’entreprise, en développant par exemple son propre système de fichiers MapR FS, reposant sur le standard NFS, plus couramment utilisé dans les entreprises que HDFS, le système de fichiers Hadoop. Cette approche peut ainsi être retrouvée dans la dernière version de la distribution Hadoop de MapR, qui outre le fait de s’adosser au socle Hadoop 2.2, et d’intégrer ainsi YARN (le nouveau gestionnaire de ressources du framework), propose également la comptabilité avec MapReduce 1.0, histoire de ne pas couper l’herbe sous le pied des entreprises qui avaient décidé d’investir précédemment dans Hadoop. YARN (pour « Yet Another Resource Negotiator ") permet en effet de s’affranchir du mode de traitement Batch propre à MapReduce. « La distribution Hadoop de MapR étend YARN un peu loin en ajoutant une interface complète, ouverte et standard NFS en plus de HDFS, permettant aux applications non MapReduce de bénéficier de façon optimisée d’un stockage en cluster », résume Evan Quinn, directeur de recherche au sein du cabinet Enterprise Management Associates, cité dans un communiqué. La nouvelle distribution MapR conserve ainsi une compatibilité avec MapReduce 1.0, et permet d’exécuter les deux technologies simultanément sur le même noeud d’un cluster, assure également la société. Et ce pour une migration moins brutale vers YARN.
Un rapprochement avec HP Vertica
Autre exemple, MapR a également annoncé à l’occasion de ce même événement une intégration entre sa distribution et la base de données analytique de HP Vertica, dans le cadre d’une solution dite SQL-on-Hadoop, baptisé HP Vertica Analytics Platform on MapR. En clair, proposer une interface 100% compatible SQL, ainsi que des possibilités analytiques d’une solution dédiée, pour Hadoop.
« Les entreprises qui ont adopté Hadoop bataillent pour valoriser les analystes métiers qui ont besoin d’outils de BI et SQL sophistiqués pour faire leur travail, mais se sentent restreints avec des approches SQL incomplètes. », explique John Schroeder (en photo), CEO et co-fondateur de MapR Technologies dans un communiqué. Ce tandem MapR / Vertica vient selon lui résoudre de problème, mieux que les solutions SQL pour Hadoop actuelles du marché. Comme Impala initié par Cloudera, ou encore SQL-H de Teradata (développé en collaboration avec HortonWorks).
Ce rapprochement est en ligne avec la stratégie que mène actuellement HP dans le cadre de Haven. Ce concept architectural, qui vise à donner la vision de HP en matière de gestion et d’analyse des Big Data, réunit Vertica, Autonomy et ArcSight au dessus d’un socle Hadoop. Récemment, HP a concrètement établi des ponts d’intégration entre IDOL et Hadoop (IDOL for Hadoop) permettant d’embarquer les fonctions coeur de la plate-forme HP (extraction d’entités ou des textes, par exemple) au plus près des noeuds Hadoop. MapR y est supporté. Dans ce même logique, HP a également rapproché IDOL de Vertica.
Un bac sable Hadoop
Enfin, MapR a également profité de la Strata Conference 2014 pour présenter un bac à sable pour Hadoop, dont l’objectif est de permettre aux développeurs de se faire la main sur le framework Java et d’y tester leurs applications en live. Baptisé Sandbox for Hadooop, cet outil, gratuit, se compose d’une machine virtuelle, configurable en 5 minutes promet la société, qui contient la distribution Hadoop de MapR, associée à des tutoriels à destination des développeurs, mais également des administrateurs et des analystes métiers. Une façon, explique MapR, de répondre à la pénurie de compétences Hadoop, en proposant des outils de formation gratuits et pouvant être facilement configurés.