photobank.kiev.ua - Fotolia

Hadoop : MapR mise sur la convergence et la plateforme unifiée

Parce que les entreprises ont besoin qu’on les aide à pré-digérer la sphère des technologies Hadoop, MapR choisit la voie de la plateforme intégrée pour y fédérer les cas d’usages et les APIs correspondantes.

Début mars, MapR a décidé de traduire concrètement son positionnement sur le marché des pure-players Hadoop dans le nom de sa plateforme : MapR Converged Data Platform. Avec un fil conducteur : la convergence.

La convergence, justement, c’est le point fort que MapR souhaite mettre en avant dans sa stratégie alors que le marché de la sphère des technologies Hadoop est aujourd’hui peuplée d’une kyrielle de projets annexes, tous raccordés – de loin ou de près – au framework de la fondation Apache.  Perdant au passage les entreprises dans leur adoption et apprentissage de la technologie.

Il faut aussi ajouter que le marché des distributions Hadoop connait depuis plusieurs mois un mouvement de concentration dont la vocation a justement pour effet de rationnaliser une offre où il était difficile de s’y retrouver.  Une façon de redessiner les frontières d’un marché, en proie à une certaine maturité.

Ainsi va Pivotal qui a décidé de miser sur sa proximité avec Hortonworks pour justement sortir du segment de la distribution. Intel avait aussi décidé de jeter l’éponge pour rallier la cause Cloudera.  L’Open Data Platform Initiative, lancée par Hortonworks et Pivotal – et soutenue par IBM - , avait elle-aussi l’ambition de créer des composants standard Hadoop pour unifier le marché. Cloudera et MapR n’y sont pas représentés.

MapR a ainsi décidé de clarifier un peu plus son positionnement sur un marché qui se mue. A l’origine, la société avait d’ailleurs pris une direction différente en proposant d’entrée de jeu un système de fichier exotique, MapR-FS, pour remplacer HDFS et contourner les lacunes de ce dernier. Marquant ainsi son distinguo.

Unifier les technologies

Aujourd’hui, avec la Converged Data Platform, MapR souhaite accentuer cela, en intégrant dans une solution unifiéeles technologies identifiées par l’entreprise comme étant celles qui répondent aux besoins actuels des entreprises en matière de gestion des données. Et ce, tous traitements confondus, en batch ou temps réel.

« Les entreprises sont passées du Big Data ‘traditionnelle’, où l’on stocke les données en volume et on les analyse en mode batch, à une prise en compte de la dimension temps réel, avec l’ambition de faire plus avec leurs données, résume Tugdual Grall, évangéliste chez MapR, lors d’un entretien avec la rédaction. « On assiste un déplacement vers le temps réel, de MapReduce vers Spark », note-t-il également. Autres tendances selon lui, l’intégration via Kafka, ou encore le SQL sur Hadoop, via – logiquement – Drill, un projet Open Source initié par MapR.

MapR a donc fait le pari de digérer ces technologies et projets, et d’intégrer les APIs correspondantes afin d’en faciliter l’usage et également le déploiement. Car selon MapR, ce qui distingue son approche, c’est que tout cela s’installe sur un même cluster. « Les entreprises avaient plusieurs clusters à gérer, un pour Kafka, un pour Hadoop, un pour Spark. On veut simplifier cette partie-là », commente Tugdual Grall.

Cette approche se retrouve également dans la décision de MapR de fondre dans sa plateforme sa base NoSQL, MapR-BD, et de l’associer à Drill, pour proposer une interface SQL unifiée sur toutes les typologies de données. « Cela facilite également le travail des développeurs », commente-t-il enfin.

« Les APIs existent déjà dans l’Open Source. Ce qui importe, c’est la mise en production. »

« Les entreprises ont une meilleure idée de ce qu’elles veulent et cherchent la solution qui répond le mieux à leur besoin. Elles ont une idée, elles cherchent à la passer en production », ajoute Tugdual Grall. D’où l’intérêt d’une plateforme intégrée.

 

Pour approfondir sur Open Source