Sergey Nivens - Fotolia
Hadoop : Pivotal mise désormais sur Hortonworks
Pivotal sort du marché de la distribution Hadoop par la porte Hortonworks et se concentre sur ses capacités d’exploitation des données et la simplification des usages. HDB, son moteur SQL-on-Hadoop, et Gemfire, en frontal.
A l’occasion de l’Hadoop Summit qui se tient actuellement à Dublin, Pivotal, l’un des cadres du marché Hadoop, a annoncé qu’il ne commercialiserait plus sa propre déclinaison Hadoop (Pivotal HD PHD), préférant désormais capitaliser sur celle d’Hortonworks (HDP, Hortonworks Data Platform). Après la décision d’Intel de lâcher sa propre distribution au profit de celle de Cloudera, le marché des déclinaisons Hadoop poursuit sa consolidation.
Dans le détail, ce partenariat prévoit que HDP soit le socle Hadoop de Pivotal et que ce dernier en devienne également revendeur. De son côté, Hortonworks revendra Pivotal HDB, le projet de moteur SQL sur Hadoop de Pivotal, bâti sur le projet Open Source Hawq (développé par Pivotal et confié à la fondation Apache en novembre dernier). Hortonworks commercialisera une offre de support HDB à partir du second trimestre 2016.
Ce rapprochement clé n’est finalement pas une réelle surprise, au regard de la proximité existante entre les deux éditeurs, à la fois d’un point technologique et d’un point de vue stratégique. Les deux partenaires s’étaient d’une part réunis au sein de l’ODPi (Open Data Platform), un consortium dont la vocation est justement de développer des spécifications standards de composants cœur d’Hadoop. Puis ils avaient réuni leurs équipes respectives pour travailler à intégrer très étroitement la Big Data Suite de Pivotal (dont HAWQ, Gemfire et Greenplum MPP – également versés à l’Open Source) sur la distribution Hadoop d’Hortonworks.
Une proximité devenue telle que « depuis sa version 3, la distribution Hadoop de Pivotal était identique à HDP », résume ainsi Franck Sidi, directeur Data Innovation chez Pivotal EMEA. « Développer une distribution identique n’a pas de sens », poursuit-il dans un entretien avec la rédaction.
Se concentrer sur l’exploitation des données et sur SQL sur Hadoop
En revanche, ce qui fait plus de sens pour lui, est bien d’apporter de la valeur dans la manipulation et dans l’usage des données. En clair, les composants cœur de sa Big Data Suite. « Notre plus-value est dans HDB, le moteur SQL natif pour Hadoop et Gemfire, le moteur NoSQL In-Memory, pour réaliser des analyses temps-réel », poursuit Franck Sidi.
Pivotal entend « simplifier le façon avec laquelle les entreprises travaillent avec la donnée ». Franck Sidi évoque par exemple des possibilités d’analytique et de prédictif embarqués, des fonctions qui existent dans Greenplum et HDB.
Surtout, ce que souhaitent les entreprises, ajoute-t-il, « c’est du standard. On s’appuie sur ODP : ce qui permet aux entreprises de ne pas rester verrouillés ».
Restera enfin à s’interroger sur la consolidation du marché des distributions Hadoop. Intel et Pivotal ayant décidé de prendre du recul, il reste les trois piliers du genre, Hortonworks, Cloudera et MapR, puis suivent IBM avec BigInsight et AWS EMR (Elastic MapReduce). Si Cloudera et MapR n’ont pas rejoint l’ODPi, IBM a bien adhéré au projet. De quoi semer le doute quant à l’avenir de sa propre distribution ?