Cloudera et Hortonworks font désormais front commun dans une fusion de 5,2 Md de dollars
Les deux ex-rivaux du monde Hadoop vont travailler à une nouvelle plateforme pour faire évoluer leurs technologies et Hadoop vers le cloud. Ils entendent faire converger leur distribution Hadoop en direction d'un socle commun.
(L'article a été mis à jour le 5/10/2018 à 12.00. Les commentaires de John Schroeder, CEO et président du Board de MapR ont été ajoutés. Ils sont mentionnés en gras dans le corps de l'article)
Finalement, les deux pionniers du monde Hadoop ont décidé d’avancer main dans la main. Après avoir bataillé pendant 10 ans sur le même segment, Cloudera et Hortonworks ont annoncé fusionner leurs activités respectives dans une nouvelle entité. La transaction, dont la finalisation est attendue pour le premier trimestre 2019, s’effectuera en échange d’actions, à raison 1,3 action Cloudera pour chaque action Hortonworks. Cloudera détiendra environ 60 % de la nouvelle entité commune, contre 40 % pour Hortonworks. Cette fusion est évaluée à ce jour à quelque 5,2 milliards de dollars.
Tom Reilly, l’actuel CEO de Cloudera, reste CEO de la société commune, tandis que Scott Davidson, le directeur opérationnel d’Hortonworks, conserve cette même fonction au sein de la prochaine entité.
Dans cette fusion, tout est histoire de synergies et de complémentarités. Tom Reilly pense qu’en rapprochant les capacités de R&D, les ressources technologiques et humaines des deux entités, Cloudera et Hortonworks vont disposer d’une taille critique pour « capturer les opportunités du marché ». La société commune doit peser quelques 720 millions de dollars (411 M$ pour Cloudera ; 309 M$ pour Hortonworks lors de leur dernier exercice) et s’appuyer sur une base client de 2 500 clients. « Nous pouvons générer plus de cash que si nous étions seuls », confirme Tom Reilly.
« Ensemble, nous pouvons aller plus vite dans l’IoT. Ensemble, nous sommes plus forts et nous disposons d’une taille importante alors que le marché s’accélère », commente à son tour Rob Bearden, le CEO d’Hortonworks, qui rejoindra le board de la nouvelle entité - il n’est pas cité dans la liste de la direction opérationnelle.
Surtout, estime encore Tom Reilly, cette mutualisation des ressources permettrait de réaliser quelque 125 millions d’économies par an. Il est prévu qu’elles soient ré-injectées dans l’opérationnel.
Mais au final, c’est bien la croissance que Cloudera et Hortonworks cherchent à relancer. Ce rapprochement devrait avoir comme effet direct un taux moyen de l’ordre de 20 % jusqu’en 2020, pensent les représentants. Ce qui devrait assoir cette fusion sur un chiffre d’affaires avoisinant le milliard de dollars.
Cloud, cloud, cloud
Selon les représentants des deux entités, l’accélération vers le cloud est l’une des priorités de cette fusion et là où les synergies ont de quoi se révéler. Jusqu’alors, les deux sociétés menaient une stratégie en parallèle auprès des mêmes partenaires. AWS et Azure pour Cloudera, Google, IBM et Azure pour Hortonworks. Mais en se réunissant et en portant leurs technologies et leur message d’une seule et unique voix, « nous voulons devenir un partenaire plus fort et plus significatif pour les fournisseurs de cloud ». Même argument pour les autres partenaires des deux sociétés : ils n’auront plus à dédier des ressources séparées pour chacune des plateformes. « Une entreprise, une plateforme ».
Un socle technologique unifié
A terme, ces synergies se traduiront par la création d’une fondation technologique commune qui rapprochera les spécificités techniques de Cloudera et d’Hortonworks. Cette plateforme, nommée à plusieurs reprises Enterprise Data Cloud, vise à proposer des outils capables de cibler tous les scenarii de déploiement, cloud (privé et public), sur site et en bordure (Edge). Celle-ci devrait également reposer sur des technologies dites cloud-natives, explique encore Tom Reilly.
Concrètement, elle devrait par exemple s’appuyer sur, d’un côté, l’expertise d’Hortonworks au niveau de la collecte et de l’ingestion des données et des flux de données en streaming (par exemple Data Flow et Data Plane – gestion des données multi-format et multi-source).
De l’autre côté elle pourra compter sur l’ensemble des outils analytiques et de Data Science de Cloudera (Data Science Workbench) et son entrepôt de données (Cloudera Data Warehouse, ex Analytics DB). Le tout soutenu par le PaaS de Cloudera Altus. Là sont, selon les représentants des sociétés, les synergies technologiques qui aujourd’hui ont de quoi séduire le plus les entreprises. « Avec les deux technologies, nous allons proposer une plateforme de bout-en-bout, de l’Edge à l’AI » ont confirmé les représentants.
Entre temps, le support des deux plateformes Hadoop distinctes, Hortonworks Data Platform et Cloudera Enterprise Data Hub sera tout de même maintenu sur les trois prochaines années, assure encore Tom Reilly. Une mouture unifiée (version Unity), qui fédère les deux socles, est en cours d’élaboration.
Enfin, la démarche très centrée sur l’ouverture d’Hortonworks sera également maintenue, ont garanti les deux ex-CEO. L’approche open source d’Hortonworks sera « honorée », indique Tom Reilly.
Quid des investissements des entreprises dans l’approche d’Hortonworks
Reste à savoir comment les entreprises accepteront cette fusion, s’interroge Mohamed Benaissa, Big Data Solutions Architect et Business Manager IT, de la société Umanis, spécialisée dans le conseil et l’intégration d’architecture de données. Umanis est partenaire des deux éditeurs Hadoop.
Selon lui, ce rapprochement a tout pour décevoir les clients d’Hortonworks qui pourraient se demander si la démarche open source choisie ne va pas être mise à mal. « Il s’agit d’un très grand changement car une solution unique va monopoliser le marché. Cela ne va pas plaire aux entreprises, surtout celles qui avaient investi dans Hortonworks. Le doute existe sur le coût des licences », lance-t-il. Tarek Izemrane, un autre spécialiste de la question chez Umanis, se dit également surpris par cette annonce, car elle n’est pas en ligne avec les stratégies des deux éditeurs précédemment mentionnés.
Il est vrai que Cloudera et Hortonworks, s’ils partagent un noyau commun open source - Hadoop - avaient des politiques commerciales et de distributions différentes. Hortonworks a bâti toute sa stratégie sur une démarche 100 % open source, et y a façonné son argument marketing et commercial en ne revendant que des souscriptions (service, support) sur ses outils.
Cloudera, de son côté, a préféré reposer son modèle en associant à ce cœur open source une série d’outils payants et propriétaires. Un modèle reposant davantage sur l’édition logicielle pure.
Toutefois, soutient Tarek Izemrane, Hortonworks se dirigeait aussi vers ce modèle hybride. Car la société « ne gagnait pas d’argent avec les souscriptions. La majeure partie des entreprises n’avaient pas souscrit aux services payants de la société » pointant du doigt « un problème de politique commerciale ».
Pour autant, aussi concurrents soient-ils, poursuit Mohamed Benaissa, le nombre de fonctions identiques étaient notables, notamment en matière de sécurité, de requêtage SQL (Impala pour Cloudera, Hive pour Hortonworks) ou encore dans les services d’administration pour le cloud (Cloudera Director, Hortonworks CloudBreak). La distinction s’opérait sur certains détails comme la gestion des données – priorité à Cloudera – ou la sécurité – priorité à Hortonworks.
Rendre Hadoop plus cloud-natif : une vision commune
Mais là où finalement les deux se rejoignent, c'est le cloud. Avec un constat simple : Hadoop n’est pas doté d’une approche suffisamment cloud-native. Il faut dire qu’Hadoop et son système de fichiers HDFS, aussi distribué soit-il, ne supporte pas les déploiements sur plusieurs datacenters, explique encore Mohamed Benaissa. Les machines du cluster devaient jusqu’alors être présentes dans le même datacenter. Yarn, le gestionnaire de ressources d’Hadoop, arrivé avec le v2 du framework souffrait lui-aussi d’un retard par rapport aux préoccupations actuelles : le streaming, le temps réel et le cloud.
Si aujourd’hui, cette approche est résolument au cœur de la plateforme développée par la société issue de la fusion, les deux sociétés travaillaient chacune de leur côté sur le sujet. Hortonworks s’était ainsi associé à Red Hat et IBM, pour rapprocher Hadoop de l’écosystème Kubernetes. Les développements portaient justement à dissocier les couches stockage de celles dédiées au compute afin de gagner en élasticité.
De son côté, Cloudera avait initié une stratégie cloud portée par, d’un côté, son PaaS Altus, et, de l'autre, par un changement architectural concrétisé avec SDX (Shared Data Experience), rapporte Tarek Izemrane. SDX permet d’unifier la couche de stockage pour favoriser le partage des données à l’ensemble des applications.
Finalement, le cloud est certainement une explication clé de cette fusion. Car les partenaires de Cloudera et d’Hortonworks, comme AWS et Google, sont aussi des fournisseurs de services Hadoop ou Spark, clé en main – EMR chez AWS, Dataproc chez Google. De quoi cannibaliser une partie du marché.
L’autre question que cette fusion soulève porte sur le devenir de MapR. La société formait jusqu’alors le 3e pure-player du monde Hadoop, derrière Cloudera et Hortonworks. MapR a initié une stratégie différente des deux autres en misant dès le départ sur plusieurs composants propriétaires, comme un système de fichiers compatibles NFS – qu’il revend aujourd’hui. La société a élargi son offre au stockage, au streaming de données et au stockage pour containers, notamment.
En réaction à ce rapprochement entre Cloudera et Hortonworks, la société a réagi sur Twitter : « Deux sociétés qui sont dans le faux ne créent pas une société qui est dans le vrai », envoyant alors les lecteurs vers les clients de la marque.
Two wrongs don't make a right – See why Cloudera and Hortonworks customers have moved to MapR! --> https://t.co/YEFTOoHo8e pic.twitter.com/gBqDuHVuAB
— MapR Technologies (@mapr) 4 octobre 2018
A la rédaction de cet article, MapR n’avait pas répondu à nos sollicitations.
« Les clients ne bénéficieront pas des avantages de cette fusion sur le plan de l'innovation. La fusion vise à réduire les coûts. Cloudera et Hortonworks ont plusieurs technologies concurrentes et redondantes, comme Ambari et Cloudera Manager ou Sentry et Ranger. L'annonce de la fusion indique que ces technologies redondantes seront " unifiées ". Cela signifie que certains clients cesseront de les utiliser, ce qui entraînera des coûts excessifs », a tenu à souligner John Schroeder, CEO et président du Board de MapR, dans un email envoyé à la rédaction. « Ils disposent de peu de technologies qui s'ajoutent à leur plateforme globale. Ils revendiquent une plateforme de données de prochaine génération sans la technologie sous-jacente. » Ce que selon lui MapR est parvenu à réaliser en intégrant à ses outils «9 ans d'ingénierie pure ».