Tijana - Fotolia
L’open core attire : Databricks séduit Microsoft, Confluent accueille Sequoia
250 M$ pour le premier, 125 M$ pour le second : Databricks et Confluent ont démarré 2019 en annonçant des levées de fonds, mettant en avant l’intérêt par les investisseurs du modèle open core.
Début d’année en fanfare pour le modèle open core. Databricks et Confluent, les entités commerciales derrière deux projets open source très en vogue, Spark et Kafka, sont toutes deux parvenues à séduire les investisseurs américains. A la clé, 250 millions de dollars pour le premier et 125 millions de dollars pour le second.
Databricks et Confluent sont des sociétés qui ont donné naissance à des projets open source communautaires (respectivement Spark et Kafka), en sont les principaux contributeurs et ont bâti leur modèle économique sur le développement d’outils, propriétaires ou pas, au-dessus de ce cœur ouvert (open core, donc). Ces outils sont généralement compris dans une plateforme dont le support est commercialisé sous la forme de souscription.
Spark et Kafka forment aujourd’hui deux piliers des infrastructures de gestion des données. Ils correspondent à des évolutions technologiques clé qui se reposent sur des racines plantées par Hadoop et sa volonté de stocker les données en volume dans un système de fichiers. Spark a ouvert les usages du micro-batch et du Machine Learning grâce à sa bibliothèque embarquée, Kafka ceux de la gestion de flux en « streaming » des données en temps réel. Ces deux usages, et ces deux socles, peuplent aujourd’hui nombre d’applications d’entreprises et sont devenus des standards de fait.
Databricks ressert ses liens avec Microsoft
Chez Databricks, le cœur Spark a donné naissance à une plateforme Unified Analytics dont la vocation est de proposer un outillage spécifique pour l’ensemble du cycle du Machine Learning. De la préparation des données à la création de modèles via différents frameworks de ML (Tensorflow, Pytorch, XGBoost, mlflow). Cette solution comprend également un module de collaboration qui doit justement favoriser les échanges entre métiers, d’un côté l’ingénieur des données, en charge de la préparation et de la qualité des données, et de l’autre le data scientist.
Parce que sa proximité avec Spark est clé, Databricks est souvent présenté comme un partenaire emblématique. Talend, par exemple, a choisi de s’intégrer à Databricks sur Azure pour tirer une passerelle native et instantanée (elle repose sur une architecture serverless) entre sa plateforme et Spark dans le cloud de Microsoft.
Microsoft justement. S’il devient aujourd’hui un investisseur (dans un tour de table mené par Andreessen Horowitz) de la société, l’éditeur avait déjà noué un accord avec Databricks. La solution de ce dernier est effet le moteur premier d’Azure Databricks, un Spark-as-a-service qui a été ajusté aux services cloud d’Azure (Blob Storage, Azure Data Warehouse, Power BI notamment).
« Cet investissement s'appuie sur notre partenariat mis en place depuis plusieurs années autour d'Azure Databricks. Ce service Azure de premier plan qui, conjointement avec d'autres services Azure Data comme Azure Data Warehouse, simplifie grandement l'analyse des Big Data et les solutions d'intelligence artificielle pour de nombreux clients Microsoft », assure d’ailleurs Rohan Kumar, vice-président, Azure Data chez Microsoft.
Sans connaître le poids de ce partenariat avec Microsoft dans les revenus de la société, Databricks fait état de revenus récurrents de 100 millions de dollars en 2018.
Confluent et Kafka séduisent Sequoia
S’il n’est pas investisseur, Microsoft est aussi un partenaire clé pour Confluent. Cette société qui s’adosse également à un modèle open source, renferme la matière grise qui a donné naissance à Kafka, l’autre coqueluche open source autour duquel gravite un écosystème grandissant. Kafka, hébergé par la fondation Apache lui-aussi, cible quant à lui la gestion des flux de données en temps réel. Ce framework permet par exemple de développer des applications qui réagissent à des événements. Une mécanique qui à l’heure de l’IoT, de l’Edge Computing, et de la nécessité de collecter des données contextuelles et externes, pour alimenter les modèles d’AI, fait mouche. Audi est par exemple un utilisateur des outils de Confluent.
Il est ainsi logique que le modèle économique de Confluent ait séduit à nouveau les investisseurs. Cette levée de fonds de 125 millions de dollars, qui porte à 206 millions de dollars le financement collecté par la société, a été menée par le fonds américain Sequoia Capital, associé aux actionnaires déjà en place Index Ventures et Benchmark Capital. « Confluent est la société dont les revenus liés aux abonnements ont progressé le plus rapidement depuis son lancement », indique d’ailleurs Sequoia Capital. En 2018, le nombre de souscriptions a été multiplié par 3,5. Celui des employés a explosé (+128 %) sur la même période.
Il faut dire que Confluent a développé une plateforme (Confluent Platform) dont la vocation est d’industrialiser la gestion événementielle dans les applications et de rapprocher Kafka des entreprises. KSQL fait partie de ces fonctions réservées à la plateforme. Ce moteur de requêtes permet d’utiliser le langage SQL pour interroger les flux de données en temps réel.
Confluent s’est aussi associé à Microsoft pour la revente de ses outils et a intégré sa plateforme à Azure Stack. Un partenariat est également en place avec Google Cloud.
Toutefois, la société est proche des grands fournisseurs de cloud, mais a aussi développé son propre Kafka-as-a-service via Confluent Cloud. Surtout, Confluent fait aussi partie de ces sociétés dont le modèle repose sur un cœur open source, qui ont ajusté leur licence pour, selon eux, éviter que les fournisseurs de cloud fassent de leurs outils un des leurs, en mode Saas. Quitte donc à ne plus devenir purement open source. Ce changement de licence a été mis en place peu de temps avant l’officialisation de cette nouvelle levée de fonds. Etait-ce une volonté des futurs investisseurs ?