Databricks est en train de lever 10 milliards de dollars

Databricks est en train d’opérer, ce qui se profile comme la plus importante levée de fonds à ce jour. La rentabilité acquise grâce aux marchés de la gestion des données et sa volonté de devenir « le fournisseur de l’infrastructure pour l’IA » ont convaincu les investisseurs.

Une de plus. C’est rare de voir la lettre J après l’annonce d’une série de levées de fonds. Et pourtant, Databricks l’a fait. Le 17 décembre, le spécialiste de la gestion de données, concurrent de Snowflake, a annoncé qu’il est en train de lever 10 milliards de dollars. Il a déjà récolté 8,6 milliards de financements « non dilutifs » (sans effet sur l’actionnariat de l’entreprise). Cette série J est codirigée par Thrive, Andreessen Horowitz, DST Global, GIC Insight Partners et WCM Investment Management. Databricks mentionne également l’intervention du régime de retraite des enseignants de l’Ontario, ainsi que les nouveaux venus, dont ICONIQ Growth, MGX, Sands Capital et Wellington Management.

Aller ou ne pas aller en bourse, telle (n’) est (pas) la question

Si c’est une habitude pour Databricks, cette série J représente la plus forte somme récoltée par l’entreprise à ce jour. Jusqu’alors, elle n’avait collecté « que » 4 milliards de dollars, selon Crunchbase. La série J serait même l’une, voire la plus grosse levée de fonds jamais enregistrée.

« Nous avons largement dépassé nos objectifs pour ce tour de table », affirme Ali Ghodsi (en photo en haut d’article), cofondateur et CEO de Databricks, confirmant ainsi une information relayée en amont de l’annonce par The Information.

De fait, la collecte surpasse celle d’OpenAI annoncé en octobre, plafonnant à 6,6 milliards de dollars. Le papa de ChatGPT avait très rapidement utilisé ces fonds pour négocier une ligne de crédit de 4 milliards de dollars supplémentaires. L’année passée, la fintech Stripe avait levé 6,5 milliards de dollars.

Or, quand la valorisation d’OpenAI atteint 157 milliards de dollars, celle de Databricks s’approche plutôt des 62 milliards de dollars, contre 43 milliards l’année dernière. Moins populaire que le fournisseur de LLM, Databricks se prépare – avec, semble-t-il, beaucoup d’appréhensions – à son introduction en bourse. Ali Ghodsi a indiqué auprès de Financial Times que Databricks pourrait entrer en bourse l’année prochaine, mais que la levée de fonds offrait à l’entreprise une forme de « flexibilité ». Une réponse maintes fois entendue par LeMagIT. L’arlésienne perdure.

Toutefois, depuis trois ans, l’éditeur présente une partie de ses résultats financiers, en signe de bonne foi. « Enfin, c’est au cours de ce (quatrième) trimestre que l’entreprise devrait pour la première fois dégager un flux de trésorerie disponible positif », avance le communiqué de presse qui accompagne la levée de fonds. « Enfin », Databricks est bientôt rentable après onze ans d’existence. 

Il affirme avoir bénéficié d’une croissance de 60 % d’une année sur l’autre au troisième trimestre fiscal 2024 (terminé le 31 octobre). Databricks prévoit de franchir la barre des trois milliards de revenus annuels (une valeur extrapolée actuellement). Sur les plus de 10 000 clients revendiqués, l’éditeur dit en avoir 500 dépensant plus de 1 million de dollars par an sur sa plateforme, contre 300 en septembre 2023.

Cash in, Cash Out

La levée de fonds servira, d’abord, à payer les parts d’une minorité des 7 000 employés de Databricks, et les taxes associées. Selon Financial Times et CNBC, du fait que les premiers salariés de startups non cotées en bourse ont principalement été rémunérés en parts dans l’entreprise, leurs actifs financiers demeurent verrouillés. En fait, soit ils doivent subir un taux d’imposition important ou attendre un nouveau tour de table (ou un rachat ou une introduction en bourse) pour bénéficier de leur capital.

Et d’annoncer que pour « satisfaire les besoins des clients », Databricks investira les fonds en cours de collecte dans des produits d’IA, dans le rachat d’entreprise et dans l’expansion « significative » de ses opérations de mise sur le marché à l’international.

Cette année, Databricks s’est installé dans de nouveaux bureaux à Londres et à Paris – la France (70 % de croissance annuelle) étant, l’un des moteurs de la croissance de l’éditeur en Union européenne – ainsi qu’à Singapour. Il aurait également étendu sa présence en Amérique latine et au Moyen-Orient (notamment en Arabie Saoudite).

Asseoir sa position sur le marché du DwaaS et développer ses capacités d’IA

Depuis 2020, l’éditeur a réalisé un total de dix acquisitions. La plus importante n’est autre que MosaicML, l’éditeur d’une plateforme, consacrée à l’entraînement de modèles d’IA, racheté pour 1,3 milliard de dollars en juin 2023.

Pour autant, la majorité de ces emplettes, dont le rachat d’Arcion en octobre 2023 (100 millions de dollars), ont davantage fait croître ses capacités de gestion de données.

En marge de l’événement Data + AI Summit 2024 en juin, l’éditeur a annoncé l’acquisition de Tabular pour plus d’un milliard de dollars, dont les fondateurs sont considérés comme les auteurs du format de tables ouvert Apache Iceberg – concurrent de Delta, celui de Databricks (aussi papa d’Apache Spark et de MLFlow).

Ali Ghodsi a tôt fait de tenter de dissiper les craintes concernant le devenir d’Iceberg – qui, semble-t-il, a gagné la bataille des formats de tables open source au vu de son adoption par les acteurs du marché, dont AWS. Il n’en reste pas moins que, cette année, la croissance de Databricks a davantage été portée par l’adoption de Databricks SQL. Le service d’entreposage de données serait en train de générer 600 millions de dollars de revenus, soit 150 % de plus que l’année dernière.

En clair, l’éditeur en provenance des traitements big data et des lacs de données gagne du terrain sur le marché du DWaaS (Data Warehouse as a Service) qu’il partage avec Snowflake, Microsoft Azure (OneLake, ex Synapse), Google Cloud (BigQuery), AWS (RedShift), Oracle, ou encore SAP. À titre de comparaison, Snowflake a rapporté qu’au troisième trimestre fiscal 2025 il dénombrait 542 de clients dépensant plus d’un million de dollars dans son produit, et 3,77 milliards de dollars d’ARR.

L’avenir de Databricks se jouera toutefois dans sa capacité à attirer les spécialistes de l’IA et à étendre la prise en charge des grands modèles d’IA, en sus des algorithmes de deep learning et de machine learning déjà déployés par ses clients. Outre l’ambition des dirigeants, les entreprises n’ont pas (selon les cabinets d’analystes tels que Gartner ou Vantana Research) toutes les pièces du puzzle pour maîtriser les déploiements à large échelle.

Pour approfondir sur Big Data et Data lake