denisismagilov - Fotolia
L’IPO peut attendre : Databricks lève 1 milliard de dollars
Databricks a annoncé le 1er février 2021 une levée de fonds de 1 milliard de dollars en série G. Celui qui prône le concept du Lakehouse, la combinaison d’un lac et d’un entrepôt de données est désormais valorisé 28 milliards de dollars.
Cette nouvelle série G est menée par le fonds Franklin Templeton, l’office d’investissement du régime de pensions du Canada, Fidelity Management & Research LLC, Whale Rock, AWS, CapitalG (la filiale VC d’Alphabet, maison mère de Google) et Salesforce Venture.
Les investisseurs existants, dont Andreesen Horowitz, Alkeon Capital Management (Black Rock), Coatue Management, Tiger Global Management et Microsoft ont renouvelé leur soutien financier au cours de ce tour de table. Au total, Databricks a collecté 1,9 milliard de dollars en sept cycles.
« Ils ne sont pas nos investisseurs principaux, mais nous pensons que c’est la première fois que tous les fournisseurs de cloud computing participent dans un tour de table en même temps », se réjouit Ali Ghodsi, PDG et cofondateur de Databricks auprès du MagIT.
Databricks adoubé par les fournisseurs cloud
Ali GhodsiPDG et cofondateur, Databricks
Philosophiquement et stratégiquement, ce n’est pas une surprise. Databricks est l’inventeur et le principal contributeur du moteur de calcul distribué Apache Spark (également soutenu par Facebook, IBM et Netflix). D’abord conçu pour accélérer les traitements sur Hadoop, Spark est devenu l’une des fondations de Delta Lake, une architecture de lac de données cloud dotée d’une couche ACID, proposée en open source et vendue par Databricks.
Delta Lake combine désormais les capacités d’un data lake et d’un data warehouse, ce que l’éditeur a nommé Lakehouse, un concept largement repris par les acteurs de l’industrie, dont Alibaba. Il faut bien comprendre qu’un tel environnement unifié fait les affaires des fournisseurs cités ci-dessus, puisqu’il impose la migration, le stockage et l’analyse des données dans un environnement cloud. Questionné à plusieurs reprises à ce sujet par nos soins, Ali Ghodsi croit dur comme fer à ce modèle de centralisation des données dans le cloud.
« Alimenté par Delta Lake, le Lakehouse est l’architecture idéale pour les organisations qui exploitent des données. Elle s’appuie sur les meilleures qualités des entrepôts et des lacs de données pour offrir une architecture unique pour tous les principaux cas d’usage des données, de l’analytique en temps réel à la BI, la data science et l’IA », répète à l’envi le dirigeant.
Un « placement intelligent » selon les analystes
« La valorisation de Databricks met en évidence la manière dont le marché adopte le cloud », affirme Dave Menninger, SVP et directeur de recherche chez Ventana Research. « En tant que créateurs d’Apache Spark, ils [les fondateurs de Databricks, Ali Ghodsi et Matei Zaharia] ont ignoré les déploiements sur site et se sont concentrés uniquement sur le cloud et je suppose qu’ils avaient raison ».
Dave MenningerSVP, directeur de recherche, Ventana Research
Hyoun Park, PDG et analyste en chef d’Amalgam Insights, considère également que ce cycle de financement comme une marque de confiance dans l’approche de Databricks.
« Ce tour de table reflète la confiance dans la stratégie et les perspectives actuelles de Databricks », renchérit Hyoun Park. « Il est à noter qu’il y a beaucoup de placements intelligents impliqués dans ce cycle, y compris ceux des partenaires tels que Salesforce et Amazon, ainsi que des fonds qui ont une expérience préalable auprès d’acteurs du stockage et du traitement des données ».
Hyoun Park rappelle le contexte de cette opération financière. Les entreprises ont de plus en plus de mal à gérer leurs données volumineuses et variées. L’analyste souligne aussi le fait que l’avenir commercial de Databricks semble tout tracé pour ses investisseurs. Ils entrevoient l’entrée en bourse de l’éditeur qui pourrait avoir lieu dès la fin de l’année.
IPO : Databricks poursuit les préparations
Ali Ghodsi ne fait pas de mystère à ce sujet. « Comme nous l’avons déjà dit, nous prévoyons d’être prêts pour l’introduction en bourse en 2021. Cela [la levée de fonds] ne change rien à cette perspective », rappelle-t-il au MagIT.
Pour autant, le dirigeant ne semble pas réellement pressé de se jeter dans le grand bain boursier, comme l’a fait Snowflake avant lui.
« Un tour de table nous donne pratiquement les mêmes avantages qu’une IPO, mais nous permet de continuer à construire notre entreprise sur le long terme sans avoir à nous soucier de Wall Street », affirme-t-il.
Si l’orientation commerciale est claire, Databricks ne s’épanche pas sur la manière dont il va utiliser les nouveaux moyens financiers à sa disposition. Ali Ghodsi donne tout de même quelques indices sur les prochaines actions du groupe.
« Ces fonds nous permettront d’étendre et de soutenir l’adoption rapide de notre Lakehouse et d’investir dans les technologies émergentes et l’innovation par des activités de fusion et d’acquisition », déclare le PDG.
« Ils nous permettront également d’élargir notre équipe d’ingénieurs, avec une présence aux États-Unis, au Canada, en Europe et en Asie, et dans d’autres zones géographiques ».
Une tendance de fond sur le marché du data lake
Databricks apparaît en réalité comme la figure de proue d’une tendance forte sur le marché du data lake. Le 6 janvier, Starburst a révélé une levée de fonds de 100 millions de dollars pour démocratiser l’utilisation du moteur de requêtes open source Trino SQL, anciennement connu sous le nom de PrestoSQL. Presto peut être perçu sous certains angles comme une alternative à Spark. Starburst a mis au point une plateforme cloud réservée aux entreprises qui les aident à requêter efficacement les lacs de données cloud et les data warehouse reposant sur la technologie SQL.
Toujours le 6 janvier, Dremio a rendu public un financement de 135 millions de dollars pour faire évoluer son moteur de traitement dédié au data lake. Dremio est lui aussi en train de bâtir une plateforme qui recourt à plusieurs projets open source, dont Apache Arrow, pour permettre aux organisations de bénéficier de cette architecture dans le cloud.
À l’horizon, pointe le projet Apache Iceberg, qui compte une communauté croissante d’utilisateurs, dont Netflix, Apple, Expedia et Adobe. Iceberg est également un rival du Delta Engine de Databricks.