pavlofox - stock.adobe.com

Databricks tire le bilan de sa présence en France

Databricks veut asseoir sa présence en Europe. La France prend une place toute particulière dans le dispositif de l’éditeur qui souhaite étendre ses relations avec les grands industriels et convaincre les startups les mieux dotées dans une période propice à la réduction des coûts.

Databricks compte étendre sa présence dans plusieurs pays en Europe, en agrandissant son bureau londonien et en ouvrant de nouveaux bureaux à Munich, Tel Aviv, Zurich et Stockholm.

« L’équipe EMEA de Databricks a augmenté de 75 % au cours de la dernière année fiscale et l’entreprise prévoit de dépasser les 1 000 employés dans la région dans les mois à venir », précisent les porte-parole du concurrent de Snowflake dans un communiqué.

Installé depuis trois ans et demi en France, le spécialiste du lakehouse compterait plus de « 200 clients » sur ce territoire sur un total de 9 000.

Parmi ses clients français, Databricks affiche les logos de la SNCF, Colas, Michelin ou encore TotalEnergies.

« Nous travaillons avec plus de 50 % du CAC40 », assure Guillaume Brandenburg, Regional VP Southern Europe MEA chez Databricks auprès du MagIT, lors de l’événement Lakehouse Day du jeudi 30 mars 2023 à Paris. Pour Databricks, la France est le troisième moteur de sa croissance en Europe, avec l’Allemagne et le Royaume-Uni.

« Les startups en Europe et en France font partie des plus gros usagers du cloud. Notre volonté, c’est d’adresser ce marché mieux que l’on pouvait le faire jusqu’à présent. »
Guillaume BrandenburgRegional VP Southern Europe MEA, Databricks

En France, une centaine de collaborateurs assurent le suivi commercial et technique chez Databricks. D’ailleurs, Databricks cherche à engager une douzaine de collaborateurs à Paris, principalement des ingénieurs solutions.

Databricks a également une présence auprès des startups. L’éditeur souhaite étendre ses relations avec les licornes et les jeunes sociétés à forte croissance.

Pour cela, il a mis en place une équipe nommée Velocity censée répondre aux besoins de ces pépites. Databricks cible certains de ces acteurs qui ont déjà une empreinte conséquente sur le cloud. « Les startups en Europe et en France font partie des plus gros usagers du cloud. Notre volonté, c’est d’adresser ce marché mieux que l’on pouvait le faire jusqu’à présent », indique Guillaume Brandenburg.

En outre, l’entreprise s’est entourée de 35 partenaires, des ESN et d’autres éditeurs. Parmi ceux-là, Open Value, Datasentics (filiale d’Atos) et Cellenza étaient sponsors de l’événement Lakehouse Day. Elle aurait formé ou certifié la formation de 1 400 consultants en France.

Une présence importante chez les industriels français

Selon la communication de l’éditeur, il s’adresse à toute taille de clients dans tous les secteurs. Néanmoins, en Europe et plus particulièrement en France, l’éditeur a davantage de succès auprès des « industriels », rapporte Guillaume Brandenburg. « Dans la catégorie industrielle, j’inclus les acteurs du manufacturing, de la logistique, de la supply chain, mais aussi de l’énergie », ajoute le responsable.

Les cas d’usage de ces grands groupes visent à transformer, visualiser et à prédire des indicateurs clés qui sont de plus en plus utilisés dans les prises de décisions.

« Les données ont beaucoup été utilisées a posteriori. Désormais, les entreprises veulent anticiper, voire envisager différents scénarios, en utilisant des informations qui, historiquement, résidaient dans des silos », avance Guillaume Brandenburg.

Lors du Lakehouse Day, des clients comme SNCF et Michelin évoquent en premier des usages d’accélération de données en batch afin de visualiser les données. Les projets les plus avancés visent à prédire les évolutions des activités ou à mettre en place des technologies de deep learning.

Optimiser le modèle opérationnel… et les coûts de la plateforme

« En ce moment, peu importe les services utilisés sur notre plateforme, la tendance est à l’optimisation du modèle opérationnel, de la consommation d’énergie, des coûts ainsi qu’aux prédictions financières et à la démocratisation des données », évoque Guillaume Brandenburg.

Une phase d’optimisation qui s’applique également à la plateforme de Databricks. « Cette année en particulier, ils ont des ambitions de réduction de coût importantes. Cela fait partie du jeu », estime le responsable. « Un de mes grands clients me disait la semaine dernière que si nous n’optimisons pas les coûts, notre plateforme n’aurait plus de pertinence économique pour le cas d’usage. Nous avons un devoir de conseil et d’accompagnement ».

Dans certains cas, l’incertitude ambiante pousse les clients à ne plus s’engager à long terme.

« Nos clients sont aujourd’hui moins enclins à prendre des risques sur le futur. Ils s’engagent moins ou moins longtemps et s’appuient de plus en plus sur nos services à la demande », remarque le Regional VP SEMEA.

L’autre grand sujet, pour les clients de Databricks, gravite autour de sa brique de gouvernance, Unity Catalog. « Il n’y a pas un rendez-vous client où l’on n’évoque pas le sujet de la gouvernance et de la confidentialité des données », évoque le responsable.

C’est le cas de la branche TGV-Intercités de la SNCF Voyageurs qui s’interroge sur l’intégration de sa solution de data cataloging, DataGalaxy, avec Unity Catalog. « Cela permettrait d’avoir le lineage de tous les traitements Spark que nous avons dans Databricks », envisage Régis Kergoat, Architecte Data chez SNCF Voyageurs. C’est également une réflexion en cours chez Colas.

En reflet de cette empreinte auprès de grands groupes, Databricks a annoncé récemment un partenariat avec SAP dans le cadre de DataSphere, un renouvellement de l’offre SAP Datawarehouse Cloud. Cette annonce n’a pas encore beaucoup d’écho chez les clients français, mais Guillaume Brandenburg voit déjà un certain intérêt chez les prospects espagnols.

Le control plane de Databricks débarque sur AWS France

 Les clients français, eux, réclameraient un meilleur contrôle de la résidentialité des données sur la région cloud d’AWS France. Ainsi, Databricks a annoncé la disponibilité de son infrastructure sur cette région au cours du 1er semestre 2023.

« Il était déjà possible d’utiliser les fonctions de stockage de Databricks dans la région AWS France », précise Guillaume Brandenburg. « Cette annonce confirme surtout qu’il sera possible d’isoler les traitements sur cette région ».  

Pour rappel, la plateforme de Databricks permet de positionner le data plane derrière le VPC d’un client, mais le control plane, la couche de service et le pool de calcul sont situés dans un tenant maîtrisé par l’éditeur. Ce qu’il promet de faire, c’est de positionner des instances de calcul dans les data centers français d’AWS.

Outre l’évocation de notions de conformité – pour rappel, peu importe où se trouve le data center, un cloud états-unien est toujours soumis aux lois extraterritoriales de ce pays –, il s’agit essentiellement d’améliorer les temps de latence.

De fait, Databricks vante les capacités quasi-temps réel de sa plateforme, mais ce n’est pas encore le cas d’usage le plus commun chez les clients du groupe. La réfection d’Apache Spark devrait aider l’éditeur à multiplier les projets. Avant cela, ce sont les utilisateurs de Delta Live Table qui devraient bénéficier de la proximité des données et des workloads. L’outil peut servir à pousser ou à transformer des données de streaming.

Pour approfondir sur Big Data et Data lake