Rolandino - Fotolia
Databricks lance un Lakehouse spécifique au retail
Lakehouse for Retail, disponible depuis le 13 janvier, est la première solution analytique spécifique à un secteur développée et commercialisée par Databricks.
Centralisation… et segmentation. Databricks, fondée en 2013 et basée à San Francisco, fournit une plateforme cloud qui permet aux clients d’interroger et d’analyser des données semi-structurées stockées dans son Lakehouse. Derrière ce terme un tantinet commercial se cache une combinaison d’un entrepôt et d’un lac de données, permettant aux utilisateurs de faire des requêtes SQL comme dans un entrepôt de données, mais avec la flexibilité d’un lac de données.
Applications dans le retail
Grâce à Lakehouse for Retail, les clients doivent pouvoir accéder aux données et les interroger à l’aide d’un outil conçu pour relever les défis spécifiques auxquels sont confrontés les enseignes, leurs partenaires et leurs fournisseurs. Il est livré avec ce que Databricks appelle des « accélérateurs », qui sont des schémas ou des templates et des meilleures pratiques pour résoudre certains problèmes.
Parmi ces accélérateurs figurent l’ingestion de données en continu et en temps réel (récupération des données et analyse en temps réel des ventes depuis les POS, gestion des stocks, etc.), la prévision de la demande et des séries temporelles, les recommandations de produits alimentées par le machine learning, ou encore l’analyse de la Customer Lifetime Value (ou valeur à vie du client, correspondant à la somme des profits réalisés tout au long de la relation entre un client et une entreprise).
Comme le suggèrent les accélérateurs, l’un des avantages particuliers de la nouvelle capacité spécifique au secteur sera le gain de temps, selon David Menninger, analyste chez Ventana Research.
« L’un des défis de la plupart des technologies d’analyse de données est qu’il faut beaucoup de travail afin de créer le modèle de données, et les analyses associées pour soutenir un processus métier spécifique », affirme-t-il. « Cette nouvelle offre permettra aux enseignes de la grande distribution et aux e-commerçants d’être plus facilement et plus rapidement opérationnels avec une configuration lakehouse. »
Parmi les premiers utilisateurs de Lakehouse for Retail figurent Walgreens, H & M Group et Restaurant Brands International, selon l’éditeur. L’entreprise a également Danone ou Zalando parmi ses clients, mais elle ne précise pas si ces organisations ont adopté la nouvelle solution.
Luigi Guadagno, vice-président de la pharmacie et de la technologie de la plateforme médicale chez Walgreens, a déclaré dans un communiqué que la nouvelle solution permettra à Walgreens d’éliminer les silos de données et d’unifier les quantités copieuses de données de prescription en un seul endroit, pour l’exploration ainsi que les projets analytiques et de machine learning.
Ali Ghodsi, cofondateur et PDG de Databricks, considère que le développement de Lakehouse for Retail constitue une étape importante, dans la mesure où le fournisseur tente de permettre à ses clients de prendre des décisions fondées sur les données en temps réel.
(Pas tout à fait) comme les autres
Databricks n’est pas le premier éditeur à proposer des solutions analytiques spécifiques à un domaine, mais l’initiative de ce fournisseur est néanmoins significative, selon David Menninger.
SAS, un spécialiste de l’analytique bien connu des entreprises offre des capacités spécifiques à certains secteurs, en proposant des outils conçus spécialement pour une multitude d’applications, notamment l’agriculture, l’éducation, le domaine médical, les sports et les services publics, entre autres. De même, Oracle, qui a fait l’acquisition du gestionnaire de dossiers médicaux électroniques Cerner fin 2021 afin d’étendre sa présence dans le secteur de la santé, offre des capacités d’analyse spécifiques à l’industrie automobile, au gouvernement et à l’éducation, à l’hôtellerie et à la haute technologie, entre autres.
D’autres petits éditeurs se consacrent uniquement à des secteurs spécifiques. Par exemple, Soundcharts offre une plateforme analytique en direction de l’industrie médicale, tandis que Cinelytic et Cinema Intelligence ont développé des solutions pour l’industrie du cinéma.
Snowflake, quant à lui, a récemment lancé un Data Cloud spécifiquement destiné aux services financiers suivi de près par AWS qui a annoncé un partenariat avec Goldman Sachs pour proposer une offre similaire.
Un nouvel entrant
Ce qui est surprenant au lancement de ce Lakehouse spécifiquement destiné aux clients du secteur du retail, c’est que Databricks ait développé et lancé cet outil si tôt, selon M. Menninger.
« Le mouvement de Databricks n’est pas vraiment une surprise, même s’il semble un peu précoce dans l’évolution de l’entreprise », remarque-t-il.
Sous sa forme actuelle, Lakehouse for Retail laisse apparaître une certaine jeunesse.
David MenningerAnalyste, Ventana Research
Les accélérateurs correspondent en réalité à des cas d’usage génériques présentés sous la forme de démonstrateurs. Ils sont intégrés dans des notebooks accessibles depuis Workspace, l’espace collaboratif de la plateforme de Databricks. Dans les notebooks, la plupart des cas d’usage, algorithmes, pipelines d’ingestion de données sont « cablés » pour les services Azure, mais il est aussi possible de les déployer sur AWS et GCP. En plus de partager son savoir-faire en matière de data engineering, Databricks compte miser sur le partage de données ouvertes.
Toutefois, l’acteur semble préférer mettre en place les tuyaux plutôt que de se risquer à jeter un œil sur les données de ses clients. Mais il est bon de noter que Databricks s’est ouvert aux analystes métiers, alors que sa plateforme a d’abord été pensée pour les ingénieurs et les data analysts. En outre, l’éditeur n’oublie pas de mentionner ses partenaires Capgemini, Deloitte et Tredence qui peuvent aussi valoriser leurs expériences dans ce domaine.
« Cependant, depuis le début, Databricks s’est concentré sur le long terme, en se positionnant là où ses responsables pensent que le marché se dirige, et pas seulement là où il se trouve aujourd’hui. La véritable question sera de savoir s’il s’agit d’une opération ponctuelle ou si elle reflète une nouvelle stratégie d’entreprise. »
Outre le fait d’avoir levé 1,6 milliard de dollars en août dernier, Databricks a recruté Andy Kofoid, ex-président Amérique du Nord de Salesforce, mais surtout ancien responsable des segments Marketing Cloud, Retail & Consumer Goods et B2B/B2C Commerce. Hormis la volonté d’asseoir une nouvelle « catégorie » avec le Lakehouse, Ali Ghodsi avait donc bien l’intention de poursuivre les efforts vers ce marché du commerce BtoC.
Dans un communiqué de presse, Databricks évoque Lakehouse for Retail comme le « premier Lakehouse destiné à une industrie », laissant entendre qu’il multipliera les initiatives en direction de différents domaines. Il n’a toutefois pas confirmé l’information ou détaillé sa feuille de route en la matière.