SAP infuse la gouvernance et l’IA générative dans Datasphere
SAP a présenté de nouvelles fonctionnalités dans SAP Datasphere pour aider les clients à mieux gérer leurs environnements, leur gouvernance, leur modélisation de données. Bien qu’intéressantes, ces capacités ne résolvent pas les problèmes organisationnels au sein des entreprises, considèrent les analystes.
Présentées hier lors de l’événement virtuel SAP Data Unleashed, ces fonctionnalités ajoutent la modélisation des données, la gouvernance des données et l’IA générative (GenAI) à la plateforme accessible à la demande (as a service) Datasphere.
Datasphere est le fruit du renommage l’année dernière de SAP Data Warehouse Cloud (DWC). Une opération que SAP a justifiée par les évolutions apportées au produit ces quatre dernières années. Datasphere peut gérer et traiter les données provenant de sources diverses à travers l’organisation dans un environnement unifié. Datasphere se déploie depuis la SAP Business Technology Platform (BTP), une PaaS que l’éditeur allemand interconnecte avec son ERP.
L’une des priorités des entreprises aujourd’hui est la mise en œuvre d’une stratégie holistique en matière de gouvernance et de traitement de données. Problème, c’est aussi un défi majeur, avance Juergen Mueller, directeur technique de SAP, lors de l’événement SAP Data Unleashed.
Data fabric, graphe de connaissances et IA générative
« Il est temps de mettre en place la bonne architecture de données qui vous permettra de gérer des ensembles de données volumineux sans redondance de données, d’obtenir des informations précieuses et de prendre des décisions fondées sur les données à grande échelle, sans reconstruire la sémantique que vous avez déjà dans votre système SAP », avance Juergen Mueller.
Pour relever ces défis, SAP introduit les capacités suivantes dans Datasphere :
- SAP Datasphere Knowledge Graph, qui permet aux entreprises de modéliser les données de tous les systèmes, y compris les informations sémantiques de l’entreprise. Il s’agit de relier les relations entre les données, les métadonnées et les processus de gestion. L’objectif est de découvrir des modèles et des informations cachées dans les données et de fournir du contexte pour les applications GenAI (entre autres).
- Les fonctions d’analytique et de planification de SAP Analytics Cloud (SAC), un outil de BI SaaS successeur de Business Objects, incluront l’assistant GenAI Joule de SAP pour aider les utilisateurs à créer des tableaux de bord ou des modèles de planification.
- Une capacité « compas » dans SAC, pour aider à exécuter des simulations qui peuvent prendre en compte des milliers de variables dans une expérience conversationnelle autoguidée. Par exemple, les organisations peuvent utiliser la fonctionnalité de la boussole pour examiner les prédictions des scénarios commerciaux et ajuster continuellement les variables contrôlables afin de trouver le plan optimal.
- L’extension du partenariat avec l’éditeur belgo-américain de solutions de gouvernance de données Collibra, pour créer des catalogues de données permettant d’avoir un œil sur l’inventaire, la provenance et la qualité globale des données, ainsi que sur l’identité de leur créateur.
Les nouvelles fonctionnalités sont actuellement en préversion privée pour certains clients.
Un écosystème de données ouvert
SAP aurait pris la bonne direction en mettant l’accent sur un écosystème de données ouvert et une couche sémantique au-dessus de toutes les sources avec Datasphere, considère Doug Henschen, analyste chez Constellation Research.
Doug HenschenAnalyste, Constellation Research
Les systèmes partenaires de SAP, notamment Collibra, Databricks, Google BigQuery et Snowflake, ont été intégrés dans la Datasphere d’un client, et SAP utilise désormais la compréhension contextuelle de ses applications et des objectifs commerciaux de ses clients pour alimenter la recherche vectorielle, le Knowledge Graph et la GenAI, poursuit l’analyste.
« Les clients de SAP me disent que l’architecture de type “data fabric” de Datasphere leur donne la flexibilité d’accéder à tout ce dont ils ont besoin dans le cloud sans avoir à déplacer ou à répliquer les données à grands frais », affirme l’analyste.
Selon une étude de GigaOm de mars 2024 commandée par SAP, l’architecture « Data Fabric » permettrait d’économiser 138 % du coût total de possession par rapport à un déploiement « DIY ». Là où un gros déploiement de la Data Fabric de SAP coûterait 8,5 millions de dollars, une implémentation spécifique avec des outils tiers reviendrait à plus de 20 millions de dollars. Ces chiffres sont bien évidemment à prendre avec des pincettes, puisque GigaOm ne précise pas quelles sont les solutions concurrentes ou les méthodes « maison » évaluées.
Toutefois, la qualité des données est une question distincte d’intégration et de préparation des données, que SAP peut traiter avec ses technologies d’intégration accessible depuis la BTP, signale Doug Henschen.
« SAP Datasphere doit favoriser l’accès aux données, ce qui permet aux départements d’exploiter toutes les données au sein de l’entreprise », commente-t-il. « La plateforme fournit des moyens de créer des places de marché de données et d’appliquer le concept de data mesh, c’est-à-dire d’unifier les méthodes de gouvernance et de traitement des données à travers des entités commerciales distribuées ».
Joshua GreenbaumDirecteur, Enterprise Applications Consulting
Il est important que SAP continue à poser les bases d’une gestion et d’une gouvernance des données de qualité, déclare Joshua Greenbaum, directeur chez Enterprise Applications Consulting.
« En effet, les problèmes liés aux données désordonnées et aux mauvaises stratégies de gestion sont un fléau qui affecte tous les aspects de la transformation de l’entreprise, dont le déploiement des fonctionnalités avancées de l’IA », insiste-t-il.
Un problème organisationnel plus qu’un sujet totalement technique
Pour cette raison, les modules en préversion de Datasphere arrivent à point nommé. Toutefois, SAP est confronté aux obstacles dans sa base installée en raison de la présence de produits concurrents, ainsi que de l’existence toujours répandue de silos et d’une gestion décentralisée des données, indique-t-il.
« L’essentiel du problème réside dans la gestion du changement, qui est tout aussi important sinon plus que l’absence d’une bonne technologie », nuance Joshua Greenbaum. « Si l’on règle ce dernier problème sans s’attaquer au premier, la technologie sera perçue comme la seule responsable de ces problèmes ».
« Le passage à la structure de données et à SAP Datasphere peut présenter des défis tels que l’intégration des systèmes et le perfectionnement de la main-d’œuvre, mais il promet d’améliorer la gestion des données et la prise de décision », résume pour sa part Gigaom. « Les principaux obstacles sont la complexité de l’intégration, la gestion du changement et la préservation du contexte des données pour garantir des analyses pertinentes ».