sdecoret - stock.adobe.com

Salesforce Hyperforce et la résidentialité des données (entretien)

Srinivas Tallapragada, chief Engineering officer chez Salesforce, revient pour LeMagIT sur les éléments clés de l’architecture cloud Hyperforce du géant du CRM. Outre la gestion de la « résidentialité » des données, le responsable évoque l’importance des technologies open source et les efforts du groupe pour prendre en charge l’IA générative.

Srinivas « Srini » Tallapragada est président et chief Engineering Officer chez Salesforce. Il est responsable de la plateforme, des applications, de la disponibilité de service et de la sécurité des solutions Salesforce. L’homme qui travaille pour le géant du CRM depuis douze ans est l’un des architectes en chef d’Hyperforce et de Data Cloud. Avec LeMagIT, il est revenu il y a deux semaines sur les fondements d’Hyperforce, une architecture censée réunir l’infrastructure de plusieurs « Clouds » Salesforce, à savoir des applications telles que Commerce Cloud, Sales Cloud ou encore Marketing Cloud. Il s’exprime notamment sur la gestion de la confidentialité des données et la sécurité de cette architecture sur laquelle « plus de 80 % » des clients de Salesforce auraient migré. Selon l’intéressé, la « résidentialité » des données (c’est-à-dire la possibilité de choisir la région cloud dans laquelle les données sont stockées et traitées) ainsi que la gestion externalisée des clés de chiffrement couvrent 95 % des besoins des clients.

Néanmoins, pour certains pays et secteurs régulés, Salesforce étudie (encore) le moyen de proposer des solutions légales qui protégeraient ses clients des effets des lois extraterritoriales. Cette réflexion germait déjà au lancement en disponibilité générale d’Hyperforce, en 2022.

Srini Tallapragada revient également sur les choix techniques concernant l’architecture de données « Data Cloud » de Salesforce, ainsi que les ambitions techniques du groupe en matière d’IA générative.

LeMagIT : Quelles sont les raisons qui expliquent la naissance d’Hyperforce ?

Srini Tallapragada, Salesforce

Srinivas Tallapragada : Je pense que nous avons été le premier fournisseur de cloud il y a 20 ans. Quand nous avons commencé, il n’y avait pas d’hyperscalers. Nous construisions nos propres centres de données, mais nous ne vendions jamais notre infrastructure. Nous ne vendions que la couche applicative. Nous avons toujours fait abstraction de cela pour nos clients. Et nous le faisions dans le monde entier. Au fil du temps, nous nous sommes rendu compte que ces fournisseurs de clouds publics investissaient beaucoup dans leurs infrastructures. Aussi le monde est devenu de plus en plus compliqué. Nous savions qu’un grand nombre de pays allaient adopter des lois sur la résidentialité des données. Dans un grand pays comme la France, nous pouvions investir dans un grand centre de données, mais pour les petits pays, cela devient un problème.

Le monde évolue, tout comme la technologie, et avec l’essor des données que nous anticipions, nous avons ressenti le besoin de renforcer la sécurité, la protection de la vie privée et la conformité. C’est en tenant compte de ces exigences et s’appuyant sur différents fournisseurs de cloud que nous avons lancé Hyperforce, notre nouvelle couche transversale. Elle garantit la conformité, la gestion de la résidentialité des données, et nous a également permis de repenser et de reconstruire notre plateforme. Nous avons revu toute notre architecture de données, incluant nos produits traditionnels et notre « Data Cloud », ce qui nous a permis de nous orienter vers l’IA et d’intégrer toutes nos applications. Après plusieurs années d’efforts, plus de 80 % de nos clients sont désormais sur Hyperforce, et à mesure que nous continuons à migrer nos clients, notre objectif est de progressivement fermer nos centres de données « first party ».

La souveraineté, un enjeu dans 5 % des cas, selon Srini Tallapragada

LeMagIT : Ce rythme de migration est-il le même en France ?

Srini Tallapragada : Oui, en France, nous avons déjà beaucoup de clients sur Hyperforce et un bon nombre d’entre eux adoptent Data Cloud. Et nous sommes en train de migrer les plus grands clients vers la plateforme.

LeMagIT : En France, certaines entreprises sont réticentes à migrer les données personnelles de leurs clients et leurs informations commerciales vers le cloud. D’autres sont sensibles à la notion de cloud de confiance, un cloud souverain au sens strict du terme. Comment répondez-vous au besoin de ces entreprises ?

Srini Tallapragada : J’étais en France il y a un mois pour y rencontrer bon nombre de nos clients. Je ferai une réponse en trois parties.
Premièrement, beaucoup d’entreprises veulent la résidentialité des données, surtout pour les données des consommateurs. C’est ce que nous proposons.

Deuxièmement, la sécurité des données passe en grande partie par leur chiffrement. Nous chiffrons toutes les données au repos et en transit, mais nous gérons, par défaut, les clés pour nos clients. Ils ont également la possibilité de gérer ces clés que nous hébergeons et s'ils le souhaitent, ils peuvent conserver les clés de chiffrement par leurs propres moyens sans que nous puissions y accéder (en mode BYOK).

Troisièmement, certains clients ne veulent pas uniquement la résidentialité des données et la gestion des clés de chiffrement, mais une entité légale qui leur assure une forme de souveraineté. Nous essayons de comprendre leur motivation, afin de savoir s’il s’agit d’un réel enjeu pour eux ou si cela découle d’une inquiétude concernant la consultation de leurs données par des tiers.

Jusqu’à présent, nous considérons que la combinaison de la résidentialité des données et d’une gestion des clés de chiffrement externe à la plateforme Salesforce couvre 95 % des cas. Pour les 5 % restants, nous discutons avec les clients concernés, en provenance des marchés les plus réglementés.

« Jusqu’à présent, nous considérons que la combinaison de la résidentialité des données et d’une gestion des clés de chiffrement externe à la plateforme Salesforce couvre 95 % des cas ».
Srini TallapragadaChief Engineering Officer, Salesforce

C’est particulièrement le cas en France, qui est un marché important pour nous. Nous avons essayé de trouver des solutions techniques et nous essayons de comprendre s’il faut intégrer l’aspect juridique, et si c’est le cas, comment le faire.

LeMagIT : Quels clouds animent Hyperforce ?

Srini Tallapragada : Hyperforce est une couche à plusieurs substrats que nous tentons d’abstraire. Historiquement, la promesse de Salesforce est incarnée par l’un des premiers logos de l’entreprise : « no software ».

Soit dit en passant, j’ai eu beaucoup de mal à recruter des ingénieurs dans les écoles supérieures à cause de ce logo : les futurs ingénieurs passaient devant mon stand sans même s’arrêter (rire).

Ce que nous entendons par là, c’est ce que nous gérons toutes les complexités techniques pour nos clients.

Hyperforce est donc la couche que nous avons développée pour gérer cette complexité. Actuellement, elle prend en charge nos data centers « first party », et la majorité de nos charges de travail sont sur AWS. Nous explorons également différents fournisseurs d’infrastructure, avec pour objectif d’abstraire cette couche. Ainsi, si un client (comme certains commerçants qui considèrent AWS comme un concurrent) exprime des préoccupations, nous pouvons lui offrir une solution. Pour l’instant, ces clients sont hébergés sur notre infrastructure interne, mais à long terme, nous prévoyons de prendre en charge d’autres fournisseurs.

La question clé est de savoir dans quelle mesure les clients se soucient de ces détails. Ils préfèrent généralement que nous gérions tout, que ce soit l’infrastructure, les modèles, les LLMs ou d’autres technologies. Notre engagement envers les clients est qu’ils peuvent se concentrer sur la valeur ajoutée pour leur entreprise, tandis que nous nous occupons de l’infrastructure.

Dans mes discussions avec les DSI, les CEO et les CTO, je suis rarement interrogé sur les détails des changements de version ou des certifications.

LeMagIT : Vous évoquez la résidentialité des données. Qu’en est-il de la résidentialité des traitements ?

Srini Tallapragada : C’est un bon point à éclaircir. Quand nous parlons de résidentialité des données, cela englobe également les calculs : les données, même pour les traitements, ne quittent jamais le périmètre défini par le client. Tout est pris en compte.

« Quand nous parlons de résidentialité des données, cela englobe également les calculs : les données, même pour les traitements, ne quittent jamais le périmètre défini par le client ».
Srini TallapragadaChief Engineering Officer, Salesforce

L’open source au cœur de la machine Salesforce

LeMagIT : Quelles technologies sont utilisées sous le capot pour propulser Hyperforce ?

Srini Tallapragada : Nous avons toujours affirmé que les données de nos clients ne font pas partie de nos produits. Elles sont toujours accessibles et intégrables. Si Salesforce n’était qu’une simple application, elle aurait pu être facilement remplacée. Ce que beaucoup ne réalisent pas, c’est que nous offrons une plateforme ouverte, permettant aux clients une grande liberté d’action.

Sous le capot, nous nous appuyons sur des technologies open source. Lors de la création d’Hyperforce, dès le départ, nous avons utilisé des technologies comme des systèmes de stockage de blobs ouverts, ou Iceberg pour la gestion des tables. Notre base de données transactionnelle est basée sur PostgreSQL, et nous utilisons Kubernetes pour les conteneurs, ainsi qu’Istio et l’architecture Service Mesh pour la communication interprocessus. Nous faisons appel à Apache Kafka pour la gestion des messages.

Dans tous ces domaines, deux points ressortent. D’abord, nous sommes de fervents utilisateurs de l’open source, et nos ingénieurs figurent souvent parmi les principaux contributeurs, car nous croyons en l’importance de redonner à la communauté. Nous utilisons, améliorons et partageons ces technologies.

Cela nous permet de garantir une évolutivité optimale. Chez Salesforce, nous avons une plateforme unique qui s’adapte aussi bien aux petites entreprises qu’aux grandes multinationales et aux industries réglementées. Nous avons une seule base de code, ce qui nous permet de déployer des mises à jour régulières et uniformes pour nos 300 000 clients.

Par exemple, il y a quatre ans, nous avons imposé l’authentification multifacteur (MFA) à nos clients, même s’ils étaient réticents (nous étions parmi les premiers à le faire il y a quatre ans), car notre priorité est de les protéger. Nous voulons qu’ils se concentrent sur leur activité, sans se soucier de la sécurité, qui est notre responsabilité.

Avec Hyperforce, nous offrons une solution à grande échelle, que j’appelle la couche de confiance, incluant l’authentification, l’autorisation, la surveillance, et même l’optimisation des performances. Tout cela grâce à l’intégration de l’IA (plus particulièrement de l’AIOps), ce qui assure à nos clients un service fiable et sécurisé.

LeMagIT : Pouvez-vous expliciter les choix techniques de Salesforce concernant Data Cloud ?

Srini Tallapragada : Dès le début, nous avons identifié deux défis principaux.
Le premier est que la quête d’une vue à 360 degrés des données a toujours été difficile. Pendant 25 ans, beaucoup d’entre nous ont essayé de réaliser ce concept, mais les technologies de l’époque avaient leurs limites. Les entreprises ont testé plusieurs approches, notamment les entrepôts de données et, plus tard, les lacs de données avec l’avènement du cloud public. Bien que ces lacs aient permis de centraliser les données, leur utilisation quotidienne reste souvent limitée pour les équipes marketing ou métiers.

Deuxième défi, la nouvelle génération d’entrepôts de données – bien qu’elle ait résolu certains problèmes en séparant le stockage du calcul – a introduit des formats propriétaires, verrouillant les données dans des systèmes fermés.

C’est pourquoi nous avons choisi une approche radicalement ouverte dès le départ. Nous avons opté pour des formats de stockage et de table ouverts, tels que Parquet et Iceberg, permettant une fédération des requêtes et créant ainsi ce que nous appelons l’alliance zéro copie. Cette technologie sous-tend la création du Data Cloud, une plateforme de données active, évolutive, flexible et ouverte, capable de libérer les silos de données et de générer des indicateurs exploitables, qu’ils soient structurés ou non.

Cette approche a séduit des partenaires comme Workday, car elle permet de préserver les investissements existants tout en débloquant la valeur des données piégées.

En outre, nous avons rapidement compris que la révolution de l’IA générative repose sur le contexte, les requêtes et l’ancrage. Pour déployer un système RAG (retrieval-augmented generation), une entreprise a besoin d’exploiter ces propres données. Il est donc essentiel que ces données soient dans des formats ouverts et accessibles de manière fédérée, car c’est le contexte que vous devez fournir. Cela relie, par exemple, notre couche Hyperforce à notre couche de données. La couche de données Data Cloud, elle, est liée à notre couche RAG, qui, elle-même, se connecte à notre couche d’IA. De plus, il est important d’avoir des API pour accéder à tous ces agents.

Cela offre une interopérabilité totale sans obliger les entreprises à tout reconstruire. Notre mission est de faciliter le travail de nos équipes et de nos clients en leur fournissant des technologies ouvertes, flexibles et prêtes à l’emploi. Tout est interconnecté pour atteindre cet objectif.

IA générative : des prompts prêts à l’emploi

LeMagIT : Quels sont les éléments prioritaires sur la feuille de route de Salesforce ?

Srini Tallapragada : Tout le monde souhaite avoir une entreprise propulsée à l’IA. Je pense que la clé réside dans la collaboration entre les humains et l’IA pour générer le succès client. Chaque client et chaque entreprise aspire à cela. Pour y parvenir, il est essentiel d’optimiser la couche de données, car c’est ce qui en est le moteur.

En ce qui concerne la couche d’IA, je pose souvent cette question : « Combien d’entre vous ont utilisé ChatGPT la semaine dernière ? » En général, tout le monde lève la main. Puis, je demande : « Et au cours du mois dernier ? » Environ la moitié des personnes lèvent alors la main. Mais quand je demande : « Qui l’a utilisé aujourd’hui ? », presque personne ne réagit, car il peut être fatigant de taper des requêtes détaillées à chaque fois.

Ce que je constate, c’est que les clients veulent des prompts prêts à l’emploi intégrés dans leurs flux de travail. Lorsqu’ils répondent à un cas, ils souhaitent simplement avoir un bouton pour résumer les informations.

« Ce que je constate, c’est que les clients veulent des prompts prêts à l’emploi intégrés dans leurs flux de travail ».
Srini TallapragadaChief Engineering Officer, Salesforce

L’avantage que nous avons est que nous comprenons vraiment les tâches à accomplir pour tous ces rôles dans 13 secteurs différents. Nous sommes en train de créer de nombreux prompts prêts à l’emploi, dont beaucoup peuvent être mis en place en 15 minutes. Si vous utilisez Salesforce, vous pouvez les activer et générer immédiatement des résultats. Ensuite, il y a ce que nous appelons les étapes « avancées ». Il s’agit d’éditer des prompts personnalisés, car vous pourriez vouloir réaliser une action spécifique. Cela reste fidèle à la plateforme que nous avons développée, permettant aux utilisateurs d’obtenir une valeur ajoutée rapidement.

Nous travaillons également au développement de « copilotes », des outils qui répondent aux questions ouvertes des employés. Puis il y a les agents accessibles par les clients de nos clients. Auparavant, il s’agissait de bots, qui avaient leurs limites. Cette prochaine génération (les agents) doit également être soigneusement gérée. Là encore, nous devons nous assurer que nos clients obtiennent une valeur maximale très rapidement grâce à des prompts prêts à l’emploi, tout en leur permettant de personnaliser leurs besoins.

Concernant les agents, les utilisateurs seront un peu plus prudents, même si nous avons mis en place de nombreuses protections. Ils veulent s’assurer qu’ils ne commettent pas d’erreurs.

En résumé, une grande partie de notre travail futur consiste à garder notre plateforme ouverte, à intégrer de plus en plus de partenaires dans notre alliance zéro copie, car les clients veulent utiliser Workday, Oracle Financials, etc. L’autre aspect est de soutenir les usages de l’IA avec plusieurs modèles et solutions pour aider les clients dans leur parcours, en tenant compte de leurs différences. Certains sont plus audacieux, d’autres, plus conservateurs, en fonction des cas d’usage. C’est là que se concentrent la plupart de nos investissements en cours.

Pour approfondir sur Gestion de la relation client (CRM)

Close