New Africa - stock.adobe.com

Comment Saint-Gobain motorise la recherche de matériaux dans ses enseignes

Sa filiale française spécialisée dans la distribution de matériaux déploie pour ses vendeurs un moteur de recherche établi sur la technologie de Sinequa. Un projet qui a connu plusieurs phases depuis 2018 et dont le déploiement se poursuivra encore en 2023.

Le groupe Saint-Gobain est présent dans 75 pays et comptabilise 166 000 collaborateurs. En 2021, il a réalisé un chiffre d’affaires de 44 milliards d’euros.

Sa filiale Saint-Gobain Distribution Bâtiment France (SGDB France ou SGDBF), elle, regroupe 24 marques, dont Point P, distributeur de matériaux bien connu en France, La Plateforme du Bâtiment, CEDEO (sanitaire-chauffage-plomberie), PUM (tuyauterie, évacuation d’eau) ou encore Asturienne (toitures). SGDB France compte plus de 15 entrepôts logistiques pour 2 000 points de vente. Elle emploie 24 000 collaborateurs.

Ses clients sont majoritairement des artisans, des PME et des TPE, tandis qu’une plus petite portion de particuliers et de grands groupes font appel à ses services.

Sur son site Web, le groupe présente une répartition des ventes par marché. Il réaliserait 34 % de son chiffre d’affaires dans la construction neuve, 53 % dans la rénovation, et 13 % dans l’industrie. SGDB France réalise une part plus importante de son CA dans la rénovation.

Moderniser l’expérience de vente

Du côté système d’information, habituellement, le groupe Saint-Gobain gère les plateformes et les infrastructures sous-jacentes. Les DSI des filiales se chargent généralement de l’implémentation et du support des applicatifs métiers.

Dans le cas de SGDB France, la situation est légèrement différente. « Dans notre métier, la réactivité est très importante », note Claudio Borlo, DSI de Saint-Gobain Distribution Bâtiment France. « Quand quelque chose manque, il faut intervenir rapidement. Comme le groupe est international, les communications entre le centre et la périphérie peuvent ralentir les déploiements ».

Les besoins très spécifiques de la filiale l’ont poussé à internaliser « beaucoup de compétences ». « Notre DSI est assez conséquente : nous avons plus de 260 personnes et des compétences clés très proches du métier. Elle peut être considérée comme un fournisseur interne », rapporte Claudio Borlo.

En 2017, le groupe a lancé un projet de refonte de ses systèmes de vente en magasin. Dans ce cadre, l’une des briques essentielles pour SGDB France n’était autre qu’un moteur de recherche interne.

Comme les utilisateurs finaux sont des vendeurs présents au comptoir des agences, il fallait que ces recherches puissent se faire simplement, qui plus est dans un vocabulaire technique. SGDB France souhaitait également assister ces vendeurs dans les actes de conseil et de vente. Pour certains produits, cela signifie proposer automatiquement les accessoires nécessaires à leur installation, ou des alternatives si un produit est indisponible. Dans d’autres cas, il s’agit de proposer des produits subsidiaires.

 « Nous avons plus de 4 millions de clients, plus de 2 millions de produits », indique Claudio Borlo.

Au vu du nombre de produits et d’agences, le nombre de combinaisons possible « est énorme ». « Cela représente environ 4 milliards de lignes, sans compter les doublons. Il nous fallait un moteur de recherche performant. Nous n’avions pas de solutions pour gérer efficacement les croisements de données », rapporte Claudio Borlo.

Après une étude de marché réalisée entre 2017 et 2018, le choix de la DSI s’est porté sur Sinequa, un moteur de recherche sémantique d’origine française.

« Sinequa a été considéré comme une solution avant-gardiste », déclare le DSI de SGDB France.

Le moteur de recherche a été intégré à un ERP. Les utilisateurs y accèdent à travers une couche UI Web, « facile d’utilisation ». « Cela permet une navigation transverse entre les agences », explique Claudio Borlo.

Un moteur de recherche modelé sur les besoins des métiers

 « Il ne s’agit pas seulement d’afficher un code produit, mais aussi de montrer son image pour visualiser les produits », relate le DSI. « Surtout, la recherche est contextualisée : le moteur affiche les produits disponibles dans une agence ou qu’une agence peut vendre ».

« Surtout, la recherche est contextualisée : le moteur affiche les produits disponibles dans une agence ou qu’une agence peut vendre. »
Claudio BorloDSI de Saint-Gobain Distribution Bâtiment France

Au lancement du projet, à l’aide de son partenaire intégrateur SWORD, la filiale de Saint-Gobain a choisi de personnaliser un algorithme nommé Apriori, afin de réaliser les recommandations de produits. Cet algorithme permet d’établir un score de confiance concernant des associations de données. Pour ce faire, SWORD a indexé deux années d’historique de bons de commande dans le but de repérer les produits ou les types de produits généralement achetés ensemble. Au vu du volume de données (60 millions de documents), le partenaire a calculé une distribution sur l’index et a filtré les associations les moins pertinentes.

Il a fallu également affiner la pertinence de la recherche. La filiale de Saint-Gobain souhaitait permettre à ses vendeurs de rechercher des données « plein texte » (libellé de l’article, code, nomenclature, marque, etc.), ainsi que des critères numériques (fréquence ou nombre de ventes), temporels (récence de vente) et binaires (marque du distributeur, disponibilité en stock, articles à écouler).

Or, dans le cadre de recherche de produits, certains critères étaient mal pris en compte. L’équipe de SWORD a ainsi découpé les requêtes en partie pour leur attribuer des poids plus ou moins forts, sachant que le premier terme (généralement le type de produit) est le plus important. « Il y a eu un enrichissement des recherches liées à notre lexique en interne », ajoute le DSI. « Ce type de projet se mène avec les retours d’expérience des véritables usagers », recommande-t-il.

La technologie de Sinequa couvre d’autres domaines. « Nous indexons des bons de commande, des factures, ou encore la notice d’utilisation du moteur de recherche lui-même », liste Claudio Borlo.

Un déploiement d’envergure en deux phases

Ce déploiement ne s’est pas fait du jour au lendemain et a évolué. Au départ, la filiale de Saint-Gobain a déployé la technologie par-dessus MongoDB, mais s’est heurtée à un problème de volumétrie.

Avec le nombre de documents, de croisements et de cas d’usage, l’architecture en question ne suffisait pas. « Les charges de travail d’indexation lancées la nuit échouaient ou elles se poursuivaient le jour », se rappelle Claudio Borlo.

Les responsables de l’intégration expliquent que le fait que l’indexation se poursuive en journée affectait les performances des recherches. Plusieurs raisons à cela. D’abord, la base de données produits peut changer fortement de jour en jour.

Lors de la phase d’indexation, SGDBF effectuait de nombreuses opérations de jointure qui ralentissaient l’indexation assurée par l’architecture de Sinequa. Il a été décidé de réaliser les différents calculs depuis une distribution Hadoop hébergée sur un cloud privé. Ainsi, l’équipe en charge du projet chez SGDBF a pu délester Sinequa des traitements les plus lourds et servir des données « précalculées » pour accélérer l’indexation.

« [Le basculement en production vers Hadoop a débuté en mai 2019.] C’est le plus gros défi auquel nous avons dû faire face. »
Claudio BorloDSI de Saint-Gobain Distribution Bâtiment France

Entrée en production en juillet 2018, l’architecture établie sur MongoDB a été mise à l’arrêt en juin 2019, tandis que le basculement en production vers Hadoop a débuté en mai 2019. « C’est le plus gros défi auquel nous avons dû faire face », commente le DSI.

Aussi, la structure du modèle de données posait un problème. Dans le modèle de données, chaque correspondance entre un produit et une agence générait une ligne. Un même article figurait donc plusieurs fois, et avec lui tout un ensemble de données. Pour alléger la chose, il a été décidé de n’avoir qu’une ligne par article. Les données des agences (fréquence de vente, dernière vente, etc.) ont été placées dans des colonnes au format CSV.

Lors de leurs tests, les responsables du projet se sont rendu compte que l’indexation était plus performante quand le modèle de données des index contenait le moins de colonnes possible.

Les données des produits et les informations des agences ont été réunies dans deux colonnes distinctes à l’aide d’une structure de type JSON. Résultat, de 4 téraoctets de données en index, SGDBF est passé à 200 gigaoctets. Après deux à trois heures de calcul sur Hadoop, l’indexation est effectuée toutes les nuits et dure 6 à 7 heures.

Afin d’assurer la tolérance aux pannes, les équipes de la filiale ont personnalisé leur architecture Sinequa. Ainsi, une instance est dédiée à l’indexation, tandis que plusieurs instances et WebApps sont consacrées à la recherche.

Pour pousser des données fraîches aux utilisateurs, SGDBF a dédoublé les index et leur alias. Un des alias est consacré à l’indexation, l’autre à la recherche.

Une architecture qui évoluera encore en 2023

SGDB France a déployé son moteur de recherche dans plus de 1 000 agences. En novembre 2022, environ 1 500 agences avaient un accès total ou partiel à l’interface Web. Plus de 18 000 utilisateurs passent par l’IHM reposant sur Sinequa pour rechercher les produits et les clients des enseignes. « Les usagers sont satisfaits et les performances sont bonnes », constate Claudio Borlo. En 2021, le taux de réponse moyen était de 95 %.

Dans le cadre de la stratégie e-commerce de la filiale, le DSI envisage d’adapter la technologie de Sinequa afin de propulser la recherche de produits et de matériaux sur les sites Web et sur des applications mobiles. « Cela demande de ne plus cantonner la recherche des produits par agence et d’élargir le modèle de recommandation, de penser une expérience client », anticipe-t-il.

Plus tard, l’entreprise compte explorer les possibilités de la recherche cognitive pour que ses vendeurs obtiennent des réponses à des questions posées en langage naturel, et non plus seulement avec une suite de mots-clés.

Avant cela, la DSI de Saint-Gobain Distribution Bâtiment France s’occupera de la migration de la plateforme Hadoop vers un équivalent sur le cloud. Les serveurs Sinequa resteront dans un premier temps sur son cloud privé.

Pour approfondir sur Intelligence Artificielle et Data Science