Worawut - stock.adobe.com
Satisfaction client : Socio Data Management parie sur la simulation
Comment faciliter la prise de décisions à partir d’enquêtes de satisfaction ? Voilà la question à laquelle le cabinet Socio Data Management tente de répondre pour ses clients. La solution trouvée s’appuie sur un simulateur bayésien.
Filiale du groupe Orians, Socio Data Management est un cabinet français de conseil et d’intégration, spécialisé dans le traitement des données. Il accompagne en premier lieu les instituts de sondage et les grands cabinets d’étude dans la réalisation de leurs enquêtes. L’entité génère un chiffre d’affaires d’environ 2,5 millions d’euros par an.
Directement ou indirectement, la société parisienne opère ou participe à l’élaboration d’enquêtes de satisfaction pour des clients finaux du retail, du monde associatif, de l’agroalimentaire, ou encore de l’industrie automobile. Socio Deta Management traite plus de 2 500 études par an.
L’entreprise développe également des outils pour restituer les résultats des études ou des analyses de données effectuées pour le compte de ses clients, les instituts de sondage et les groupes du CAC40, entre autres.
Cette activité a donné l’idée aux statisticiens et data scientists de Socio Data Management de concevoir un simulateur bayésien. Comme son nom l’indique, un tel dispositif s’appuie sur la technique statistique des réseaux bayésiens. Un réseau bayésien est un modèle de graphique probabiliste.
Il marie la théorie des graphes et la théorie des probabilités pour représenter des variables aléatoires et les relations causales entre ces variables. En clair, il s’agit de percevoir les effets d’une variable sur une autre, quand l’on ne connaît pas ou de manière incomplète les relations causales.
Cette technique est utilisée dans le monde de la recherche pour bâtir des systèmes experts de validation de diagnostics médicaux, mais aussi dans l’industrie ou dans l’assurance pour concevoir des outils de modélisation de risques. Employer un réseau bayésien, c’est faire de l’inférence bayésienne, c’est-à-dire calculer des probabilités en vue de certains événements.
Comment appliquer cette technique au monde des études et du marketing ? C’est l’enjeu que l’équipe R&D de Socio Data Management relève depuis six ans. Le simulateur bayésien est commercialisé depuis 2019.
Les instituts de sondage ne sont pas forcément friands de cette technique qui sort du carcan « fréquentiste ». Cependant, les clients finaux, les grands groupes et les annonceurs, peuvent y trouver un intérêt certain.
À la suite d’enquêtes de satisfaction, de notoriété ou encore de recommandation, ces instituts sont capables d’établir des liens de cause à effet entre un score de réputation, des variables de contexte et d’identité, afin de comprendre les motifs qui justifient les notes données par les sondés. Or ces liens de cause à effet ne sont pas représentés sous forme de graphes et ne sont en aucun cas dynamiques : la plupart du temps, ils sont expliqués par une suite de visualisation. La question que se posait Socio data Management était la suivante : et s’il était possible d’observer directement les effets des changements de certains critères d’évaluation sur des KPI ?
« Quand nous avons commencé à développer cet outil-là, nous avions besoin d’avoir quelque chose de très visuel », déclare Paul Mathieu, chef de projet chez Socio data Management. « Or en sortie d’un modèle bayésien, vous avez une image d’un réseau avec des nœuds : rien de très exploitable pour un non-statisticien, par exemple un membre d’une équipe marketing ».
Démocratiser l’usage de l’inférence bayésienne
Paul MathieuChef de projet, Socio data Management
« Le but du jeu c’est d’appliquer facilement à l’écran les résultats d’un modèle probabiliste, en faisant bouger des curseurs qui vont modifier les valeurs à prédire. Si je change un critère particulier, comment cela influe-t-il sur ma note globale de satisfaction ou de recommandation ? », illustre le chef de projet.
Pour le client, les résultats de l’étude sont chargés dans l’outil accessible depuis une interface Web. Les critères d’évaluation qui contribuent à un score global sont hiérarchisés par importance. En clair (pour un statisticien), Socio Data Management affiche par ordre décroissant les variables explicatives dont les poids sont les plus importants.
Le simulateur bayésien dispose de trois modes. Le mode simulation affiche les changements d’un critère sur l’indicateur global. Dans le mode exploration, modifier un critère ne fait pas seulement « bouger » le score final, l’outil permet de visualiser les interactions entre plusieurs variables. Enfin, le mode expert permet de sélectionner les critères que l’on souhaite faire évoluer pour augmenter l’indicateur final.
« Les résultats sont binaires : généralement, les utilisateurs réduisent le curseur d’une variable négative et augmentent celui d’une variable positive », précise Paul Mathieu.
En cumulant ces analyses, les utilisateurs doivent pouvoir évaluer les efforts à faire dans certains domaines de leurs activités à améliorer et ainsi prendre des actions.
« Les instituts s’en servent dans le cadre d’enquêtes de satisfaction pour conseiller leurs clients finaux », explique Guillaume Zielinski, data Scientist chez Socio data Management. « Ils s’appuient sur le simulateur bayésien pour essayer de déterminer quels critères permettent d’augmenter la satisfaction globale des clients, et d’identifier des leviers sur lesquels agir. Pour une banque ou une assurance, cela peut être d’améliorer la qualité d’accueil en agence, par exemple ».
Autre exemple, une chaîne de restauration peut tenter d’améliorer son taux de fréquentation en « jouant » sur des critères d’accueil et de rapidité du service, mais aussi en faisant baisser le niveau sonore de ses salles.
Si les actions recommandées sont prises, l’entreprise peut mener une deuxième enquête de satisfaction afin d’évaluer la pertinence de ses efforts, et la pertinence des indications du simulateur. Au-delà d’une note qui augmente, l’organisation doit de son côté estimer les coûts des mesures par rapport aux gains attendus, ce qu’elles n’arrivent pas toujours à faire.
Le simulateur bayésien ne sert pas seulement à évaluer ou à anticiper les évolutions de la satisfaction client ou des ventes sur un marché spécifique. Il peut également servir à prédire des valeurs quantitatives. Une ONG a notamment fait appel à Socio data Management pour augmenter sa part de dons. Elle a ainsi pu prédire qu’en envoyant davantage de mails auprès des abonnés à sa newsletter, elle réussirait à atteindre ses objectifs.
Des limites à comprendre
Toutefois, comme les cabinets d’étude et les entreprises réalisent leur enquête sur des échantillons représentatifs, qui souvent comprennent les réponses de moins de 500 sondés, les jeux de données restent relativement petits. Or, avec un réseau bayésien, il faut pouvoir alimenter en données les croisements des variables. « Si vous avez une vingtaine de variables et que votre échantillon est de 300, vous imaginez bien que vous n’aurez pas assez de données pour croiser les variables les unes avec les autres », avertit Paul Mathieu. « Et comme il s’agit d’un modèle probabiliste, il est possible de passer à côté de certaines relations ».
L’application développée en JavaScript et JQuery disponible depuis le Web est réutilisable, mais les clients font intervenir les experts de Socio Data Management pour moduler le modèle bayésien déployé chez le cabinet de conseil. Il faut traiter les données, ajuster les poids des variables, et les autres paramètres. « En général, le simulateur bayésien fonctionne bien », assure Paul Mathieu. Les entreprises qui ne font pas appel à un institut peuvent recourir aux services de Socio Data Management pour établir les questionnaires. Même la manière de représenter un score peut avoir un impact sur le résultat du simulateur.
Les améliorations réclamées par les utilisateurs
L’équipe R&D compte améliorer l’UX de l’application et ajouter des fonctionnalités réclamées par les utilisateurs.
Pour l’instant, les poids des variables sont fixes. Socio Data Management souhaite faire en sorte que ces poids évoluent quand un utilisateur déplace les curseurs. « De cette manière, un critère pourrait alors gagner ou perdre de l’importance », résume le chef de projet.
« Nous avons aussi une demande croissante des clients qui voudraient faire l’opération inverse : choisir une note globale de satisfaction cible afin de simuler quel plan pourrait permettre d’atteindre ce résultat », raconte Guillaume Zielinski.
C’est plus complexe, car plusieurs combinaisons peuvent donner le même résultat. « C’est intéressant, mais ce n’est pas facile à faire », souligne Paul Mathieu. « Cela demande de pouvoir montrer les combinatoires ex aequo ».
Enfin, « nous l’avons appelé simulateur bayésien, mais à terme l’outil devra supporter n’importe quel type de modèle, par exemple des modèles de régression, des arbres de décision ou des modèles de segmentation », conclut Paul Mathieu.