Photographee.eu - stock.adobe.co
L’essentiel sur ThoughtSpot, l’étoile montante de la BI en libre-service
ThoughtSpot est un outil de Business Intelligence qui veut démocratiser l’analytique jusqu’aux métiers. Il leur pousse automatiquement des tableaux de bord, et facilite les requêtes via un moteur de recherche en langage naturel. Sa BI s’inspire fortement des ergonomies de Google et de Pinterest et de l’expérience d’un Netflix. Tout en restant grands comptes.
ThoughtSpot est un éditeur américain spécialiste de la Business Intelligence (BI ou informatique décisionnelle). De fonds privés, il envisage une introduction en bourse et est valorisé, à date, à deux milliards de dollars. Son outil éponyme est classé par le Gartner dans les « leaders » du « Magic Quadrant for Analytics and Business Intelligence Platforms » de 2020, aux côtés de seulement trois autres acteurs Tableau, Power BI et Qlik.
La société a été créée en 2012 par Amit Prakasha (un ancien de Google, ce qui n’est pas sans conséquence sur le produit) et par Ajeet Singh, qui avait auparavant fondé Nutanix.
ThoughtSpot s’est réellement implanté en France début 2020, sous la direction de Benjamin Caller (Regional Vice President, Partners and Alliances sur la zone EMEA et ASEAN), qui est également passé chez Qlik lors de sa carrière. L’éditeur revendique 400 clients dans le monde (dont une soixantaine en Europe), essentiellement des grands groupes.
Qu’est-ce que ThoughtSpot ? Avant tout un moteur de recherche
ThoughtSpot est considéré par le Gartner comme un des meilleurs nouveaux acteurs de la BI (dont font aussi partie Looker ou Sisens). Son atout, dit le cabinet d’analystes, est d’être à la pointe de « l’analytique augmentée » (ou « Modern BI »), c’est-à-dire une BI qui utilise l’Intelligence Artificielle pour simplifier la « consommation » de la donnée et des enseignements que l’on peut en tirer (les « Insights »).
Plus concrètement, ThoughtSpot se présente comme un moteur de recherche. Une fois les jeux de données de l’entreprise connectés, un utilisateur peut taper une question dans cette barre de recherche, tout comme il ou elle le ferait pour trouver une information sur Google.
Il est par exemple possible de lui poser la question : « Quel est le produit le plus vendu, dans chacun de mes rayons frais, par supermarché, sur les 33 derniers jours ? ». Au fur et à mesure de la frappe, la barre fait des propositions comme dans Google (auto-complétion de la requête) et une modélisation de la réponse s’actualise.
Pour répondre à la question, ThougtSpot va lui-même déterminer, à partir de la demande en langage naturel, les mots-clés et les filtres à appliquer. « L’outil interprète les questions en une ou plusieurs requêtes, puis il interroge la (ou les) base(s) de données et il va renvoyer le résultat », explique Alexandre Picard, Sales Engineer chez ThoughtSpot. Pour cet ancien de Qlik et Tableau, ce serait « typiquement le genre de choses que l’on ne peut pas faire avec d’autres outils ».
En tout cas, cette approche « search » est la grande différence avec ses trois voisins « Leaders » du Gartner. Là où Tableau, Qlik et PowerBI s’articulent autour de tableaux de bord, qui sont des portes d’entrée vers l’analyse des données, ThoughtSpot se présente comme un outil qui répond à des questions, en self-service, y compris pour des novices en informatique décisionnelle.
Sous le capot, la R&D de l’éditeur a fait un gros travail sur la compréhension du langage naturel (NLP).
« ThoughtSpot a été un véritable avant-gardiste dans l’utilisation du NLP appliqué aux requêtes analytiques », valide Rita Sallam du Gartner. « Ses équipes ont réussi le tour de force […] de se faire reconnaître comme une offre très différenciante qui permet aux métiers de poser des questions très complexes, et cela sur de grosses volumétries de données ».
Une DataViz et des dashboards qui s’inspirent de Pinterest, de Facebook et de Netflix
ThoughtSpot ne s’affranchit pas de la DataViz et des tableaux de bord pour autant.
La réponse à la question posée ci-dessus sera en effet bien présentée sous forme de visualisation. Mais une visualisation qui est automatiquement générée et qui se veut la plus adaptée à la problématique : une carte (si les magasins sont des données géographiques), un graphique par barre (si on les considère comme des entités comptables), etc.
Cette proposition de ThoughtSpot peut évidemment être personnalisée et modifiée.
Ce rapport/visualisation peut ensuite être « épinglé(e) », comme dans Pinterest, et « liké(e) » comme sur Facebook (cette évaluation peut même être commentée).
Le Machine Learning qui infuse l’outil en tient compte et poussera alors de manière proactive plus d’« Insights », c’est-à-dire des représentations du même type. Il affinera également l’auto-complétion de la barre de recherche avec ces « méta-informations » de l’utilisateur.
Ces tableaux de bord – adaptés à l’utilisateur – sont poussés dans une rubrique « recently trending », positionnée en dessous de la barre de recherche.
« Chez les grands comptes [N.D.R. : cible principale de ThoughtSpot], les utilisateurs sont souvent noyés dans la masse de tableaux et d’analyses plus ou moins pertinentes pour eux », avance Alexandre Picard. « ThoughtSpot apporte une expérience à la Netflix : en fonction de l’usage que fait un métier de la plate-forme, ThoughtSpot va lui suggérer des tableaux de bord qui correspondent à ce qui l’intéresse. C’est de l’hyperpersonnalisation, exactement comme dans le e-commerce. »
Par exemple, des habitudes de recherches sur des données marketing ou RH pousseront respectivement des tableaux de bord marketing ou RH (mais pas les deux).
Le co-fondateur Sudheesh Nair est très clair sur l’importance, selon lui, d’une BI plus proactive. Le but ultime de l’analytique – dans sa vision – est de ne plus exiger aucune manipulation (pas même une question). « Nous ne voulons pas qu’une recherche soit la première chose que vous fassiez [pour interroger des données] », lance-t-il. « Nous voulons que ce soit la deuxième. Nous voulons vous donner ce que vous cherchez, avant même que vous ne le demandiez ». Exactement comme Google Discover pousse des articles en fonction des affinités qu’il a repérées chez un internaute.
Dans la même optique, ThoughtSpot IQ utilise l’IA pour extraire automatiquement des informations notables d’un rapport (valeur remarquable, corrélation, etc.).
Les visualisations et les tableaux de bord faits à partir de visualisations épinglées peuvent ensuite être partagés, en fonction des droits de l’émetteur et des destinataires. ThoughtSpot gère la gouvernance et modifie les données en fonction. Un responsable France peut par exemple partager des résultats de ventes nationales avec des responsables régions. Le responsable régional pourra « creuser » dans les magasins de sa région, mais pas dans ceux des autres zones.
Comme le libre-service peut aussi être déstabilisant, une fonction « Ask an expert » permet de poser des questions à un référent dans l’entreprise, par exemple si l’on n’est pas sûr des jeux de données ou de la manière dont on a posé une question.
Quelle différence entre ThoughtSpot et Tableau ?
La fonctionnalité phare de ThoughtSpot – interroger les données en langage naturel – fait penser à AskData de Tableau. Quelle est donc la différence entre ThoughtSpot et Tableau, qui se positionne lui aussi sur la BI en self-service ?
« La promesse [de AskData] est identique à la nôtre », répond Alexandre Picard. Mais le Sales Engineer revendique une plus grande facilité d’utilisation de ThoughtSpot dès qu’il faut croiser des jeux de données (celui des ventes avec celui des stocks dans le calcul d’une couverture de stock par exemple).
« Dans Tableau, pour faire cela, on commence à devoir transformer la donnée et à créer des data marts […] Et dès que l’on veut explorer et aller plus loin, si une question sort du cadre prévu, les métiers doivent passer par des data analysts pour modifier les rapports », avance-t-il. « L’idée de ThoughtSpot, c’est de casser ces data marts ; et que le produit soit assez intelligent pour comprendre par lui-même un modèle de données et générer les bonnes requêtes face à une question métier qui, au final, est simple ».
« Notre technologie est là pour comprendre un modèle de données complexe plutôt que de le tordre pour répondre au besoin du logiciel analytique », insiste-t-il. « On charge les données dans ThoughtSpot, on les relie correctement avec le référentiel des produits et le référentiel client par exemple. Et automatiquement ThoughtSpot comprend le sens des relations et peut générer plusieurs requêtes, ce qui évite de dupliquer les données ou de faire des choses comme des produits cartésiens ».
Benjamin Caller résume cette différence par une formule qui distingue d’un côté Google et de l’autre un moteur intégré dans un site. « Google a inventé un moteur de recherche [pour tout le web]. Nous, nous avons inventé un moteur de recherche qui va aller requêter sur l’intégralité de vos bases qui sont connectées à ThoughtSpot (applicatifs d’entreprise, cloud data warehouse, etc.) sans même forcément savoir où est la donnée. Tableau, aujourd’hui, c’est du search mais sur vos reports qui ont été créés en amont. C’est un peu comme si vous ajoutiez une barre de recherche à un site en particulier ».
« Ce sont deux architectures complètement différentes », conclut le responsable EMEA.
« Les solutions de visualisation [N.D.R. : Tableau, mais aussi Qlik et PowerBI] ont été conçues au départ pour… visualiser les données. Et aussi pour une utilisation sur un ordinateur de bureau », renchérit Ryan Mattison, Directeur de la Communication de ThougtSpot. « Elles n’ont pas été développées pour gérer les volumes actuels de données. Elles ne peuvent pas effectuer d’analyse au niveau le plus granulaire de cette donnée. Elles s’appuient sur des agrégats, des moyennes, des data marts ou des cubes ».
« Dans nos vies personnelles, le Search est de facto devenu la manière dont nous interagissons avec les informations et les idées », continue-t-il, « le moteur de recherche doit donc être au cœur d’une architecture technique. Pour être réellement efficace, il ne peut pas être un simple ajout ou une extension [de l’outil]. Regardez : combien de personnes utilisent encore Yahoo aujourd’hui, comparé au nombre d’utilisateurs de Google ? »
La réponse de Tableau Software
Hasard du calendrier, un évènement de Tableau Software avait lieu au moment de la rédaction de cet article. LeMagIT a posé la même question de la différence entre les deux outils à François Ajenstat, Chief Product Officer chez Tableau.
« Avant toute chose, je dois vous dire que je suis fan de ThoughSpot en particulier, et des éditeurs qui innovent en général. Je pense que c’est toujours une très bonne chose pour notre secteur.
Maintenant, nous avons une perception différente du marché. Nous pensons que nous devons être capables de permettre à n’importe qui d’analyser n’importe quelle donnée, n’importe où. C’est pour cela que Tableau est la solution la plus simple à utiliser de tout le marché. Nous avons étendu nos capacités et nous les avons augmentées [grâce à l’intelligence artificielle]. Nous avons intégré la compréhension du langage naturel directement dans la plate-forme, et d’autres choses de ce type.
De son côté, ThoughtSpot – et à nouveau : c’est une superbe solution – a pour objectif de permettre à l’IT d’aller vers les métiers.
Je ne veux vraiment pas dire de mal de cet outil. C’est juste qu’il y a une différence d’approche : vous devez passer beaucoup de temps à préparer les données, à les sélectionner (curating) et à les organiser en fonction des utilisateurs avant qu’ils ne puissent réellement poser leurs questions.
Maintenant, pensez à ce qui se passe avec la crise actuelle. Si la première étape d’un projet [analytique] m’oblige déjà à passer entre 3 à 6 mois à préparer la donnée avant que je ne puisse la pousser à mes utilisateurs, c’est trop tard ! Avec Tableau, vous pouvez connecter les données et commencer [votre projet] en quelques minutes. C’est une différence fondamentale. Mais pour moi, il y a de la place pour les deux dans les entreprises ».
Comment ThoughtSpot intègre-t-il et gère-t-il les données ?
ThoughtSpot est conçu pour intégrer les données de l’entreprise de deux manières :
- Les connecteurs
- La base in-memory de ThoughtSpot
Il existe aujourd’hui six connecteurs natifs de ThoughtSpot pour des data warehouse cloud (DWaaS) : Snowflake, Redshift (AWS), BigQuery (GCP), Synapse (Azure), SAP HANA et Taradata. « Nous supportons uniquement des bases qui sont faites pour l’analytique » justifie Alexandre Pixard, « comme on fournit de la BI en self-service, les utilisateurs veulent des temps de réponse semblables au temps de chargement d’une page web » [N.D.R. : moins de sept secondes].
Avec cette méthode, une trentaine de minutes suffisent pour connecter un DWaaS, puis sélectionner et récupérer les tables voulues. « En parallèle, une indexation se fait et vous pouvez faire votre première recherche », assure Benjamin Caller. Mais ce n’est qu’une première étape.
En parallèle de ces « requêtes directes » sur ces six entrepôts de données cloud, la deuxième méthode consiste à charger les sources via la base In-Memory du produit. « C’est le mode historique », rappelle Alexandre Picard qui parle d’une « base conçue pour être distribuée et pour prendre en charge de très gros volumes de données ».
Dans le premier cas, la donnée ne bouge pas, dans la deuxième elle est dupliquée dans la base in-memory.
Type de déploiements de ThougtSpot et facturation
Historiquement, ThoughtSpot se déployait « sur site » (ou sur un cloud). Depuis peu, il est également disponible en SaaS.
Dans son modèle cloud, il est facturé au nombre de requêtes. Sur le modèle plus classique, il est facturé sur la quantité de données ingérées dans ThoughtSpot, ou à laquelle on accède via l’outil. L’éditeur propose différents « modules » : jusqu’à 250 Go, jusqu’à 1 To, 5 To, 10 To, etc.
Dans les deux cas, peu importe le nombre d’utilisateurs.
ThoughtSpot peut également être revendu en OEM (dans d’autres outils comme un ERP) et encapsulé (Embedded).
ThoughtSpot encapsulé : le cas British Telecom
Sur son portail, British Telecom permet par exemple à ses clients professionnels d’analyser leurs factures via ThoughtSpot avec un accès direct aux données de facturation. « Auparavant, si vous souhaitiez avoir l’explication d’une facture qui paraissait anormale, il fallait attendre trois mois. Et payer », raconte Benjamin Caller. « Les data scientists étaient surchargés de demandes pour créer des rapports. Avec ThoughtSpot, un client entreprise peut scroller dans les données et voir lui-même qui sont ses plus gros “consommateurs” de forfait, les lignes d’appels anormales, etc. ».
Comment se déroule un projet ThoughtSpot ?
Dans les deux cas, un travail supplémentaire de préparation est à faire. L’éditeur – qui ne facture pas par nombre d’utilisateur – veut être accessible à tous les employés. Ce qui implique plusieurs problématiques à régler en amont.
C’est le cas de la gouvernance. On l’a vu, ThoughtSpot permet de partager les « contenus » (visualisations et dashboards) en un clic, comme sur Pinterest. Mais selon les fonctions des collaborateurs, les droits d’accès aux données ne seront pas les mêmes.
Benjamin CallerThoughtSpot
« Chez Daimler, nous avons chargé toutes les données de la supply chain qui étaient dans Snowflake », illustre Benjamin Caller. « Mais on ne peut pas mettre la totalité de cette information à disposition de tout le monde. Le patron de la supply chain a tous les droits, mais pas le responsable d’une ligne particulière de produit ». Première étape, donc, l’IT ou un partenaire doit reprendre et paramétrer les droits d’utilisateurs.
Comme ThoughtSpot s’appuie sur la compréhension sémantique, vient ensuite un travail sur les dictionnaires. Ils sont les compléments indispensables de l’indexation automatique. Ils dépendent largement des « cas d’usages » identifiés pour ThoughtSpot (un projet type commence d’ailleurs par la définition de ce « use case »).
« Dans une entreprise, vous n’allez pas nécessairement utiliser les mêmes mots que dans une autre, même si vous êtes sur le même business (synonymes, etc.) », continue Benjamin Caller. « Tout va aussi dépendre de la manière dont les bases de données sont renseignées (noms de colonne, de ligne, etc.) et de la nomenclature en vigueur dans le département et/ou dans l’entreprise […] C’est ce travail qui est différenciant et qui permet de poser des questions sans que personne – Data Scientist ou autres – n’ait à créer de report avant »
Là encore, ce travail est fait par l’IT et/ou les partenaires de ThougtSpot : cabinets de conseils (comme Deloitte, McKinsey ou Accenture), ESN (Octo, Capgemini, WiPro, TCS, etc.) ou des sociétés spécialisées (DataValue Consulting, Keyrus, etc.).
Au final, il faut trois minutes pour connecter ThoughtSpot aux DWaaS avec un connecteur, trente pour sélectionner les tables et faire les premières requêtes (avec l’indexation automatique), mais entre 4 et 8 semaines pour être réellement opérationnel.
« Ce qui prend un peu plus de travail ensuite, c’est la partie “client success”, c’est à dire comment on passe des premiers “power users” à un champ plus large en enrichissant l’outil », conclut Benjamin Caller.
Le cas Walmart : différence et complémentarité de ThoughtSpot avec Tableau
Walmart est un cas d’usage qui illustre bien la différence et la complémentarité de ThoughtSpot avec Tableau. Le géant américain de la grande distribution est un très gros client à la fois de Tableau et de ThoughtSpot.
ThoughtSpot est arrivé dans ce compte pour pallier un manque de Tableau, explique Banjamin Caller. « Pour le Black Friday, quand Amazon baisse ses prix, Walmart essaie de réagir. Mais ils ont tellement de données, qu’il fallait environ 48 h pour rafraîchir le data set dans Tableau ». Une procédure beaucoup trop lente pour savoir quel produit mettre en avant en magasin ou en ligne face aux promotions d’Amazon.
« Au moment où Amazon baissait ses prix, sur des chaussures de sport par exemple, il y avait beaucoup d’indicateurs que les responsables produits de Walmart n’avaient pas : le niveau des stocks, les tailles de chaussure en stock, les disponibilités en magasin, les délais de livraison envisageables, les marges, etc. »
Avec ThoughtSpot, qui requête les données en direct et sans passer par des extracts, Walmart disposerait aujourd’hui de toutes ces informations, en quasi-temps réel. « Ils vont même plus loin », dévoile Benjamin Caller. « Ils savent aussi qui a acheté une paire de cette marque sur les trois dernières années. Ou qui a acheté une paire d’une autre marque. Et donc ils ont inversé la problématique : non seulement ils réagissent, mais ils le font en ciblant mieux les promotions ».
Autre exemple des avantages d’une BI en libre-service et en temps réel, « si Amazon baissait ses prix sur les boissons énergétiques, Walmart s’ajustait…, sauf que maintenant ils attendent de voir si la baisse d’Amazon a un réel impact sur les ventes, et si oui, dans quel magasin et sur quel produit (Red Bull, Monster, etc.) », raconte le responsable de ThoughtSpot. « Et s’il n’y a pas d’effet, ils ne bougent pas le prix. Walmart ne bouge que sur les magasins, ou sur les produits, réellement affectés ».
Dans le même temps, Walmart ne s’est pas débarrassé de Tableau. L’outil de DataViz reste particulièrement adapté pour faire des reports et du « pixel perfect ».
« Au début, nous rentrons toujours dans un compte en complément des outils comme Tableau, Qlik, ou Power BI. Rapidement, les utilisateurs se rendent compte que l’on peut répondre à des cas qu’ils ne pouvaient pas traiter. Nous sommes aussi un complément pour les data scientists, qui du coup ont plus de temps pour faire des choses plus évoluées, comme du prédictif », résume Benjamin Caller. « ThoughtSpot parle au métier. Un DRH veut avoir son analyse tout de suite (sur la différence de salaires entre hommes et femmes, les bons et les mauvais managers, etc.), et ne pas attendre qu’un data analyst puisse lui faire les rapports ». Ce cas d’usage en particulier est celui de ThoughtSpot en France chez Schneider Electrics.
Dans un deuxième temps, le responsable de l’éditeur affirme que plus ThoughtSpot est connu et entre dans les comptes en multipliant les cas d’usages (du marketing à la supply chain puis aux RH, etc.), plus il deviendrait un outil de référence. « Nos clients utilisent encore Tableau, Qlik ou Power BI, mais pour leurs tableaux de bord, avec des centaines de KPI, normés, pour le board », différencie-t-il.