Watson : comment Sopra Steria déploie un projet cognitif
Sopra-Steria Group participe à l’élaboration du module Conversation de Watson. L’ESN, qui s’est très tôt positionnée sur le système cognitif d’IBM et sur Bluemix, nous détaille la mise en place du projet et son rôle dans son intégration au SI d’une entreprise.
Sopra Steria, 4e ESN en France (selon les chiffres PAC – Pierre Audoin Consultants), travaille en collaboration avec les équipes américaines d’IBM pour élaborer le module Conversation de Watson.
Ce module correspond en fait au prochain moteur conversationnel de la plateforme cognitive et devrait remplacer Dialog – celui-ci existe dans Watson depuis les débuts de la plateforme. Ce module Conversation sert en fait à créer des interactions entre une application et un utilisateur via le langage naturel.
L’ESN contribue au projet en apportant une expertise sur l’intégration de Watson au SI des entreprises. Avec une brique clé pour l’écosystème français : celle de la connaissance des spécificités de la langue de Molière et celle de la connaissance des métiers.
« Nous ne co-développons pas avec IBM, mais nous intervenons davantage dans la partie recette. Les équipes d’IBM, de leur côté, ont déjà bien avancé sur le module », commente Barbara Rochet, Alliance Manager IBM au sein de l’ESN. « L’écosystème Watson s’est construit autour des ESN. Celles-ci équipent une société qui utilise Watson selon un besoin et un modèle économique propre. Notre métier est de savoir comment on peut apporter l’Intelligence Artificielle et sa valeur, à nos clients dans le cadre de leur refonte du SI. On apporte la connaissance des métiers de nos clients, un cas d’usage et la connaissance de leur SI ».
En clair, il s’agit non seulement de faire émerger de vrais cas d’usage autour de Watson, mais également d’accompagner les entreprises à les traduire concrètement dans leurs modèles. Ce qui, aujourd’hui, reste encore difficile dans les entreprises en France.
Pas de Watson sans un long apprentissage
Et pour cause. Mettre en place des modules de type Watson dans des systèmes complexes relève d’une gageure au regard de la difficulté du projet. Car, ce qui caractérise l’intégration de services Watson est une longue période d’entrainement et d’apprentissage du système qu’il convient de réaliser en amont.
Suivant les principes du Deep Learning, Watson gagne en efficacité – et révèle donc sa pertinence - au fur et à mesure qu’on le nourrit d’informations.
« Lorsque l’on récupère le cas d’utilisation, on vérifie qu’il réponde bien à du cognitif et qu’il est rentable pour le client. Existe-t-il une plus-value pour lui ? Pouvons-nous traiter des tâches répétitives sans réelle valeur ajoutée qui peuvent être automatisées et alléger certaines équipes ? Nous travaillons sur ce cas et le déclinons en parcours, en dialogue et en questions que l’on se pose dans ce domaine », décrypte Patrick Meyer, architecte sénior Watson.
A partir de là, « nous élaborons les déclinaisons des phrases et les branches de dialogue pour découvrir l’intention (ce que l’utilisateur est susceptible de poser comme questions et ce qu’il est susceptible d’attendre comme réponse, NDLR). C’est cette classification que l’on va apprendre au système ». Watson est ensuite nourri de fichiers qui détermineront la façon dont l’utilisateur interagira avec le système.
Le tri d’emails en volume est par exemple cité comme cas d’usage – une utilisation identifiée par le Crédit Mutuel par exemple . Le système peut classer les messages et extraire des informations pour que l’agent qui récupère l’email ait une partie de travail effectué en amont. La détection de sentiments dans l’email permet aussi d’identifier un caractère d’urgence des messages.
Structurer la méthode et l’information à apprendre à Watson
Watson nécessite donc un important travail préparatoire : celui de la structuration et de l'organisation des données en amont. Pour que l’émulsion prenne, un ensemble de questions est donc prédéfini. Elles sont ensuite classées et soumises au système Watson pour que celui-ci s’entraine à « comprendre » ces thèmes particuliers.
« Dans le cadre des recherches d’intentions, on lui donne un fichier séparé en deux colonnes : une première où l’on donne les phrases qui servent à la classification ; la seconde correspond à la classe qu’il doit retourner », illustre Pierre Laurent, architecte sénior, direction des grands comptes et partenariats commerciaux. Par exemple, on attribue toutes les phrases qui pourraient correspondre à une classe déterminée (à la classe « acheter voiture » peut correspondre des phrases « où acquérir une voiture rouge de marque allemande ? »). Dans le cas d’une conversation, « on décide ensuite de l’arbre de dialogue, qui vient en fait ajouter un contexte autour de l’interaction avec l’utilisateur ».
« Cet arbre de dialogue nous permet de préciser un certain nombre de données d’environnement du contexte de la personne qui discute avec le système. On réinjecte cela dans le système d’apprentissage. On finit enfin par cerner la bonne réponse pour l’utilisateur », poursuit Patrick Meyer, architecte sénior Watson.
En regardant de plus près, on comprend l’ampleur du chantier et la difficulté des entreprises à se lancer.
« Autant la technologie reste compréhensible, autant l’entrainement du système demeure un processus complexe. La création de l’ontologie est la clé de la réussite du projet », constate Barbara Rochet. D’où l’idée de bien connaître le métier du client, et d’en connaître la dialectique, le champ sémantique et l’ensemble du vocabulaire qui s’y rapporte. Sopra Steria explique d’ailleurs avoir recruté des profils adaptés dans certains métiers, comme la défense, l’aéronautique ou la banque.
Une autre répartition des coûts de développement
Par ricochet, un projet Watson suit un cycle différent des traditionnels projets informatiques de grande ampleur. Cela se voit notamment dans la répartition des coûts, prévient l’ESN. « On constate que, dans un projet Watson, les coûts de développement baissent au profit d’une augmentation assez forte des coûts liés aux spécifications, à la création de corpus, des questions types et de leur classification », résume Pierre Laurent.
« Nous avons à peu près le même ratio entre le développement, la constitution des données et le test – qui est aussi un élément important lorsqu’on parle de langage naturel. » Généralement, il est une convention dans le calcul d’un forfait d’un projet informatique : pour 1 jour de développement, on compte 2,5 jours de pilotage, conception et tests. Pour Watson, la partie accompagnement et données – celle en amont donc - est bien plus importante.
Le Cloud, un catalyseur pour Watson
Face à cette équation complexe, le Cloud apparait comme une clé dans la mise en place de projets Watson. Ce qu’IBM a d’ailleurs compris en exposant les services de son système cognitif sous la forme d’API, d’une part, et en proposant une plateforme centralisée pour les consommer, Bluemix, d'autre part.
« Le Cloud est un élément primordial car le système doit être entraîné. IBM a mis en place des équipes dédiées à l’injection de données et à l’entraînement des systèmes. On ne peut pas imaginer aujourd’hui qu’une société implémente une technologie d’IA et entraine seule Watson. La présence de ce système sur le Cloud est clé pour son entrainement », explique Patrick Meyer.
Pierre Laurent confirme. « Développer un projet d’IA et mettre à disposition des moteurs d’apprentissage sous la forme de services supervisés est un travail énorme. Les mettre à disposition des entreprises est un deuxième travail énorme. On a trouvé dans Watson sur le Cloud un usage direct de ses services. Il est très facile de se servir de Watson ». Pierre Laurent parle même de « démocratisation de l’Intelligence Artificielle ».
Et quid du stockage des données ? « On n’est pas obligé de remonter toutes les données dans Watson pour qu’elles y soient stockées », confirme-t-il.
« Les flux d’apprentissage montent dans le Cloud pour y analyser les données, mais celles-ci ne sont pas conservées, assure-t-il. Seules certaines données, comme les données résultant de l’apprentissage, sont stockées dans le Cloud, mais elles sont chiffrées et uniquement accessibles par le service (à des fins d’amélioration des services, NDLR). »
Watson : un moteur de transformation pour Sopra Steria
Pour l’heure, les entreprises françaises ne font que toucher du bout des doigts l'intérêt de Watson. Mais l’optimisme est de rigueur. Sopra Steria recense dix PoC depuis février-mars, dont quatre financés par des clients. « Les grands comptes sont aujourd’hui prêts pour l’Intelligence Artificielle », se réjouit Barbara Rochet. Certains se concrétisent d’ailleurs en véritables projets.
La banque, les telécoms, les assurances, l’aéronautique, l’énergie sont cités comme des secteurs qui ont lancé ces précieux tests (le secteur public et la Défense sont encore un peu timides, selon elle – en cause, notamment, le fait que ces outils soient dans le Cloud public - ici Bluemix).
Les PoC ont été réalisés avec des clients existants de Sopra Steria, qui les a donc accompagnés pour faire émerger des cas d’usage. « Il faut une certaine confiance pour ce genre de projets qui ne sont pas simples à vendre en interne », raconte Barbara Rochet.
Si logiquement, le caractère novateur de Watson en fait un élément clé de la transformation numérique des entreprises, c’est également une composante essentielle dans l’évolution même de Sopra Steria. « Watson apporte une vraie plus-value pour la transformation numérique et apporte aussi de la valeur dans notre offre. Watson va, dès l’année prochaine, nous accompagner pour rénover certaines offres classiques comme la TMA (Tierce Maintenance Applicative) ou apporter de nouveaux services à nos clients », promet Barbara Rochet.
L’Intelligence artificielle de Watson pourrait aussi venir compléter l’offre PLM (Product LifeCycle Management) de l’ESN (la société a racheté Cimpa à Airbus, ainsi que le cabinet de conseil Lasce).
Toutefois, si Watson a de quoi séduire, l’adoption reste lente et se fait par à-coup. « Aujourd’hui, nous trouvons des projets axés sur le traitement du langage. Il s’agit d’un processus dans un grand cas d’utilisation. Nous implémentons juste ces processus. (…) Il s’agit d’un petit projet dans un grand projet », constate Patrick Meyer. Pour les projets Watson, le meilleur resterait donc à venir.