IBM Think : IBM veut accélérer l'AI en l'outillant
Avec Watson Assistant, Watson Studio et Cloud Private for Data, IBM veut accompagner les entreprises en leur proposant des modèles pré-entrainés et une plateforme pour mieux les exploiter
Accélérer. Faciliter. Pré-intégrer. Ces 3 verbes ont souvent été au cœur du discours d’IBM sur l’AI, tenu lors sa conférence Think 2018, qui se tient actuellement à Las Vegas. Une conférence devenue le vaisseau amiral événementiel du groupe. Si l’Intelligence artificielle, le cognitif, le Machine Learning, le Deep Learning semblent être les pilules miracles des applications, IBM a décidé d’outiller ces concepts pour en accélérer l’adoption.
Avec cette approche, IBM tente d’abord de gagner la confiance des entreprises, un peu perdues en la matière. Car même si comme Virginia (Ginni) Rometty, présidente du groupe le clame, « Watson est devenu une plateforme pour les entreprises », la difficulté pour IBM est de les convaincre à ré-imaginer leur processus et leur culture avec l’AI. « Pour que cela soit efficace, l’Intelligence artificielle doit être intégrée aux workflows et aux processus de décision des entreprises, explique à son tour David Kenny, le vice-président IBM Watson et IBM Cloud. Mais il y un problème : beaucoup de données sont encore verrouillées dans les entreprises. » Données que Ginni Rometty évalue d’ailleurs à 80% !
La tâche est donc ardue mais IBM entend la rendre moins compliquée en l’outillant. A l’occasion de Think 2018, IBM a ainsi présenté deux solutions (en fait des améliorations de produits existants qui ont été rebrandés) qui vont en sens. La première, Watson Assistant vise à apporter des modèles d’AI déjà pré-entrainés et spécifiques à certains secteurs de l’industrie.
Cette application est en fait l’évolution de Watson Virtual Agent, mais cette fois-ci avec une approche verticalisée de l’AI. Selon David Kenny, ces modèles ont été entrainés avec des données issues des précédents projets d’IBM. « Nous avons reçu beaucoup de demandes de la part d’industries et Watson Assistant repose sur ces expériences menées avec les entreprises », précise-t-il. IBM est associé avec un partenaire pour chaque industrie. Cette solution cible les secteurs de l’automobile et de l’hôtellerie, de l’assurance et de la banque avec la volonté de le présenter comme un outil pour créer des agents virtuels interactifs. Orange Bank, présent lors de l’événement, en est d’ailleurs un utilisateur à travers Djingo, son concept de conseiller virtuel (les représentants d’Orange Bank n’ont pas souhaité répondre aux questions du MagIT).
Watson Assistant s’inscrit ainsi en complément du Watson Studio - la seconde solution annoncée lors de cet événement. Ce studio, lui, cible davantage les data scientists et se veut une évolution de Data Scientist Experience, proposé jusqu’alors par IBM. Ce produit se voit donc enrichi de nouveaux algorithmes et d’une nouvelle interface. Il s’agit en fait de la fusion de plusieurs outils éparpillés dont se servaient les data scientists en complément de Data Scientist Experience, lance d’ailleurs un représentant du produit – qui a tenu à conserver l’anonymat.
Dinesh Nirmal, vice-président, IBM Analytics, explique à son tour que ce studio permet aux data scientists de créer leurs propres modèles, mais aussi de s’appuyer sur d’autres, pré-intégrés et pré-câblés. Il s’agit là d’accélérer la création de modèles et donc de l’usage de l’AI dans les applications. Reconnaissance vocale, faciale, analyse de sentiments sont ainsi accompagnées des précieux notebooks (ceux de Jupyter), indispensables aux data scientists.
Avec ces solutions, résume Remus Lazar, directeur Data Science et Machine Learning, IBM Watson, interrogé par LeMagIT sur le salon, « les entreprises ont la possibilité d’évaluer les risques en matière d’AI et de modèles pré-entrainés et de les minimiser. Il s’agit aussi de limiter les implications de la DSI, et de réduire les cycles de développement », ajoute-t-il.
Une plateforme hybride pour exploiter ces modèles
Mais pour IBM, cette équation ne serait pas complète sans plateforme capable d’exécuter ces modèles. A l’occasion de Think 2018, Big Blue a ainsi présenté Cloud Private for Data. Cette plateforme reprend ainsi Cloud Private, une implémentation opérationnelle de Kubernetes par IBM, et lui a ajouté une couche dédiée au traitement des données et à l’AI. Selon IBM, elle permet certes d’ingérer des données Vitesse grand V – elle s’appuie sur une base In-Memory - , mais aussi de manipuler des modèles et d’exploiter des applications qui s’y adossent. Cette plateforme intègre des modules propres à plusieurs rôles indispensables dans la création et l’exploitation de modèles : elle emprunte des fonctions à Data Science Experience pour créer les modèles, d’autres pour les transformer (ETL avec InfoSphere DataStage), les nettoyer (Data cleaning), les analyser (Information Analyser), mettre en place une gouvernance (avec Information Governance Catalogue), et les ranger avec DB2 et DB2 Data warehouse.
L’autre point clé est que Cloud Private for Data permet aux entreprises d’opter pour une démarche hybride : entrainer les modèles dans le Cloud, puis les rapatrier sur site pour pouvoir les exécuter dans son Cloud privé, conforme aux politiques de sécurité en place.
En matière d’AI, « la majeure partie du temps est dédié au déploiement, à la découverte et à la préparation des données », confie Dinesh Nirmal. Cette plateforme permet aussi d’allier les différents rôles et compétences nécessaires et de favoriser les échanges, ajoute-t-il.
Des kits de données prêts à l’emploi
Restait donc à apporter ces données – souvent verrouillées et enfouies dans les entreprises, rappelons le - capables d’entrainer ces précieux modèles. Sans l’annoncer lors de Think 2018, IBM a pourtant mis en place un programme baptisé Watson Data Kit. Une démarche de fournisseur de données que certes Big Blue avait déjà entamé, notamment en rachetant The Weather Company et ses données météorologiques, mais aussi dans le secteur de la santé, via la rachat de Truven. Mais avec Data Kit, le groupe entend s’associer à des partenaires industriels pour fournir aux entreprises des jeux de données thématiques et spécifiques. A partir du 2e trimestre 2018, des jeux de données issus des secteurs du transport, de l’alimentation et du voyage seront disponibles. IBM s’est par exemple associé au voyagiste en ligne Triposo pour proposer un kit comportant des points d’intérêt pour « augmenter » les applications des compagnies aériennes ou encore des groupes hôteliers. IBM est actuellement à la recherche de partenaires.