Machine learning : Tibco pousse ModelOps en production
Le spécialiste de l'analytique prétend avoir conçu une sorte de système d'exploitation pour l'IA afin de simplifier le déploiement de l'IA et des modèles de machine learning par les utilisateurs dans les organisations. Il semble plus réaliste de dire que les développeurs et les data engineers emploieront cet outil no-code au service des métiers.
Promis de longue date, Tibco a lancé en disponibilité générale ModelOps, un outil conçu pour déployer et superviser des modèles de data science.
Pour rappel, l’éditeur californien avait présenté une préversion de cet outil en mai 2021, et l’avait mis en tête de liste de sa feuille de route en janvier dernier.
Ce lancement marque la disponibilité générale de l’outil après plus d’un an de mise au point en fonction des commentaires des clients.
L’objectif est clair, selon Mark Palmer, directeur général et vice-président des produits analytics, data science et data chez TIBCO. ModelOps vise à combler le fossé entre les investissements dans la data science et les bénéfices que les entreprises en tirent en simplifiant l’opérationnalisation des modèles de machine learning.
Selon un rapport publié en 2022 par NewVantage Partners, plus de 90 % des organisations investissent dans des initiatives d’intelligence augmentée et de machine learning. Et pourtant, à peine quart d’entre elles affirment avoir été en mesure de déployer à grande échelle des modèles d’IA et de ML.
« Le gros problème, c’est que les entreprises créent des algorithmes et ne les utilisent pas », note Mark Palmer. « Elles dépensent tout cet argent, mais [les modèles] sont bloqués dans un laboratoire. Elles ne rendent pas les modèles opérationnels. »
Les obstacles courants au déploiement à grande échelle de l’IA et des modèles d’apprentissage automatique comprennent la difficulté d’appliquer l’analytique aux applications, d’identifier et d’atténuer les biais, et de gérer le comportement d’un algorithme dans les applications métiers, selon Tibco.
Mais l’obstacle le plus important qui conduit aux résultats inscrits dans le rapport NewVantage Partners est peut-être l’accès aux outils, d’après Mark Palmer.
Les opérations de modélisation et de machine learning – comme les approches DevOps et DataOps (opérations de données) – sont des tendances croissantes dans l’analytique. Elles visent à fluidifier le déploiement de l’IA. Tibco est loin d’être le seul à se positionner sur ce marché : AWS, Cloudera, Domino Data Labs, Databricks, Dataiku ou encore DataRobot y vont de leurs solutions.
Passer les modèles en production
Tibco ModelOps serait toutefois différent des autres outils, assure Mark Palmer.
Les modèles de deep learning et de machine learning sont le plus souvent développés par des data scientists et des professionnels IT, et s’ils sont un jour déployés, ce déploiement sera traditionnellement effectué par ces mêmes personnes.
Le directeur général laisse à penser que Tibco a conçu ModelOps comme un système d’exploitation pour l’IA, qui ne nécessite pas de code pour faire passer un modèle de data science du développement au déploiement. Cela ouvrirait l’accès à l’IA et aux modèles ML à de nouvelles personnes au sein des organisations qui travaillent avec des données, plutôt qu’aux seuls data scientists.
Tibco promet aux utilisateurs de ModelOps tels que les business analysts, les chefs d’entreprise, les développeurs d’applications et les data engineers qu’ils pourront déployer des modèles ML.
« Nous pensons que tous les autres se trompent parce qu’ils se concentrent sur les data scientists », affirme Mark Palmer. « Nous avons expressément conçu un environnement sans code parce que nous croyons fondamentalement que la raison pour laquelle les entreprises déclarent elles-mêmes qu’elles ne déploient pas efficacement les modèles d’IA est qu’elles sont enfermées dans un laboratoire, et les outils MLOps qui existent sont conçus pour aggraver cette situation. »
Sauf que la documentation de l’outil laisse à penser qu’une maîtrise des principes du traitement de données est nécessaire pour l’utiliser. Au mieux, un data analyst chevronné pourra réussir à déployer des modèles, mais il apparaît inutile de laisser entendre que les métiers déploieront eux-mêmes des algorithmes. En revanche, ModelOps semble à la portée des développeurs et des data engineers qui, eux, pourraient mettre à disposition des applications à l’ensemble des collaborateurs.
ModelOps est agnostique des formats de données et il serait facile pour les organisations de gérer et de déployer des pipelines de modèles et des environnements de production, selon Tibco.
Les modèles générés peuvent être accessibles par API et hébergés dans des services cloud ou on premise. Ce moyen de déploiement permet de les appeler depuis les autres outils Tibco, mais aussi depuis les plateformes BI tierces, comme Tableau ou Power BI.
La prochaine étape pour Tibco : convaincre les clients
L’ajout de ModelOps à la plateforme Tibco est une étape logique et nécessaire pour l’éditeur, selon David Menninger, analyste chez Ventana Research.
« Si vous êtes – ou aspirez à être – l’éditeur d’une plateforme, vous devez offrir ces capacités », déclare-t-il. « Comme Tibco a acquis et construit un portefeuille élargi – incluant la data science – il est naturel pour lui d’inclure ModelOps. »
Les opérations de modélisation sont essentielles à la data science poursuit Dave Menninger. Et un outil comme ModelOps peut non seulement permettre le déploiement de modèles en libre-service, mais aussi alléger la charge des data scientists.
« Si un fournisseur souhaite véritablement se positionner sur le marché de l’IA/ML, il doit fournir cette fonctionnalité ou s’associer à d’autres qui la fournissent », tranche-t-il. « Il y a plusieurs défis que ModelOps tente de relever : la formation des modèles, le déploiement des modèles, la détection des biais, la détection des dérives, puis le recyclage et le redéploiement des modèles si nécessaire. Beaucoup de ces tâches sont encore effectuées manuellement ou à l’aide de scripts maison ».
Comme Dave Menninger, Andy Thurai, analyste chez Constellation Research, considère que le développement de ModelOps est une démarche logique de Tibco.
Le déploiement des modèles est un problème pour de nombreuses organisations – tout comme une foule d’autres problèmes de gestion liés aux modèles ML, notamment leur gouvernance, leur validation, le contrôle des versions et les tests –, liste Andy Thurai.
Tibco, quant à lui, offre depuis longtemps des capacités de gestion et d’intégration des données qui pourraient être appliquées au machine learning et à la data science.
« Compte tenu de la position de leader de Tibco dans les domaines de la gestion des données, de l’intégration et des API, ce n’est qu’un ajout naturel », estime l’analyste de Constellation Research. « Cela pourrait aider beaucoup de clients de Tibco qui ont eu des difficultés avec leur pipeline de modèles d’IA ».
Il ajoute que beaucoup entreprises ont soit construit leurs propres systèmes pour déployer des modèles, soit opté pour des outils développés par d’autres fournisseurs. Pour ceux qui ne l’ont pas fait, ModelOps a le potentiel d’être un complément important.
« Pour les clients existants de Tibco qui n’ont fait ni l’un ni l’autre et qui commencent à s’intéresser à ModelOps, cela pourrait être une solution intéressante à considérer », envisage l’analyste.
Tibco veut infuser ModelOps dans ses outils BI
Maintenant que ModelOps est disponible, Tibco escompte l’incorporer dans les plateformes Spotfire, WebFocus et Jaspersoft, les trois outils BI/analytiques de l’éditeur. L’objectif : permettre aux métiers d’inférer ces modèles depuis leur environnement BI.
Des intégrations similaires avec Tibco Data Virtualization, Tibco Cloud EBX et Tibco Streaming sont également prévues, selon Palmer.
Spotfire 12, la prochaine mise à jour de la suite analytique la plus populaire du catalogue Tibco, est prévue pour la fin de l’année et a été présentée en avant-première lors du récent Analytics Forum, une conférence virtuelle de l’éditeur.
Dans cette mise à jour, Spotfire embarquera ModelOps. Les utilisateurs pourront travailler dans leur environnement Spotfire, et lancer des modèles de machine learning plus facilement qu’auparavant.
« ModelOps sera embarqué dans Spotfire », avance Mark Palmer. « Le client n’y pensera même pas. Il ouvrira et connectera un modèle. Il ne saura même pas qu’il s’agit de ModelOps. »
De même, ModelOps sera inclus dans d’autres produits Tibco au fur et à mesure de leur mise à jour, prévient-il.
« Ce sera une fonctionnalité de Tibco EBX, WebFocus et Streaming, mais le premier sera Spotfire », conclut le SVP.