H2O s’essaye au deep learning low-code/no-code
Selon l’éditeur, H2O Hydrogen Torch peut être utilisé dans les secteurs de la santé, des ressources humaines et de l’expérience client. Les utilisateurs peuvent créer des modèles simples pour les applications de computer vision et de NLP en low-code/no-code.
H2O.ai, l’éditeur d’une plateforme de data science open source pour les entreprises, a présenté le 17 février un nouvel outil de deep learning.
H2O Hydrogen Torch est un outil low-code/no-code que les sociétés peuvent utiliser pour entraîner et optimiser des modèles de traitement d’images, de vidéos et de langage naturel (NLP).
Selon l’éditeur, l’outil aidera les organisations à créer des modèles d’apprentissage automatique à partir de données non structurées telles que des images, des vidéos et des avis sur des produits pour des applications dans les domaines de la santé, de la fabrication et de l’assurance, entre autres.
« H2O a beaucoup d’expérience dans l’opérationnalisation des modèles de machine learning avec les entreprises », déclare Kashyap Kompella, analyste chez RPA2AI Research. « Il s’agit d’une extension de cette capacité dans le contexte du deep learning ».
Hydrogen Torch est en réalité une interface graphique par-dessus un système de traitement de données propulsé par plusieurs projets open source : H2O Wave, PyTorch, TorchVision, Albumentions, MLFlow, Scikit-Learn, etc. Il permet de charger des données manuellement ou depuis S3. Les utilisateurs peuvent manipuler les paramètres des modèles au clic ou en employant des scripts Python.
L’IA et le domaine médical : éviter les belles promesses
Mais H2O.ai peut courir le risque de faire des promesses excessives avec les diverses applications potentielles de Hydrogen Torch pour l’apprentissage profond, selon Dan Miller, analyste chez Opus Research.
H2O.ai assure que Hydrogen Torch peut classifier, recadrer et détecter des objets sur des images et des vidéos. L’outil pourrait également être entraîné à analyser des radiographies pour déceler des anomalies avec un « humain dans la boucle », par exemple.
Toutefois, l’utilisation de l’IA dans le domaine médical pourrait être plus compliquée que ne le pense H2O.ai, déclare Dan Miller.
« Les applications médicales de l’IA sont un bourbier qui a été révélé lorsque Watson d’IBM a essayé de faire une démonstration d’applications humaines dans la boucle pour les diagnostics », poursuit l’analyste, en faisant référence au système d’IA Watson Health d’IBM, dont le géant technologique a récemment vendu la plupart des actifs.
La tentative de H2O.ai de pénétrer le secteur médical n’est pas sans rappeler la manière dont IBM a utilisé Watson pour travailler avec les hôpitaux afin de trouver des modèles et des anomalies dans les radiographies, remarque Dan Miller.
Toutefois, si IBM Watson a connu quelques succès, les instituts d’oncologie et le fournisseur ont réalisé que les diagnostics et les recommandations de traitement précis doivent provenir des médecins et non principalement des modèles d’IA.
Bien qu’IBM Watson et Hydrogen Torch se fassent concurrence, une meilleure comparaison serait celle entre le battage médiatique et la réalité de l’IA, soutient Sri Ambati, PDG et cofondateur de H2O.ai.
« Le fait de trop promettre et de ne pas tenir ses engagements a été un problème pour notre secteur, mais cela n’enlève rien au fait qu’il y a beaucoup de bonnes innovations qui ont vu le jour », défend le CEO.
Et bien que le domaine médical soit complexe et qu’il soit facile de se laisser submerger par la richesse du secteur, il est important de travailler avec des experts du domaine humain, ajoute-t-il.
« Le problème est difficile, profond et multidimensionnel », souligne-t-il.
Les maladies et les problèmes de santé affectant chaque patient différemment, il est difficile d’appliquer l’IA à des situations aussi variées, explique Sri Ambati.
C’est pourquoi, afin de s’assurer que les algorithmes d’IA et les modèles d’apprentissage automatique répondent à des scénarios complexes du monde réel, H2O.ai travaille en étroite collaboration avec de grands hôpitaux et organismes de soins américains pour apporter ce qu’Ambati appelle une « approche multidimensionnelle ».
« Je pense que les premiers succès ou les échecs prononcés de Watson et d’autres étaient dus au fait qu’ils étaient en quelque sorte les dinosaures de notre espace », a-t-il poursuivi. « Le marché a radicalement changé depuis ces échecs ».
Création d’un modèle no-code
En ce qui concerne le NLP, Hydrogen Torch peut être employé pour créer des modèles de classification de texte, de régression, de catégorisation de jetons (tokenisation) et d’analyse de séquence à séquence. H2O.ai indique que l’outil peut prédire le degré de satisfaction d’un client à partir de la transcription d’un appel téléphonique ou en résumant et en analysant une grande partie du texte, comme une transcription médicale.
Cependant, « la description de l’utilisation de H2O Hydrogen Torch pour le traitement du langage naturel ne semble pas accessible au type de personnes auxquelles ils s’adressent », observe Dan Miller.
Les professionnels qui recherchent un outil d’IA no-code ne comprennent pas nécessairement les caractéristiques d’Hydrogen Torch, prévient-il.
« Si vous allez ingérer un grand nombre de données non structurées et ensuite détecter des motifs, alors il devrait y avoir une sorte de langage naturel pour comprendre les motifs que vous avez vus », poursuit l’analyste. « Je pense qu’ils disent qu’ils font cela, mais je ne peux pas le confirmer ».
Dans une vidéo de démonstration, un ingénieur de H2O montre les fonctionnalités d’Hydrogen Torch. Pour le traitement d’images, il est possible de vérifier les performances de l’algorithme de vision par ordinateur en accédant à des échantillons. Ici, l’algorithme est entraîné à reconnaître des épis de blé. En revanche, il faut être conscient du problème que l’on souhaite résoudre et comprendre les principes des modèles à appliquer.
De la sorte, un data scientist peut analyser des radiographies à la recherche de signes d’une pneumonie et faire contrôler les résultats du modèle par un pneumologue et un radiologue avant son déploiement.
Selon Sri Ambati, les nouveaux data scientists ou les professionnels n’ont pas besoin d’utiliser du code pour « créer » des modèles dans Hydrogen Torch. Cependant, le côté low-code de l’outil entre en jeu lorsqu’on prend les modèles entraînés avec Hydrogen Torch et qu’on les intègre dans des applications ou qu’on les déploie dans des services basés sur des API pour fluidifier leur consommation.
Selon H2O.ai, Hydrogen Torch a été conçu par les Grandmasters de Kaggle, des membres experts de la communauté en ligne des praticiens de la data science et du machine learning. Appartenant à Google, cette organisation programme des concours et un banc d’essai hébergé sur le cloud et publie des jeux de données.
S’il est bien possible d’entraîner un modèle à détecter un objet sur une radiographie (une tumeur par exemple) d’après la documentation, l’outil semble plutôt calibré pour réaliser des expérimentations ou de petites transformations de données, souvent pénibles ou répétitives, comme des augmentations de data sets et de la tokenisation. Il ne faut pas s’attendre à développer des mégamodèles avec Hydrogen Torch, mais à tester des fonctionnalités avancées ou à bâtir des portions d’un système d’IA plus complexe.
L’outil est actuellement disponible depuis la plateforme AI cloud de H2O. Les clients peuvent l’essayer gratuitement. Les tarifs pour les clients qui veulent acheter le service dépendent de l’application, indique le CEO.