Fotolia
Gluon rapproche Microsoft et Amazon dans le Cloud
Ce nouveau projet Open Source qui rassemble les 2 premiers acteurs du Cloud public vise à simplifier l’usage du machine learning dans le Cloud.
Microsoft et Amazon ont décidé de mettre de côté leur course aux parts de marché du Cloud pour joindre leurs ressources autour d’un projet symbolique : une librairie Open Source pour le Deep Learning dont la vocation est d’automatiser certains processus pour, au final, rendre cet aspect plus consommable par les développeurs.
Le Deep Learning et autre Machine Learning est au coeur des discours de grands du Cloud, que ce soit Microsoft ou AWS, mais également Google ou IBM. Ceux-ci y voient un potentiel énorme et tout l’enjeu est d’y positionner sa plateforme. Mais encore une fois, ces mécanismes sont pour l’heure essentiellement confinés entre les mains d’experts, comme les data scientists. Les développeurs manquent encore de connaissances pour créer puis entraîner des modèles qui sous-tendent les applications.
Les fournisseurs de Cloud mettent en avant des machines virtuelles qui reposent sur des GPU pour ainsi attirer les data scientists. Ils proposent également des API pour accéder à des modèles pré-définis, liés à la reconnaissance d’image ou encore au traitement naturel du langage. Mais, ces efforts, dont l’idée est de proposer un niveau de personnalisation, tout en restant accessibles aux développeurs, ne sont encore qu’embryonnaires.
“Il faut beaucoup de courage pour se mettre au Deep Learning, et cela est différent du traditionnel machine learning, avec bien plus de couches dans un réseau neuronal”, soutient Mike Gualtieri, analyste du cabinet Forrester Research. “ Ce que Microsoft et AWS essaient de faire : faciliter la manipulation alors qu’une grande partie des choses que l’on doit savoir est bien cachée”.
Ce n’est évidemment pas la première fois que Microsoft et AWS collaborent. A l’été dernier, le tandem avait déjà annoncé rapprocher leurs deux technologies d’assistant vocal respectives, Alexa et Cortana. Mais il se pourrait bien que ce soit la première fois qu’ils mènent de front un projet Open Source ayant un rapport direct au Cloud.
“Microsoft et AWS veulent vraiment les lauriers des précurseurs en tentant de simplifier radicalement les processus d’apprentissage des modèles de machine learning”, explique à son tour Arnal Dayaratna, analyste chez IDC. “Ils considèrent cela comme une opportunité pour doter les développeurs d’outils capables de faire aboutir des applications de machine learning.”
L’absence du support de TensorFlow
Google et sa Google Cloud Platform sont certes considérés comme le 3e acteur du Cloud derrière AWS et Microsoft. Le groupe a déjà posé ses pions en matière de machine learning pour le présenter comme l’un des différentiateurs de son offre. Ce qu’il met en avant auprès d’éventuels clients en matière de Big Data et d’Intelligence artificielle. Google utilise largement ses propres fonctions en interne - tout comme Microsoft et Amazon. Sa bibliothèque Open Source pour le machine learning, TensorFlow, a déjà recueilli nombre de soutien dans ce domaine.
Gluon s’adosse quant à lui à un framework Open Source développé par Amazon, et nommé Apache MXNet. Il fonctionnera avec Microsoft Cognitive Toolkit dans une prochaine version. Selon AWS, il devrait également fonctionner avec d’autres frameworks, sans autre détail.
Cela pourrait d’ailleurs être un problème pour Gluon, surtout si des éditeurs se mettent à travailler à des outils qui intègrent plusieurs frameworks, comme H2O.ai , qui fusionne TensorFlow et Caffe. “Ils pensent que s’ils ignorent TensorFlow, ils pourront entraîner une dynamique derrière leur projet, et pas pour TensorFlow; ce que je trouve ahurissant”, confie Alexander Linden, analyste chez Gartner. “Ils sont éclipsés par Google, surtout lorsqu’il s’agit de tous les modèles déjà développés sur TensorFlow.”
Pourtant, TensorFlow reste encore trop difficile pour les développeurs, et une autre option plus accessible de la trempe de Gluon est ici pertinente, ajoute l’analyste.
Le machine learning dans le Cloud reste limité
Malgré toute l’attention que les fournisseurs de Cloud public ont porté sur le machine learning et le deep learning, certains observateurs affirment qu’il ne s’agit pas d’un environnement taillé pour les workloads des entreprises, surtout si elles sont de natures complexes. Selon Alexander Linden, 85% des workloads dédiées au machine learning sont exécutées sur site par des data scientists, soit pour des raisons de coûts, soit pour des raisons de compétences, ou encore de proximité avec les données - on parle dans ce cas de gravité des données.
“Si je veux juste lancer un test, évidemment, j’utilise en premier le Cloud public. Mais lorsque les choses deviennent sérieuses et que j’ai besoin de davantage de puissance de calcul, et ce de façon régulière, le Cloud public devient bien trop cher”, conclut l’analyste.