PaaS et IA : OVHcloud précise sa feuille de route pour 2023
Avant la fin de l’année 2023, OVHcloud veut finaliser une collection de services PaaS capables de couvrir l’ensemble des cas d’usage liés aux traitements de données, ce qui implique la livraison d’un lakehouse. Une entreprise qui demande de revoir son infrastructure.
Parti après les autres, le fournisseur doit mener des projets sur plusieurs fronts. Dans le domaine, en 2022, OVHcloud a principalement déployé des bases de données managées, 12 SGBD au total, et a complété son portfolio consacré aux charges de travail d’IA.
Aux services AI Notebooks (Jupyter, VS Code, et bientôt Matlab) et AI Training, s’est ajouté AI Deploy, accessible actuellement en bêta. La disponibilité générale de cette solution consacrée à l’inférence de modèles depuis des conteneurs Docker est prévue pour le 3 avril 2023.
Plus tard dans l’année, OVHcloud compte commercialiser une marketplace qui accueillera des modèles préentraînés, dont ceux des startups Gladia et Voxist. AI Notebooks, Training et Deploy sont compatibles avec Conda, PyTorch, TensorFlow, Scikit-learn, Fast.AI et la plateforme Huggingface. Le fournisseur veut également rendre disponible des « tranches de GPU pour permettre d’affiner le coût de l’apprentissage », dixit Thierry Souche, CTO d’OVHcloud, lors de l’événement Very Tech Trip, qui se tenait ce 2 février à la Cité des sciences et de l’industrie, à Paris.
Concernant l’inférence, OVHcloud anticipe plusieurs modes d’utilisation, suivant les usages et le nombre d’appels API. Il s’agit par ailleurs de rendre possible « l’exécution de modèles sur de multiples GPU », et leur déploiement sur site.
Cela ne suffit pas à constituer une plateforme de traitement de données. C’est pour cette raison que le fournisseur a mis la main sur ForePaaS en avril 2022. Cette startup française spécialisée dans l’analytique a commencé par développer un moteur ELT/ETL pour finalement proposer une PaaS analytique à ses clients.
Sans mettre fin à la disponibilité de cette solution sur d’autres clouds (la plateforme de ForePaaS peut être déployée sur AWS, Microsoft Azure, GCP ou OVHcloud), le fournisseur entend découpler et enrichir ces fonctionnalités pour fournir sa propre collection de services PaaS. OVHcloud va adapter la brique ELT/ETL de ForePaaS, qui sera disponible en alpha au mois d’août 2023. Elle disposera d’une cinquantaine de connecteurs. Cette solution de collecte et d’ingestion de données complétera le service Apache Kafka à la demande et s’ajoutera aux bases de données managées, aux outils d’observabilité, aux services de processing Apache Spark, et aux solutions d’IA.
Un lakehouse open source en approche chez OVHcloud
Mais il manque encore des briques clés pour compléter cette collection. L’une d’entre elles n’est autre qu’un lakehouse open source, « hautement personnalisable », dont une première version devrait être accessible « dans le courant de l’hiver 2023 ». Les premières illustrations suggèrent une interface similaire à celle de Snowflake. Il s’agira en premier lieu d’interroger des données relationnelles placées dans des instances de stockage objet compatible S3. L’équipe derrière ForePaaS est également en train de développer un outil de visualisation de données « à la Apache SuperSet ou à la Metabase » (deux outils de visualisation open source N.D.L.R), ainsi qu’une interface « no-code » afin de rendre le tout simple d’utilisation pour les data analysts.
Au cours de l’année 2023, OVHcloud veut aussi pouvoir transférer ou exposer les données vers des outils tiers, qu’ils soient hébergés sur son cloud, ou non. Sur un slide diffusé lors de l’événement Very Tech Trip, le fournisseur évoque Tableau, Dataiku, ALEIA, ou encore Qlik. « Si vous n’aimez pas notre dataviz, nous serons nativement ouverts vers les solutions leaders du marché », promet Thierry Souche. Ce sera aussi vrai pour le lakehouse, si les éditeurs tels Snowflake, Databricks ou encore Dremio sont prêts à suivre le fournisseur français.
Dans un même temps, OVHcloud fait évoluer son stockage objet. À la fin du mois d’octobre dernier, il annonçait la disponibilité en bêta de Cold Archive, un tier (très) « froid » pour son stockage objet compatible S3 (les données sont stockées sur des bandes physiques IBM). Il proposera d’ici à deux mois des réplications asynchrones et inter-régions des buckets, ainsi qu’un système de gestion des politiques de déploiement et d’accès. En outre, les bases de données SQL s’intégreront plus facilement avec ce service.
Une refonte nécessaire de la pile technologique
Auprès du MagIT, Thierry Souche relate qu’OVHcloud revoit l’ensemble de sa pile technologique pour supporter cette PaaS ainsi que ses services de cloud public. « Aux origines, on a vu un OVH très verticalisé, très siloté. Je n’étais pas là, mais j’observe le résultat : la stack a été optimisée “aux petits oignons” à tous les niveaux pour répondre à des enjeux d’hébergement, de Web, de bare-metal », indique-t-il.
Aujourd’hui, avec l’intention d’attirer de grands comptes et des administrations sur le cloud français, les enjeux ne sont plus les mêmes. « Il faut “plateformiser” complètement OVHcloud. C’est un travail en cours, qui ne se fait pas en un jour, mais nous avons des bases solides », assure le CTO.
Octave Klaba, président du conseil d’administration d’OVHcloud, a révélé lors de la conférence que la société investit 1 milliard d’euros dans les 80 services de cloud public disponibles ou en cours de développement.
« Nous n’avons pas les moyens humains de nos concurrents américains. Nous essayons d’aller aussi rapidement que nous le pouvons tout en maintenant l’ouverture de notre cloud », défend Thierry Souche.
Au-delà de l’usage important de technologies open source, cette ouverture est également à prendre au sens propre. Lors de son événement, le fournisseur a présenté les futures évolutions de son service Kubernetes managé qui pourra être déployé sur son cloud, sur site ou chez d’autres fournisseurs de cloud.
En clair, OVHcloud est bien conscient qu’il ne peut pas faire sans les trois géants du marché s’il veut convaincre les grands comptes internationaux. « Nous avons des clients qui ont des besoins complexes, multiples. Évidemment, ils se fournissent déjà chez un des leaders du marché. Moi, je dois m’assurer que nos services puissent se connecter et s’intégrer avec les technologies de ces acteurs-là », affirme Thierry Souche. OVHcloud se différencie toutefois par son offre souveraine, et ses services certifiés SecNumCloud. Une spécificité qui commence à intéresser les entreprises, même américaines.