MongoDB et Microsoft se rejoignent autour de l’analytique et de la GenAI
Alors que le géant du cloud favorisait jusqu’alors CosmosDB, son alternative à la base de données de MongoDB, il change d’attitude en établissant un partenariat approfondi visant à accélérer l’adoption de la DbaaS MongoDB Atlas, du « lakehouse » Microsoft Fabric, et, in fine, de son infrastructure cloud.
Le 19 novembre, lors de MongoDB Local Paris, qui se tenait en parallèle de Microsoft Ignite 2024 à Chicago, l’éditeur du SGBD NoSQL éponyme a annoncé un partenariat avec le fournisseur de cloud.
GenAI : Atlas devient un « vector store » pour Azure AI Foundry
Sans surprise, il est question d’IA générative. Ainsi, la DBaaS MongoDB Atlas s’intègre avec Azure OpenAI Service et son chapeau Azure AI Foundry. Atlas peut alors servir de base de données vectorielle afin de propulser des applications de type RAG (Retrieval Augmented Generation) en lien avec les services et produits Microsoft.
« Aujourd’hui, l’intégration native avec Azure AI Studio offre aux clients la possibilité de concevoir rapidement des applications en utilisant quelques lignes de code, des API, et leurs propres données », affirme Frédéric Favelin, global Head Cloud Partner Solutions architect chez MongoDB. « Cela représente un gain considérable en temps et en efficacité, particulièrement dans le développement d’applications comme des chatbots, des Copilot ou des solutions internes ».
Gartner, Deloitte, BCG X et d’autres s’entendent sur une chose : bien qu’une majorité d’entreprises ont testé l’IA générative, une minorité d’entre elles l’ont déployé en production. Entre mai et juin 2024, Deloitte a mené une étude auprès de 2 770 participants. « De nombreux efforts en matière d’IA générative en sont encore au stade du projet pilote ou de la validation de concept », constate Deloitte. « Une grande majorité des personnes interrogées (68 %) déclare que leur organisation a fait passer 30 % ou moins de ses expériences d’IA générative en phase de production ».
D’où la nécessité, selon Frédéric Favelin, de proposer ce type d’intégration, ainsi que d’accompagner les entreprises. « C’est l’un des objectifs de nos programmes d’accélération, car l’intégration des entrepôts vectoriels avec les LLM n’est pas si aisée qu’il y paraît ».
Favoriser les usages de Microsoft Fabric
Le partenariat entre Microsoft Azure et MongoDB couvre surtout l’intégration d’Atlas avec Microsoft Fabric, la suite de traitement de données concurrente de Databricks et Snowflake. Elle rassemble Azure Synapse (ex-SQL Data Warehouse), Data Factory et One Lake. Cette intégration est incarnée par une technologie de mirroring pour ingérer des collections de données stockées dans MongoDB Atlas sur One Lake au format Parquet, à l’aide d’une approche de réplication incrémentale, en batch ou en microbatch pour des analyses en « presque » temps réel.
« Les événements d’insertion, de mise à jour et de suppression se produisant sur la collection MongoDB Atlas source seront reflétés sur la table OneLake cible en temps quasi réel. La conversion du format en Parquet, les conversions de type de données et la gestion des changements de schéma sont toutes gérées par la mise en miroir », précise MongoDB, dans un billet de blog.
Il faut ensuite déployer un point de terminaison SQL Analytics afin de requêter les données (avec T-SQL) dans la collection Mongo. En outre, un modèle sémantique « par défaut » est généré par la procédure afin de créer des rapports Power BI.
« Nos clients ont manifesté un grand intérêt pour les fonctionnalités proposées autour de Fabric, particulièrement en raison de sa capacité à intégrer plusieurs outils comme Power BI et Synapse, tout en soutenant divers cas d’usage et en offrant une gouvernance globale des données », affirme Frédéric Favelin. « Beaucoup se demandaient comment exploiter des données issues de sources comme MongoDB et mettre en œuvre une telle architecture ».
Il ne s’agit pas, pour autant, de répliquer l’entièreté d’une base de données Mongo, précise Frédéric Favelin, mais des collections utiles au cas d’usage cible.
Jusqu’alors, pour arriver au même résultat, il fallait s’appuyer sur ADLS Gen 2 et le moteur de traitement Apache Spark. « Cette approche était perçue comme complexe par certains utilisateurs. Les clients attendaient donc avec impatience une solution plus générique, dont les bases avaient été annoncées l’année précédente », poursuit le responsable.
Cette intégration intéresse plus particulièrement les entreprises cherchant à motoriser des usages de BI, d’IA et de ML dans un contexte opérationnel, par exemple des acteurs de la logistique, de la distribution (retail) ou de l’industrie manufacturière. « Tous clouds confondus, nous avons également des discussions avec des spécialistes des soins de santé », assure Frédéric Favelin.
Le troisième volet du partenariat tient dans la disponibilité de MongoDB Enterprise Advanced (EA) sur Azure Marketplace, mais pour déployer cette distribution commerciale self-managed sur l’environnement Kubernetes d’Azure Arc, c’est-à-dire en cloud hybride.
« Notre objectif, c’est d’aider les développeurs à déployer notre technologie et leurs applications où ils le souhaitent : sur site, dans le cloud, en mode multicloud ou hybride », assure Frédéric Favelin.
Ici, il s’agit plus particulièrement de s’appuyer sur l’opérateur Kubernetes spécifique à MongoDB Enterprise qui faciliterait les déploiements. Dans le cas présent, la console cloud d’Azure devient le control plane d’Azure Arc et du SGBD associé.
Favoriser les migrations vers MongoDB Atlas sur Azure
Enfin, et c’est sans doute le point le plus important du partenariat qui n’est pas évoqué par Microsoft, MongoDB monte un programme commun avec le géant de Redmond accolé à Microsoft Cloud Migration Factory (CMF). Son nom ? MongoDB Migration Factory.
Ici, il s’agit d’accompagner les clients des éditions Enterprise Advanced, souvent de grands comptes, et les utilisateurs de l’édition communautaire de MongoDB (plus de 100 millions de téléchargements par an, selon Frédéric Favelin) à migrer vers MongoDB Atlas sur Azure (disponible sur 48 régions cloud Azure). « Le grand intérêt de ce programme c’est que les ingénieurs de MongoDB et de Microsoft peuvent fournir du “clé en main” : ils automatiseront une partie de la migration et guideront le client avec les bonnes pratiques », avance le responsable chez MongoDB.
« Nous avons réalisé des milliers de projets clients avec le modèle CMF sur l’ensemble des charges de travail Azure, ce qui en fait une approche éprouvée pour accélérer les transitions vers le cloud grâce à une prestation gérée par Microsoft », déclare Rashida Hodge, vice-présidente Corporate d’Azure Data et AI chez Microsoft, dans un billet de blog.
De manière générale, les intégrations avec les fournisseurs cloud sont importantes pour MongoDB. À la fin du deuxième trimestre fiscal 2025 terminé le 31 juillet 2024, l’offre SaaS Atlas représentait 71 % des revenus totaux de l’éditeur (478 millions de dollars au Q2 2025). L’éditeur ne précise pas toutefois la part de revenu associé aux différents clouds.
Du côté de Microsoft, ce partenariat approfondi avec MongoDB semble représenter un changement de braquet. Jusqu’alors, le géant du cloud a tenté de convertir les utilisateurs du SGBD NoSQL à CosmosDB, en l’agrémentant de diverses fonctions similaires, sans toutefois y aller aussi franchement qu’Oracle.
C’était avant Microsoft Fabric, selon Frédéric Favelin. « L’objectif de Microsoft avec Fabric, c’est de faire converger les données de ses clients, ainsi que leurs charges de travail analytiques et d’IA sur une seule plateforme. Et ils se sont rendu compte que, pour ce faire, il faut être ouvert ».
Il n’est pas uniquement question de MongoDB, mais de l’ensemble des SI des entreprises. Fabric dispose de connecteurs pour ingérer les données depuis SAP BW/HANA, Snowflake, Teradata, Google BigQuery, Amazon RedShift, Oracle Database, etc. « En fin de compte, l’objectif de Microsoft est d’encourager ses clients à utiliser son infrastructure », note Frédéric Favelin.