MongoDB officialise sa stratégie d’expansion dans le cloud
MongoDB a annoncé la disponibilité générale de son service Atlas Data Lake, de Realm ainsi que la bêta de la version 4.4 de sa base de données orientée documents.
Après un an en bêta, Atlas Data Lake est maintenant disponible sur GCP, Microsoft Azure et AWS. L’éditeur new-yorkais a ainsi étendu les capacités de sa plateforme Atlas Cloud.
« MongoDB estime que l’architecture d’une application moderne nécessite plus qu’une simple base de données centrale », constate Sahir Azam, chef des produits cloud chez MongoDB.
Atlas Data Lake utilise le langage de requête orienté documents de MongoDB (MQL) et permet aux développeurs d’exécuter des requêtes analytiques sur des données « qui n’ont pas forcément été créées à partir d’une base de données MongoDB », déclare le chef de produits cloud. Les requêtes sont fédérées sur des instances Atlas et sur des données stockées dans des buckets S3.
Un des principaux avantages du service Atlas Data Lake, serait son intégration avec S3 pour faciliter l’archivage de données. Sahir Azam souligne que certains types d’applications, comme les solutions IoT, peuvent générer plusieurs pétaoctets de données, ce qui n’est pas économique à stocker dans un SGBD transactionnel comme MongoDB.
Auparavant, les utilisateurs devaient manuellement copier les données de la base vers le système de stockage d’AWS. Cependant, une fois dans un bucket, il était difficile de les interroger avec MongoDB.
Sahir AzamChef des produits cloud, MongoDB
« Nous automatisons le processus afin que les clients puissent établir une règle pour automatiser l’archivage de données », assure Sahir Azam. « Nous nous occupons de l’archivage, mais surtout, nous permettons à ces données d’être toujours interrogeables par le système central, sans aucune modification de l’application ».
« Atlas Data Lake étend les capacités de [la base de données] MongoDB pour permettre aux utilisateurs de collecter et d’interroger des données provenant de sources multiples », assure Carl Olofson, analyste chez IDC. « Je ne suis pas sûr que le produit soit en concurrence directe avec les autres offres de Data Lake, mais il semble plutôt déterminé à offrir une capacité analytique complète pour compléter leur SGBD opérationnel ».
Si l’observation de Carl Olofson est juste, MongoDB n’est pas le seul à vouloir fédérer les requêtes. Par exemple, AWS a également présenté une fonctionnalité similaire dans RedShift afin d’interroger les données sur les distributions de PostgreSQL AWS (Amazon RDS et Aurora), ainsi que dans les environnements S3 et Redshift. Seulement, l’éditeur new-yorkais vise en premier lieu les développeurs, tandis que RedShift se destine davantage aux applications BI.
De son côté, la DBaaS Atlas bénéficie d’une nouvelle fonctionnalité nommée « Schema Suggestions ». Celle-ci analyse automatiquement la collection de documents disponible sur la version managée du SGBD, détecte des anti-patrons (des erreurs communes) et effectue des recommandations (des paramètres, des index, des noms à changer) pour améliorer la forme et la manière dont les documents sont placés dans la collection. La fonctionnalité renvoie directement le développeur vers la documentation associée aux erreurs détectées.
Le « Sharding », l’atout de MongoDB 4.4
L’éditeur met également à jour sa base de données open source, maintenant disponible en bêta.
MongoDB 4.4 introduit une fonctionnalité connue sous le nom de « refinable shard keys » qui permet aux utilisateurs de mieux gérer la manière dont les données sont distribuées dans un cluster MongoDB. Le sharding de base de données est une approche visant à découper les données en plusieurs unités – des tessons (shards) – qui sont réparties sur un cluster. Avec le temps, au fur et à mesure qu’une base de données se développe, les utilisateurs ont souvent besoin d’ajuster la manière dont les tessons sont distribués, selon Sahir Azam.
« Si vous avez besoin d’affiner la manière dont les données sont effectivement distribuées, vous pouvez maintenant changer cela dans la base de données et nous en gérerons la redistribution de manière transparente et sans perturbation », vante-t-il.
Ainsi, les données peuvent être distribuées à travers plusieurs clusters hébergés dans plusieurs régions dans le monde. En principe, cela facilite le respect du principe de résidentialité des données, une recommandation présente dans le règlement RGPD, par exemple.
Une autre nouveauté de MongoDB est la fonctionnalité « hedged reads », inspirée d’Hadoop. Elle peut aider à améliorer la vitesse de consultation des bases de données en optimisant les requêtes, à travers un cluster shardé uniquement (pour le moment).
MongoDB étend enfin son royaume au mobile
Par ailleurs, le nouveau service MongoDB Realm, désormais disponible dans le monde entier, s’appuie sur la base de données open source Realm. Il doit permettre aux développeurs d’exploiter un SGBD mobile dont les données sont potentiellement synchronisées avec le cloud MongoDB.
Par exemple, l’utilisateur d’une application mobile peut ne pas toujours avoir de connectivité lorsqu’il voyage en métro. Mais avec une base de données locale sur l’appareil, l’application fonctionnera toujours, et une fois que l’utilisateur aura retrouvé la connectivité, l’application pourra être synchronisée avec son pendant dans le cloud.
Sahir AzamMongoDB
« Nous ne voulons pas faire passer une base de données côté serveur pour une version mobile et inversement. Nous voulons combiner le meilleur des deux mondes », martèle Sahir Azam.
Avec Atlas, Atlas Data Lake, Atlas Search, Realm et Charts en plus de sa base de données, MongoDB espère fournir une boîte à outils complète pour les développeurs dans le cloud.
« Fondamentalement, nous essayons de simplifier la façon dont les développeurs travaillent avec les données afin qu’ils puissent se concentrer davantage sur la création d’applications », conclut le responsable des produits cloud.