Warakorn - Fotolia
DbaaS : Google interface Cloud Spanner avec PostgreSQL
Avec la disponibilité générale de Big Query Omni et une nouvelle interface PostgresQL pour Google Cloud Spanner, Google élargit les capacités des services de données sur sa plateforme cloud. Il a présenté ces ajouts lors de son événement virtuel Google Next'21 débuté le 12 octobre.
Google a lancé BigQuery Omni en avant-première il y a un an. Le service BigQuery Omni offre une capacité multicloud pour la plateforme de data warehousing éponyme. Plus précisément, elle permet de fédérer des requêtes en ciblant des lacs de données hébergés sur Azure, d’abord, et maintenant sur AWS.
Lors de la conférence virtuelle, Google a également dévoilé une préversion d’un service Spark géré sur Google Cloud, qui offrira aux utilisateurs une capacité dite serverless pour interroger rapidement les données. GCP délivrait déjà un service managé pour Apache Spark via l’offre Dataproc, mais le fournisseur de cloud prétend que ce service sera plus simple à utiliser pour les data scientists.
Google Cloud a aussi présenté en préversion une interface PostgreSQL pour la plateforme de base de données Cloud Spanner.
Holger MuellerAnalyste, Constellation Research
« Google continue d’imposer son agenda en matière de données et celui-ci est multicloud », déclare Holger Mueller, analyste chez Constellation Research. « Avec Omni, le fournisseur reconnaît que les données des entreprises sont fragmentées à travers les clouds publics ».
Intégration de PostgreSQL dans Google Cloud Spanner
Holger Mueller remarque qu’en plus de reconnaître que les données sont logées dans plusieurs clouds, Google veut aller à la rencontre des développeurs, d’où l’ajout d’une interface PostgreSQL à Cloud Spanner.
Lors d’une session de Google Cloud Next, Andi Gutmans, directeur général et vice-président des bases de données chez Google Cloud, a expliqué que Cloud Spanner est une base de données relationnelle entièrement gérée, qui offre la familiarité et l’expérience des développeurs d’une base de données relationnelle, et l’évolutivité d’une base de données NoSQL.
« Aussi intéressant et unique que soit Spanner, ce n’était pas la base de données la plus accessible pour les développeurs », avoue Andi Gutmans.
D’après ses propos, avec la nouvelle interface PostgreSQL de Cloud Spanner, les développeurs peuvent utiliser leurs compétences et outils PostgreSQL existants avec Cloud Spanner.
« À partir d’aujourd’hui, vous pouvez créer des bases de données Cloud Spanner qui utilisent le dialecte PostgreSQL et se connectent avec son protocole filaire ouvert », affirme Andi Gutmans.
Selon la documentation de Google, l’interface compile les requêtes PostgreSQL aux primitives de traitement et de stockage de requêtes distribuées existantes de Spanner.
Plusieurs options pour les bases de données PostgreSQL
Cloud Spanner n’est pas la première base de données Google Cloud qui prend en charge PostgreSQL. Cloud SQL for PostgreSQL a été lancé en 2018 en tant que service managé.
Andi Gutmans explique que Google propose désormais deux services entièrement gérés pour PostgreSQL. Ces solutions ne servent pas les mêmes besoins, selon lui.
« Pour les migrations lift and shift les plus standards, vous pouvez opter pour Cloud SQL for PostgreSQL », note-t-il. « Pour vos charges de travail les plus exigeantes, où vous avez besoin d’une montée à l’échelle illimitée et d’une disponibilité de 99,999 %, nous proposons Cloud Spanner avec sa nouvelle interface PostgreSQL qui vous permet de tirer parti de vos compétences et de vos investissements dans le système PostgreSQL. »
Cependant, Cloud Spanner for PostgreSQL semble davantage pertinent pour les nouvelles applications, les déploiements greenfield.
L’interface PostgreSQL implémente un sous-ensemble « clés » de types de données et de la syntaxe DDL de PostgreSQL. Selon Google, cela permet aux développeurs de définir leurs schémas comme il le ferait avec un SGBD PostgreSQL standard.
Différents niveaux de compatibilité
Justin MakeigProduct Manager Cloud Spanner, Google Cloud
Pour autant, GCP ne promet pas une compatibilité totale. « La compatibilité à 100 % avec PostgreSQL n’est pas notre objectif », écrit Justin Makeig, Product Manager Cloud Spanner chez Google Cloud. Nous nous sommes concentrés sur la familiarité et la portabilité, afin de faciliter l’accès à la cohérence et à la disponibilité de Spanner à l’échelle sans réduire la flexibilité du déploiement ».
GCP assure tout de même un bon niveau de réversibilité, selon le responsable.
« Les équipes peuvent être assurées que les schémas et les requêtes qu’elles construisent avec l’interface Spanner PostgreSQL peuvent être facilement portés vers un autre environnement PostgreSQL », affirme Justin Makeig.
Le service Cloud SQL for PostgreSQL assure, lui, « une compatibilité maximum » avec l’édition communautaire du SGBD.
En clair, Google Cloud souhaite tout comme ses concurrents favoriser les migrations des bases de données PostgreSQL vers le cloud. Justin Makeig affirme également que Cloud SQL est idéal pour les entreprises qui souhaiteraient migrer depuis une base de données propriétaires vers une mouture open source managée par Google Cloud.