Google Cloud redouble d’efforts pour promouvoir AlloyDB et AlloyDB Omni

Avec AlloyDB, Google Cloud poursuit deux missions : proposer une variante de PostgreSQL taillée pour la recherche vectorielle – l’IA générative, donc – et assouvir ses ambitions multicloud.

La semaine dernière, Google Cloud a annoncé la disponibilité générale de ScaNN, un index spécialement conçu pour la recherche vectorielle rattaché à la DBaaS AlloyDB. AlloyDB est une distribution commerciale et propriétaire de PostgreSQL que Google Cloud dit avoir « boostée ». Le SGBD permettrait de multiplier par quatre l’exécution des charges de travail transactionnelles et par 100 les requêtes analytiques par rapport au SGBD open source.

ScaNN (Scalable Approximate Nearest Neighbor) est un index en arborescence (b-tree), contrairement à HSNW (Hierarchical Small Navigable Word), l’algorithme orienté graphe le plus utilisé pour animer des systèmes RAG.

Accélérer les applications d’IA générative reposant sur PostgreSQL

Or HSNW serait lent et gourmand en mémoire vive, selon Andi Gutmans, vice-président et directeur général des bases de données chez Google Cloud. ScaNN permettrait à AlloyDB de consommer trois à quatre fois moins de mémoire que l’index HSNW combiné à PostgreSQL via l’extension pgvector. Le débit d’écriture serait également 10 fois supérieur à celui de l’algorithme star du projet Apache Lucene. Lors d’un benchmark, GCP assure que ScaNN peut prendre en charge « plus d’un milliard de vecteurs ». Malgré la taille de l’index, les résultats des requêtes seraient retournés sous la barre des 25 millisecondes de latence (p95) avec une précision de 95 % de rappel. « La même technologie est utilisée dans Google Search et YouTube », assure Andi Gutmans.

Si Google Cloud indique qu’il travaille sur cet index depuis douze ans, il n’est pas le seul à remplacer HSNW. De son côté, Microsoft a développé DiskANN, un algorithme orienté graphes open source que le groupe implémente dans Azure Cosmos DB for NoSQL.

« DiskANN peut indexer jusqu’à un milliard de vecteurs tout en atteignant une précision de recherche de 95 % avec une latence de 5 ms, alors que les algorithmes existants basés sur la DRAM culminent à 100-200 millions de points pour une latence et une précision similaires », promet Microsoft.

HazelCast et DataStax ont également choisi d’intégrer cette technologie. En revanche, l’on parle ici de SGBD NoSQL. L’éditeur de Timescale DB, une variante de PostgreSQL taillée pour le traitement des données de séries chronologiques, a lui aussi adopté DiskANN et dit égaler les performances de Pinecone et Weaviate, deux SGBD vectoriels. Le gros des gains est obtenu en exploitant les capacités de compression (quantization) des vecteurs de cette librairie. La technologie de GCP demeure a contrario propriétaire.

Cette prise en charge de la recherche vectorielle avec PostgreSQL n’est pas anodine. Selon le StackOverFlow Developer Survey 2024, 51,9 % des 41 200 des développeurs professionnels exploitent (ou comptent prochainement le faire) la base de données relationnelle. C’est tout simplement le SGBD le plus populaire du sondage. Avec la multiplication des projets d’IA générative, il est donc crucial pour Google Cloud et ses concurrents de renforcer la prise en charge de la vectorisation alors qu’elle est fonction d’une librairie annexe (pgvector) dans le monde communautaire.

Multicloud : après Oracle, Google cloud s’associe à Aiven

Mais AlloyDB – dans sa variante self-managed AlloyDB Omni – est surtout une sorte de cheval de Troie pour tenter de remplacer PostgreSQL autogéré, SQL Server, Oracle ou encore les distributions EDB sur site et dans d’autres clouds. Bref, de servir des ambitions hybrides et multicloud.

Et c’est pour développer sa base installée dans d’autres environnements de cloud public que Google Cloud a annoncé un partenariat avec Aiven. Pour rappel, Aiven est une entreprise finlandaise qui offre des services DBaaS par-dessus des clouds, dont AWS, GCP, Microsoft, Azure, Oracle Cloud, ou DigitalOcean.

Ici, il s’agit d’offrir une version managée d’AlloyDB Omni à déployer sur GCP, AWS et Microsoft Azure. Pour Aiven, il s’agit de proposer une base de données de plus à son catalogue. Pour les clients, la promesse est à la fois d’obtenir un control plane pour leur SGBD et de ne plus dépendre des services des fournisseurs cloud. Cerise sur le gâteau, AlloyDB Omni embarque également l’index ScaNN. Pour l’instant, l’offre est en disponibilité limitée sur les trois clouds. À noter que la tarification de base du service est moins chère sur Google Cloud que chez ses concurrents (0,49 dollar par heure, contre 0,72 et 0,73 dollar par heure pour AWS et Azure avec le forfait Premium).

Comme il le rappelle, GCP ne s’oppose plus systématiquement à Oracle. Il faut dire que la firme de Larry Ellison a réussi à convaincre les trois géants du cloud d’installer dans leurs data centers des régions cloud OCI pour héberger Oracle Database au plus proche des applications résidant sur les serveurs implantés dans les salles voisines. Ce service nommé Oracle Database@Google Cloud était déjà disponible dans quatre régions cloud GCP en Europe et aux États-Unis. « L’ajout de la région Amérique du Sud-Est (Sao Paulo) sera disponible dans les prochains mois, et nous ferons plus que doubler le nombre de régions dans lesquelles nous opérons actuellement jusqu’en 2025 », promet Andi Gutmans.

Google Cloud a des ambitions multicloud, mais reste très attaché à PostgreSQL. Outre AlloyDB et AlloyDB Omni sur Aiven, il a présenté la préversion privée de Firebase Data Connect, un backend as a service pour les applications Web bâties sur Cloud SQL PostgreSQL. « Data Connect prend en charge la gestion sécurisée des schémas, des requêtes et des mutations à l’aide de la technologie GraphQL qui s’intègre à Firebase Authentication », décrit Andi Gutmans. « Le service crée automatiquement un schéma de base de données, un serveur API sécurisé et des SDK générés par type de sécurité pour les applications Android, iOS, Web et Flutter ». Là encore, Firebase Data Connect est compatible avec la recherche vectorielle.

Enfin, GCP annonce la prise en charge future de Valkey 8.0 dans Memorystore, une base de données in-memory conçue comme un remplaçant de Redis, dont la licence n’est plus open source. Le service actuel, Memorystore for Valkey a été dévoilé en préversion le 31 août dernier et prend en charge Valkey 7.2, un ersatz de Redis 7.2. 

Pour approfondir sur Base de données