phonlamaiphoto - stock.adobe.com

IA : DataStax lance une base vectorielle prête à l’emploi pour le RAG

L’éditeur propose Hyper-Converged Data Platform, une offre qui réunit dans une appliance virtuelle tout le nécessaire pour bâtir une IA générative qui soumet les données privées d’une entreprise à un LLM du marché.

L’éditeur DataStax, spécialiste des bases de données NoSQL, lance HCDP, acronyme de plateforme de données hyperconvergée (Hyper-Converged Data Platform). Il s’agit d’une offre prête à l’emploi pour les entreprises qui souhaitent enregistrer leurs documents dans une base de données vectorielle, de sorte à pouvoir alimenter la base de connaissance d’une IA générative lorsqu’on l’interroge avec des prompts.

Les vecteurs sont des représentations mathématiques de concepts, de mots et d’images utilisées par les systèmes d’IA générative pour permettre de poser des questions et pour savoir comparer des ensembles de données. Le but ici est d’obtenir des résultats pertinents au-delà des connaissances qui avaient servi à entraîner l’IA. C’est-à-dire en prenant en compte les données les plus récentes que peut fournir une entreprise.

La plateforme HCDP doit servir à bâtir des plateformes d’IA générative qui peuvent fonctionner dans un datacenter. Elle comprend les microservices fonctionnels que Nvidia a écrits pour développer des applications d’IA générative, dont la fonction RAG (retrieval augmented generation), qui est justement celle qui injecte de manière transparente des données privées issues de bases vectorielles dans les prompts.

« Grâce à ce produit, les entreprises peuvent mettre en œuvre l’IA générative à partir de leurs propres données et de grands modèles de langage tels qu’ils sont disponibles sur le marché. Une entreprise n’a, ici, plus besoin de confier ses données à un tiers susceptible de faire perdre le contrôle sur la façon dont elles sont utilisées », argumente Bill McLane, le directeur technique de DataStax.

Outre les entreprises qui souhaitent garder le contrôle de leurs données pour des raisons de conformité et de sécurité, HCDP s’adresse aussi à celles qui disposent déjà d’importantes bases de données et qui, par exemple, ne souhaitent pas migrer ces données vers le cloud pour des raisons de coût.

Une appliance virtuelle pour infrastructures hyperconvergées

Contrairement à ce que son nom suggère, HCDP n’est pas une infrastructure hyperconvergée au sens d’une appliance matérielle qui combinerait, grâce à un SDS, à la fois de la puissance de calcul virtualisée et des capacités de stockage. Il s’agit plutôt d’une appliance logicielle clé en main que l’on peut déployer sur une infrastructure virtualisée.

En revanche, en raison de son fonctionnement, où le stockage utilisé est proportionnel à la quantité de calculs, HCDP s’exécutera de manière idéale sur une infrastructure hyperconvergée.

Fondé en 2010, DataStax est ancré dans l’espace des bases de données NoSQL. Sa base historique DataStax Enterprise (DSE) repose sur la base de données NoSQL Apache Cassandra. DataStax en propose une version utilisable en ligne, appelée Astra DB.

Extension de HDE, HCDP utilise les capacités de recherche et de visualisation d’OpenSearch, ainsi qu’Apache Pulsar, une plateforme de messagerie qui sert à créer des pipelines de données, pour les charger et les distribuer.

« Les systèmes d’IA générative rassemblent des données en réponse à des questions qui sont transformées à la volée en requêtes de recherche vectorielle. Ces requêtes prennent la forme de vecteurs mathématiques et ils sont comparés à l’ensemble des données vectorielles dont dispose l’entreprise. Les correspondances sont ensuite renvoyées au modèle de langage étendu et utilisées pour préparer la réponse donnée à l’utilisateur », explique Bill McLane.

Toutes les données peuvent être transformées en vecteurs, qu’il s’agisse de catalogues de produits, d’historiques concernant les clients ou de simples fichiers, et peuvent être stockées en vue d’une recherche. Il est aussi possible de transférer les données stockées depuis une base transactionnelle classique, en SQL, pour mettre à jour les données vectorielles.

Pour approfondir sur Middleware et intégration de données