Stockage : Infinidat implémente à son tour une accélération pour l’IA
Workflow RAG est une reconfiguration de l’architecture des baies du fabricant, afin d’optimiser leur cache très rapide pour les bases de données vectorielles, essentielles à l’ingestion des données d’une entreprise dans une IA.
Après Pure Storage, NetApp, ou encore Vast, Infinidat est le prochain fabricant de baies de stockage à intégrer dans ses produits une fonctionnalité qui aide les entreprises à combiner leurs propres données avec une IA générative. Présentée sous le nom de Workflow RAG, il s’agit plus exactement d’une reconfiguration de l’architecture des baies InfiniBox (à base de disques durs), InfiniBox SSA (à base de SSD et de mémoire cache) et InfuzeOS Cloud Edition (le service de stockage en ligne de l’éditeur).
« En vérité, nous n’avons rien développé de spécial. Il s’agit juste de reconfigurer les fonctions de cache que nos baies mettent en œuvre pour accélérer les bases de données SQL, de sorte que nos baies deviennent plus rapides pour accéder à une base de données vectorielle que l’entreprise cliente est libre de choisir », écrit Bill Basinas, le directeur produits d’Infinidat, dans un billet de blog.
Toutefois, Workflow RAG nécessite de déployer un petit cluster Kubernetes et d’y exécuter les containers fournis par le fabricant pour implémenter la conversion des données de l’entreprise (fichiers, bases de données…) au format vectoriel. Le format vectoriel est le seul capable d’être ingéré par une IA générative pour qu’elle produise des résultats en se basant sur des informations externes à son modèle d’IA, typiquement des informations issues des documents internes d’une entreprise.
Accéder plus rapidement aux données internes depuis une IA
Cette technique est appelée le RAG (Retrieval Augmented Generation). Elle permet notamment de nourrir une IA avec des connaissances les plus récentes possibles. À la manière des systèmes de sauvegarde, l’entreprise peut ainsi lancer chaque nuit une session de vectorisation des derniers documents qu’elle a produits durant la journée précédente.
Eric HerzogDirecteur marketing, Infinidat
« Se pose alors la question de la rapidité d’accéder à des données vectorisées. Par exemple, une grande entreprise qui génère de grandes quantités de données – dans les ventes, l’assistance, les opérations – voudrait augmenter les performances de ce qu’elle fait, grâce à l’IA générative. Elle aura tôt fait de découvrir que cette IA est liée aux performances de son stockage », argumente Eric Herzog, le directeur marketing d’Infinidat.
« Le client veut voir des données précises en temps quasi réel. Il peut utiliser l’IA pour comprendre les détails et être en mesure de mettre à jour ces informations en permanence », ajoute-t-il.
Selon lui, l’architecture d’Infinidat serait mieux placée que d’autres pour accéder aux données vectorisées en raison de l’importance qu’elle accorde aux métadonnées, avec un « cache neuronal » intégré dans les fondations du système InfuzeOS. Le savoir du fournisseur en matière de gestion du cache lui a notamment longtemps permis de proposer des baies de disques durs peu chères pour accompagner des bases de données SQL aux accès pourtant intensifs.
Précédemment, Pure Storage avait mis l’accent sur la vitesse d’écriture de ses baies et la haute disponibilité du stockage à la faveur du RAG. NetApp avait intégré la classification des données pour l’IA via son système d’exploitation OnTap. Vast Data avait quant à lui converti sa base de métadonnées interne en une base vectorielle.