VoltDB 3.0 mise sur son approche « New SQL » pour accélérer le Big Data
La base de données In-Memory SQL, créée par le gourou des bases Michael Stonebraker, débarque dans sa version 3.0, prête à imposer ses performances et son architecture innovants au marché du traitement des Big Data.
La base de données In-Memory SQL, créée par le gourou des bases Michael Stonebraker, débarque dans sa version 3.0, prête à imposer ses performances et son architecture innovants au marché du traitement des Big Data.
La semaine dernière, VoltDB, a présenté une version revisitée de sa base de données phare, l’une de ces bases haute performances, construites dans un but bien particulier, et qui portent l’étiquette « New SQL ». La version 3.0 de VoltDB pousse encore plus loin les performances des transactions, tout en accélérant l’exécution de requêtes SQL ad hoc. Elle propose également des connecteurs plus rapides et, logiquement, des points d'intégration pour les implémentations cloud et les développements Javascript.
En que tant que base « New SQL », VoltDB vise à profiter des avantages de la mémoire tout en évitant certains des désavantages liés au stockage sur disques durs, qui a contribué à l’avénement des systèmes de gestion de bases de données relationnelles. Mais, contrairement à certaines bases de données très tendance de type « NoSQL », VoltDB supporte en natif le programmation SQL, ce que proposent aussi d’autres bases dites « New SQL ».
Une base de données "in-memory"
« VoltDB est une base de données relationnelle in-memory dont la vocation est d’accélérer le traitement des données en volume ainsi que leur importation », affirme Matt Aslett, directeur de recherche sur les thématiques data management et analytiques au sein du cabinet d’analystes londonien 451 Research Group. Par importation, il fait notamment référence aux applications qui consomment de plus en plus de données ou alimentent à grande vitesse une base de données avec des flux de données.
Aslett affirme que la société a déjà connu quelque succès notamment dans des applications pour le marché des services financiers, mais que la solution pourrait également trouver des usages dans des applications Web. « Son secteur de prédilection pourrait bien être les applications Web transactionnelles », souligne-t-il.
La technologie de VoltDB est née de travaux académiques réalisés sur le moteur de traitement de transaction H-Store. Des travaux surtout entrepris par l’un des piliers du monde des bases de données Michael Stonebraker (à qui l’on doit notamment la base de données Ingres). H-Store a été commercialisé pour la première fois sous le nom de VoltDB en 2010. Cette première version (v 1.0) se présentait sous la forme d’une édition communautaire Open Source.
En tant que RDBMS SQL de type In-Memory, VoltDB est conçu pour fournir des rendements à très haut débits. Tout en supportant SQL ainsi que le modèle de transactions ACID, la base a pour particularité de dépasser le locking lié au disque dur, ainsi que les étapes du verrouillage et de gestion du buffer, qui créent de la latence et une surchauffe du traitement des transactions, explique Stonebraker, qui officie au poste de directeur technique de la société VoltDB.
Dans sa longue carrière, Stonebraker a joué un rôle majeur dans le monde des bases de données, notamment au coeur de projets, comme Ingres et PostgreSQL, mais également au sein de start-ups plus récentes comme Streambase et Vertica (rachetée par HP). La semaine dernière, à l’occasion d’une conférence développeurs près du MIT, il a affirmé devant un auditoire très attentif que les bases de données généralistes seraient, dans les années à venir, confrontées à la concurrence de bases de données spécialisées.
VoltDB parie sur la spécialisation du marché des bases de données
Ce qui, ainsi, pourrait déboucher sur un paysage bien plus varié des bases de données. « Je pense qu’entre 5 à 10 architectures auront la capacités de survivre », a-t-il souligné. Par bases spécialisées, il entend surtout des bases qui ont une mission unique, suivent un objectif précis. Il affirme également que certaines de ces architectures ont un avantage lorsqu’il s’agit de performances optimisées.
« En matière de rapidité de traitement, ces systèmes sont sûrs de remporter la bataille », soutient-il. VoltDB, insiste-t-il, offre des gains de performances grâce à son usage de sa mémoire principale, des procédures stockées et de son ordonnancement déterministe. Toutefois, l’expérience de terrain à conduit VoltDB à réaliser quelques modifications et adaptations pour de nouvelles gammes d’applications qui doivent ingérer très rapidement de grandes quantités de données issues du Web.
Pour Ryan Betts, ingénieur logiciel chez VoltDB, la société a créé un système d’exportation-extraction ultra-rapide et a facilité la tâche des développeurs en l’intégrant à des briques analytiques, comme celles des appliances entrepôts de données de Netezza d’IBM ou encore de Vertica. « Nos cas d’usage tournent presque toujours de l’ingestion de données à grande vitesse », ajoute Bruce Reading, président et CEO de VoltDB.
Traduit de l'anglais par la rédaction