Analyse de données : Ingres VectorWise chasse sur les terres de Teradata
Avec VectorWise, Ingres amène sa solution Open Source sur le créneau du traitement des données en volume. Contrairement à la tendance qui consiste à utiliser la mémoire cache pour accélérer l’analyse des données, Ingres et VectorWise misent quant à eux sur le cache du processeur. Si les performances affichées semblent étonnantes, c’est surtout sur le prix qu’Ingres compte faire la différence. Face à Teradata, notamment.
Moins cher que Teradata et mieux que le In-Memory de SAP. Ingres, éditeur d’une base de données Open Source spécialisée dans les environnements critiques, a inauguré la semaine dernière VectorWise for Linux, un projet de moteur analytique de données dont la particularité est d’accélérer l’accès aux données en exploitant le cache des processeurs multi-cœurs.
La technologie est le fruit d’une collaboration entre Ingres et VectorWise, société issue d’une scission des équipes de développement base de données de l’institut informatique et mathématique d’Amsterdam Centrum Wiskunde & Informatica (CWI). Connu notamment pour MonetDB, un système Open Source de gestion de base de données orientée colonnes, auquel Ingres a par ailleurs collaboré.
Le principe de VectorWise consiste “à casser la barrière qui existe entre le logiciel et le hardware”, explique Eric Soares, vice président des ventes pour l’Europe du sud de Ingres. Et ce, dans un contexte où les entreprises doivent aujourd’hui affronter une explosion du volume de données. “Les SGBD sont aujourd’hui de vieilles dames qui ne tirent pas profit des nouvelles générations de processeurs”, poursuit-il.
Exploiter le cache des processeurs
Ingres VectorWise vient ainsi livrer une réponse au traitement massif des données. A l’inverse de technologies comme In-Memory, poussée par SAP, qui exploite la mémoire vive pour accélérer le traitement des données, VectorWise, lui fait reposer sa technologie sur le cache même des processeurs et sur un mode de stockage des données en colonnes pour augmenter les taux de compression (comme In-Memory d'ailleurs).
“Cette technologie s’adresse aux entreprises disposant d’applications manipulant des volumes de données compris entre 2 et 10 To”, souligne Eric Soares, et vise donc les applications de type datamining et l’analyse décisionnelle.
En point de mire, il s’agit bien sûr de s’attaquer aux solutions de datawarehouse, comme celles de Terradata, “de proposer des solutions à un coût plus abordable”, promet Eric Soares, sans toutefois préciser la tarification. L’idée, confirme Eric Soares, est de faire tourner VectorWise sur des processeurs standards, de type Intel ou AMD. Or, “le prix d’entrée d’une solution de datamining est souvent lié à un type de machine très coûteux”.
Entre 10 et 70 fois plus rapide, promet Ingres
Les performances semblent être au rendez-vous, si on se réfère aux benchmarks publiés. “VectorWise propose des traitements 4 à 5 fois plus rapides que In-Memory”, explique-t-il. Le programme de bêta test mis en place depuis plusieurs mois auprès de partenaires triés sur le volet a également permis de mettre en avant des résultats surprenants. L’éditeur parle de traitements de 10 à 70 plus rapides à ceux des technologies existantes. “70 fois plus rapide pour un test opéré sur une base Oracle et entre 10 et 15 fois sur une base Sybase IQ”, précise-t-il.
Le moteur VectorWise sera intégrée à la base Ingres. "L’utilisateur pourra alors choisir le moteur qu’il lui convient en fonction de son type d’application”, résume Eric Soares. La mise à disposition d’Ingres VectorWise est programmée pour début juillet.
- In-Memory : comment SAP compte ringardiser les bases de données (et surtout marginaliser Oracle)
- Avec In-Memory, SAP pense refaire le coup de R/3, en secouant le monde des bases de données