Michael Stonebraker (créateur de Ingres) : 2012 sera une année tourmentée pour les SGDBR
Les traditionnels fournisseurs de bases de données relationnelles, tels que Oracle et IBM, seraient-ils aujourd’hui trop figés pour créer de la valeur en 2012 ? Michael Stonebraker, l’un des créateurs de la base données Ingres, livre quelques réflexions sur le marché des SGDB et y voit une approche verticale émerger. Il détaille également sa vision du Big Data.
Longtemps considéré comme un gourou de la communauté des bases de données, Stonebraker est un chercheur en informatique connu comme étant l’un des créateurs de la base de données relationnelle Ingres. Il a depuis contribué à la création de plusieurs sociétés liées au data management comme Illustra, Cohera et Vertica. Il affirme que sa nouvelle société (au sein de laquelle il occupe le poste de CTO) - VoltDB, qui développe une base hautes performances - est en partie une réponse aux principaux enjeux du monde de la gestion des données.
SearchDataManagement.com a pu discuter avec Stonebraker pour décrypter ces enjeux et connaître ses prédictions pour le marché du datamanagement en 2012. Voici quelques extraits choisis de cette conversation
SearchDataManagement.com : Quelles seront, selon vous, les grandes tendances de 2012 en matière de datamanagement ?
Michael Stonebraker : La première est de comprendre qu’un unique produit ne peut pas convenir à tous les besoins [Le «One size fits all», n’a plus cours, NDLR] et cela devrait donner des sueurs froides aux ténors actuels du marché des bases de données. La seconde : le Big Data peut être défini de trois façons différentes mais les offres du marché n’en traitent qu’une à la fois. La troisième est de retenir qu’ACID (atomicity, consistency, isolation et durability) est vraiment une bonne idée, et qu’il ne faut pas jeter le bébé avec l’eau du bain. La quatrième est de penser «mémoire». Et non plus disques. Enfin, la dernière est d’intégrer progressivement le Cloud comme un moyen sûr de réduction des coûts.
SearchDataManagement.com : Pouvez-vous détailler un peu plus ces tendances. La première par exemple ? En quoi la fin du “one size fits all” impacte-t-elle les fournisseurs de bases de données ?
M.S : Si vous entrez en contact avec votre commercial Oracle, pour lui dire que vous avez un problème de SGBD, il dira à coup sûr qu’Oracle 11g ou Oracle 9i est la bonne solution. Les principaux éditeurs de bases de données ne vendent qu’un unique produit. Ils disposent d’un marteau et tout s’apparente à un clou. Je crois que cette approche ne va plus faire recette dans le futur. Sur chacun des marchés verticaux auxquels je pense, trouver une solution qui supplante les principaux SGBDR de type traditionnel est possible. Tout cela dépend du marché en question. Mais dans un futur proche, j’anticipe la disponibilité de presque une demi douzaine d’architectures de bases de données, adaptées à des verticaux spécifiques. Et les fournisseurs adeptes du «one-size-fits-all» ne seront plus suffisamment compétitifs sur ce segment.
SearchDataManagement.com : Quelles sont les trois significations du Big Data et quels conseils donneriez-vous aux entreprises qui souhaitent analyser d’importants volumes de données ?
M.S : Il y a beaucoup de bruit autour du Big Data. Ce concept a plusieurs significations en fonction du type de personnes. Selon moi, la meilleure façon de considérer le Big Data est de penser au concept de trois Vs. Big Data peut être synonyme de gros volume. Du tera octet au peta octet. Il peut également signifier la rapidité [Velocity, NDLR] de traitement de flux continus de données. Enfin, la troisième signification : vous avez à manipuler une grande variété de données, de sources hétérogènes. Vous avez à intégrer entre mille et deux mille sources de données différentes et l’opération est un calvaire. La vérité est que le Big Data a bien trois significations et que les éditeurs n’en abordent qu’une à la fois. Il est important de connaître leur positionnement pour leur poser les bonnes questions.
SearchDataManagement.com : A propos d’ACID ?
M.S : Je suis un grand fan d’ACID. Je crois que ce concept continuera d’exister en dépit du discours des adeptes de NoSQL. Dans un système conventionnel, ACID est une composante très couteuse et l’argument du NoSQL qui consiste à dire de s’en débarrasser pour accélérer les traitements est difficile à entendre. Il existe de nombreuses problématiques auxquelles ACID apporte une vraie réponse. Selon moi, et c’est ce que nous proposons avec Volt, vous n’avez pas à vous séparer de votre système ACID pour aller plus vite. Ce que vous devez faire, en revanche, est d’architecturer votre système de bases de données d’une façon différente. Différente de l’approche adoptée par les géants du monde relationnel. ACID est performant. Ne jetez pas le bébé avec l’eau du bain. Evacuez seulement l’eau du bain.
SearchDataManagement.com : Pourquoi considérez-vous que la mémoire peut remplacer le disque en matière de stockage ?
M.S : Dans le plupart des applications, vous pouvez commencer à réfléchir en termes de mémoire flash, juste parce que les coûts de plus en plus réduits de cette technologie rendent son adoption plus pratique. Vous pouvez également vous interroger sur la capacité de la mémoire flash à répondre à vos besoins. Vous pouvez considérer la mémoire flash comme une autre technologie, et en ce sens la prendre comme un nouveau disque. Mais vous n’avez plus à considérer le disque comme la solution universelle.
SearchDataManagement.com : Pourquoi pensez-vous que les entreprises devraient réfléchir au cloud privé en 2012 ?
M.S : Les entreprises disposent de nombreux silos, qui ne fonctionnent pas tous à plein régime. Il est donc pertinent pour la plupart d’entre elles d’investir dans un Cloud privé - un ensemble de machines dans une ferme de calculs, à l’intérieur du firewall, sur laquelle une couche de virtualisation est appliquée de façon à permettre aux données en silo de partager cette infrastructure. Si l’application fonctionne à l’intérieur du firewall, les verrous, cités par les entreprises au sujet des Clouds publics, se mettent à sauter. Tôt ou tard, les prix vont s’aligner sur les coûts et tôt ou tard, toutes les entreprises pourront réaliser des économies en basculant sur un cloud public. La seule limite sera celle de la légalité. J’anticipe un déplacement des données en silo vers le Cloud à l’intérieur des firewalls et, à terme, vers les Clouds publics.
Traduit de l’anglais par la rédaction