NoSQL : les trois piliers de la stratégie d’Oracle (pour les gouverner tous)
Lors de l’OpenWorld 2016, James Steiner, VP Product Management, a explicité pour LeMagIT la stratégie et la philosophie d’Oracle face aux nouveaux entrants du NoSQL. Des acteurs qu’Oracle entend à la fois contrer et chapeauter.
Le monde des bases de données n’est pas encore chamboulé. Mais le NoSQL a ouvert la porte à de nouveaux acteurs (AWS ou Cassendra par exemple) qui concurrencent les géants (Oracle, IBM et Microsoft en tête), chose impensable il y a encore quelques années.
Plusieurs signes témoignent de ce mouvement. Le Magic Quadrant de Gartner en 2015, place désormais Marklogic, MongoDB, Redis ou DataStax dans les leaders technologiques du marché. De son côté, IDC considère que « les bases non relationnelles » (sic) connaissent un « un succès croissant » et que les « progressions de ces produits éclipsent désormais la stagnation des SGBD plus anciens ».
Certes, les bases NoSQL (« Not only SQL ») restent minoritaires (environ 10% en valeur selon IDC/ BernStein Analysis), mais leurs popularités - suivies par DB-Engines - se confirment chaque jour un peu plus sur une tendance douce mais solide.
La popularité croissante des principales bases NoSQL
Face à ce mouvement, Oracle - leader historique des bases relationnelles – positionne patiemment et méticuleusement ses pions.
Persistance Polyglotte
Le premier axe d’attaque – ou de contre – d’Oracle dans le SQL, consiste à proposer une gamme de produits pour chaque domaine du NoSQL : les bases de type clef/valeur, orientées document (JSON ou XML) ou orientée graphe.
Cette volonté s’apparent à ce que Sun appelait la « persistance polyglotte ».
« La persistance polyglotte est un concept qui dit que vous avez besoin de bases spécifiques pour des sources de données spécifiques liées à des applications spécifiques », rappelle James Steiner, VP Product Management, dans un entretien avec LeMagIT lors de l’OpenWorld 2016. « Nous pensons que dans le monde de la gestion des données, il y a de la place pour une multitude de technologies – et nous les proposons ».
L’exemple type de cette stratégie est Oracle NoSQL. Disponible en stand-alone, « C’est une base orientée clef/valeur, avec un support des transactions, qui peut être distribuée et partitionnées (sharded) ». En clair, « c’est un concurrent des autres bases NoSQL comme MongoDB ».
Dans les bases orientées graphe, nouvelle vague du NoSQL, l’offre d’Oracle est – paradoxalement – ancienne d’une dizaine d’années.
« La première fois qu’on a commercialisé des technologies orientées graphes, c’était pour un usage spécifique. Elles faisaient partie de notre offre pour les réseaux urbains. Parce que quand vous gérer ces réseaux vous voulez modéliser des trajets, les sens uniques, les limitations de vitesses, le nombre de voies, etc. C’est une application typiquement orientée graphe. Puis les cas se sont diversifiés, avec des technologies de graphes elles aussi diversifiées. Nous avons intégré des modèles de graphe RDF, le standard du W3C, pour l’analyse sémantique sur le web ou l’analyse des origines des textes et des publications… C’était il y a 10 ans ».
James Steiner, Oracle VP
Aujourd’hui, l’heure est aux bases orientées graphe « généralistes ». « La raison pour cela c’est le Big Data. On a les données appropriées pour que toutes les entreprises fassent ce type d’analyses ».
Résultat, Oracle a présenté une offre il y a deux ans, qui en est à sa 4ème version (2.0). « C’est un produit unifié à la fois pour les requêtes et pour l’analytique. Cette technologie propose le meilleur des deux mondes de Neo4J et de Titan (NDR : une base adaptée aux requêtes, hautement scalable, pour des environnements distribués et pour de très grandes bases) ». Mais, ajoute immédiatement James Steiner en bon vendeur, avec une rapidité et adaptée à des beaucoup plus grandes quantités de données (« vous pouvez y mettre des milliards de nœuds et de relations »).
Les « early adopters » de ces fonctionnalités seraient dans la sécurité, le secteur public, l’industrie financière et la banque, l’analyse des réseaux sociaux ou l’analyse du comportement client (quels produits sont achetés ensemble, etc.). Et bien que la technologie ait 10 ans, « ce sont les tous débuts de ces usages généralistes », constate James Steiner.
Cette base et ses fonctionnalités ne sont néanmoins pas disponibles en produits indépendants chez Oracle. Elles fontt partie intégrante des offre Big Data de l’éditeur : en tant qu’option dans l’appliance Big Data, comme une partie de Big Data Cloud Service, et proposée dans l’offre d’infrastructure Hadoop sur site.
Autre manifestation de cette stratégie « polyglotte », la base In-Memory TimesTen et la base clef/valeur Berkeley DB.
« Toutes ces bases répondent à des besoins d’applications spécifiques. Elles sont spécialement conçues pour. Par exemple si vous faites une application de carte de shopping et que vous avez besoin de faire rapidement un hashage, vous utiliserez une base NoSQL orientée clef/valeur. Beaucoup d’entreprises utilisent Oracle NoSQL pour cela. Ce cas d’usage sera là pour longtemps, très longtemps ».
Base multimodale
Cette approche n’est cependant pas la culture principale d’Oracle. Car « au fil du temps, la base d’Oracle a intégré des capacités spécifiques ». Pour devenir ce que James Steiner appelle une base « multimodale » par opposition à cette « persistance polyglotte ».
« Dans l’histoire des bases de données, il y a eu une époque où il y avait des bases spécifiques pour les entrepôts de données. Vous vous souvenez de Redbrick ? Et des cubes pour faire des analyses multidimensionnelles ? Et des schémas en étoile ? Ce genre de choses. Et puis toutes ces capacités ont migré dans Oracle DB. Il y avait aussi ces bases spécialisées pour les données géo-spatiales. Ça aussi ça a migré dans Oracle DB. Idem pour les bases orientées documents (JSON et XML) et orientées texte, tout cela a été intégré dans Oracle DB 12 ».
Dans cette même optique, « il est prévu que les capacités des bases orientées graphe soient intégrées à notre offre Oracle DB 12.2. »
Pour le VP, le NoSQL n’est donc pas vraiment une menace pour la base principale d’Oracle. Au contraire, il l’enrichira. « Les bases relationnelles sont incroyablement résilientes […] Chaque base à une valeur ajoutée. Et la valeur ajoutée finie régulièrement par être intégrée dans Oracle DB ».
Reste que même en incorporant ces fonctionnalités, le paysage des SGBD s’est considérablement diversifié avec ces bases d’un nouveau genre. « Les deux modèles (polyglotte et multimodal) cohabiteront », admet d’ailleurs sans problème James Steiner.
Oracle pour les gouverner toutes
Cette nouvelle donne nourrit le troisième pilier de la stratégie d’Oracle : l’intégration au sein de plateformes ombrelles, dédiées au Big Data.
« Nous ne snobons pas les architectures que nous trouvons chez nos clients. Au contraire. Nous voulons les aider à en tirer plus de valeurs. La preuve : MongoDB est présent sur le salon (NDR : à l’OpenWorld de San Francisco). Je suis sûr que beaucoup de nos clients ont aussi du MongoDB. Et oui, il doit être possible de mélanger les deux dans une plateforme de Data management ou dans une architecture Big Data ».
Cette volonté « d’ouverture » - en fait d’unification dans une couche analytique au-dessus de bases diverses – a donnée naissance à plusieurs outils comme Big Data SQL (pour faire des requêtes SQL au sein de ces environnements multiples), comme des connecteurs Big Data (qui permettent d’accéder à différentes sources de données, de transférer les données entre ces environnements hétérogènes) ou comme le Oracle Data Integrator Studio, un outil visuel et simplifié d’intégration de données hétérogènes.
Ces offres résonnent comme une acceptation de la diversité du NoSQL. « Nous sommes réalistes, nous ne pensons pas que nos clients vont tout abandonner pour devenir 100% Oracle. Nous regardons le monde tel qu’il est. Nous ne réclamons pas un monde monolithique ».
En revanche Oracle entend se positionner comme chef d’orchestre principal pour ses clients historiques. « Nous pensons que ce sont des modèles de données que les entreprises utilisent. Nous en proposons. Nous les soutenons. Nous les accompagnons. Et nous intégrons tous ces modèles de manière unique dans une architecture Big Data globale. Nous permettons à nos clients d’avoir de gros investissements dans les technologies relationnelles, et de tirer parti des bases et de l‘analytique orientés graphes [et NoSQL] ».
Peter Jeffcock, Executive spécialisé en Big Data et IoT chez Oracle, ne dit pas autre chose quand il constate que « les clients ont pleins de bases différentes » et que leur but – et donc celui d’Oracle dans le NoSQL et l’Internet des Objets – est « de ne pas les laisser en silos ».
Vers toutes les bases NoSQL ?
Ceci dit, le nombre de bases - hors univers Oracle - supportées par la plateforme Big Data d’Oracle reste limité. Elles se cantonnent aujourd’hui principalement à Cassendra, MongoDB, Accumulo et Hive. Pas d’intégration possible simplement avec Neo4J ou Marklogic par exemple.
« Mais c’est dans nos intentions que des choses comme notre offre Big Data SQL embrasse d’autre type de base NoSQL. Je prévois qu’un jour, quel que soit votre dépôt de donnée préféré, vous pourrez utiliser Oracle SQL pour requêter votre environnement ». Avant de conclure « même si nous pensons que nos produits maisons vous donneront toujours un avantage considérable ».
« Oracle first », donc. Mais « Not only Oracle » aussi.