NoSQL : MarkLogic évolue naturellement vers le hub de données opérationnel
Un unificateur de données et de silos. MarkLogic veut profiter de son ADN de base NoSQL avancée pour évoluer naturellement vers une plateforme globale de gestion des données. L’idée est de proposer un réceptacle avancé et sécurisé pour mieux consommer des données aujourd’hui très disséminées. MarkLogic 9, lancé cette semaine, s’inscrit dans ce cadre avec des fonctions avancées d’intégration.
Du NoSQL, vers le ODBMS, pour désormais opérer en tant que hub de données opérationnel (Operational Data Hub - ODH) et gérer l’unification des données en entreprise. MarkLogic, acteur historique du segment des bases de données NoSQL a fait évoluer son positionnement au-delà de la simple base. Positionné sur le segment des bases de données dites NoSQL (mais sous un format propriétaire alors qu’en grande partie, ce segment est peuplé par l’Open Source), la société, dirigée par Gary Bloom, a affiné son positionnement pour devenir une forme de pacificateur des données d’une entreprise. Casser les silos et fédérer l’ensemble des données.
Depuis son arrivée en France, les scenarii d’usage, ainsi que les applications qui se reposent sur la base MarkLogic, ont évolué. « On a constaté un migration intellectuelle dans l’esprit des clients. Ils souhaitent aujourd’hui davantage intégrer les données réparties dans différents silos. Si nous étions avant sur le créneau des bases de données opérationnelles (ODBMS) NoSQL, nous avons évolué vers le hub de données opérationnel pour agréger et intégrer ces silos, pour au final disposer d’une vue analytique par exemple. Les données conservent les différentes relations entre silos », explique Laurent Vidal, directeur du bureau France de MarkLogic. Avec ce concept d’ODH, MarkLogic veut tout simplement se placer comme un unique réceptacle certifié pour l’ensemble des données généralement disséminées d’une entreprise et de les exposer de façon cohérente pour pouvoir mieux les valoriser. En bref, proposer une vision unifiée des données sans passer par les douloureuses phases d’intégration effectuées par différents outils.
« Il existe certes un marché du NoSQL », commente encore le responsable. « Mais aujourd’hui les entreprises n’ont plus besoin de bases de données. Elles ont besoin d’une technologie qui leur permet de s’affranchir de leurs silos, de les mettre en commun et de créer de l’intelligence entre toutes ces données. Aucune base de données n’est capable de le faire ; il faut une plateforme pour cela », lance-t-il. Si les bases NoSQL, comme Cassandra, MongoDB ou CouchBase, ont créé le buzz sur la nécessité de disposer de bases de nouvelles générations, constate-t-il, il apparait qu’elles-aussi commencent à pivoter. DataStax qui harmonise son modèle en développant des technologies de graphes et de systèmes de fichiers compatibles HDFS. Couchbase promet quant à lui l’intégration d’un module de Search, identique à Elastic. « Les bases NoSQL commencent à comprendre que les clients ont besoin d’autre chose », rapporte Laurent Vidal.
Mais là où MarkLogic veut faire la différence : la société a emprunté cette voie il y a plusieurs années en intégrant nativement un pan de technologies diversifiées, résume le patron pour la France. MarkLogic s’inscrit donc dans cette logique « d’entonnoir », qui va couvrir « 80% des besoins des clients sans avoir à intégrer d’autres technologies ; ce qui réduit les coûts ». Par exemple, Search, sémantique, fonctions avancées de sécurité (comme le chiffrement), création d’API ouvertes sont des outils inclus nativement à MarkLogic, liste-t-il. Le responsable pour la France met également en avant l’absence de modélisation des données, quel que soit leur format – « MarkLogic sait lire les métadonnées et propose un index universel ». Grâce à cette approche avec laquelle les données ne sont pas transformées - contrairement à un ETL, comme Informatica – « on peut faire du Search dès l’intégration des données », commente-t-il encore.
Autre argument : celui de la sécurité. Laurent Vidal évoque par exemple « une pression réglementaire énorme », qui impose aux entreprises d’aller très vite. « Avec MarkLogic, le taux d’échec (de mise en place de projets, NDLR) est très faible », illustre-t-il – dans son Magic Quadrant, Gartner souligne en effet que la satisfaction des clients MarkLogic est élevée. Selon lui, la base de la société propose les technologies adéquates pour se mettre en conformité grâce aux capacités d’intégrations multi-sources inhérentes à la plateforme. Une porte d’entrée réduit la surface d’attaque et offre davantage de résistance, souligne-t-il, rappelant que la base est également bardée de certifications.
MarkLogic 9 dopé à l’intégration de données
Evidemment, cela se traduit techniquement. Dans la version 9 de MarkLogic, présentée cette semaine lors de MarkLogic World qui s’est tenu à Chicago, l’intégration de données se veut plus granulaire. Selon Frédéric Decaudin, directeur avant-vente chez MarkLogic en France, la plateforme propose ainsi plus d’outils: « On continue dans notre logique de rendre très simple l’accès à l’information », explique-t-il.
La solution propose par exemple une API unifiée baptisée Optic API qui permet de gérer des agrégats entre documents et lignes. Des jointures peuvent également être effectuées sur des documents. Il s’agit là « d’élargir le champ des requêtes pour faciliter l’intégration de MarkLogic avec des applications historiques existantes », résume Frédéric Décaudin. Un élément clé lorsqu’il s’agit de se connecter aux silos de données en place. Un outil de gestion des entités (Entity Services) permet de modéliser des workflow à partir de données disparates.
Les capacités de requêtage SQL, déjà en place pour apposer des outils de reporting et d’analyse (comme Tableau ou Qlik) à MarkLogic ont été renforcées, pour accélérer et fluidifier les relations entre la base et les outils de visualisation de données. Un scénario bien en place dans les entreprises françaises, ajoute encore le directeur avant-vente.
Des travaux ont aussi été effectués autour de la sécurité. Si le chiffrement lors du transfert des données est désormais inclus, on note l’intégration à la solution de l’anonymisation de la donnée – un élément devenu aujourd’hui incontournable dans les phases d’intégration et clé pour être conforme à la GDPR.
Enfin, côté gestion opérationnelle de la solution, la société a présenté Ops Director, une console de monitoring complète de l’ensemble des clusters MarkLogic, tant sur site que dans le Cloud (après AWS, Azure est désormais supporté). Il apporte également de fonctions de mises à jour à chaud ainsi que de diagnostic.
C’est donc avec cet attirail que MarkLogic apparait aujourd’hui sur le marché. Un positionnement de hub de la donnée d’entreprise qualifié d’ « intéressant et différentiateur » par le cabinet d’études Gartner.