Neo4J revendique haut et fort son statut de pure-player des graphes
La société mise sur son historique et son approche native des graphes pour se frayer un chemin dans les entreprises, et pas seulement auprès des développeurs. Une plateforme permet aussi d’accélérer les cas d'usage.
« Il n’y a jamais eu autant de dynamisme et d’énergie dans le monde des graphes aujourd’hui. » Emil Eifrem, le Pdg et fondateur de la base de données en graphes, Neo4J, ne mâche pas ses mots quand il s’agit d’évoquer le marché bouillonnant des bases appuyées sur les modèles en graphes. Le Pdg, qui intervenait lors d’un événement parisien la semaine dernière, est venu montrer comment sa société et son modèle allait de plus en plus s’immiscer dans les SI des entreprises et aussi – et là est un point clé – comment il allait contrecarrer les plans de la concurrence de plus en plus présente.
Neo4J représente le vaisseau amiral des graphes et de leur structuration dans une base de données – dite NoSQL. Ce modèle diffère des autres bases de données en rangeant et stockant les données en s’intéressant avant tout à leur relation et aux connexions qui existent entre elles. Ce schéma a d’ailleurs permis à Neo4J de se positionner dans l’affaire des Panama Papers – un cas d’usage largement exploitée par l’enseigne -, mais trouve aussi des usages dans la médecine et la lutte contre le cancer, où de grands volumes de données doivent être confrontées à d’autres pour identifier les interconnexions possible, ou encore dans les entreprises. Et justement, pour Neo4J, là est tout l’enjeu. La société, qui cible essentiellement les grands groupes, entend bien faire jouer ses capacités de « données connectées », pour désiloter les données des entreprises et croiser le fer avec les SGBD « qui ne sont pas bonnes à identifier les relations », affirme encore le Pdg.
Pourtant, citant des chiffres du cabinet d’analystes Forrester, si 50% des entreprises ont utilisé en 2017 des bases de données en graphes – contre 25% en 2014 - , il apparait que Neo4J ne fait plus cavalier seul sur ce marché. Effet de marché oblige. D’autres acteurs lui ont emboité le pas. A commencer par certains piliers du monde NoSQL dont la volonté est désormais d’apparaître sous les traits de bases multi-domaines – comprendre consommables pour plusieurs cas d’usage. Citons par exemple MongoDB, qui a poussé sa base orientée documents sur les terres des graphes, ou encore DataStax, dont la version Enterprise de Cassandra renferme aussi un module de support pour les graphes. Redis ne manque également pas à l’appel. Sans oublier IBM et Tibco par exemple.
Mais finalement, le souffle de la concurrence pourrait surtout venir du Cloud. Si Neo4J travaille à une version Cloudifiée de sa plateforme (une GA est prévue dans l’année, assure la société), des cadres du Cloud ont aussi pris position. D’abord Microsoft Azure : sa base massivement géo-distribuée CosmoDB supporte les modèles graphes, en plus de SQL. D’ailleurs, Microsoft est juste derrière Neo4J dans le classement Engine-DB pour les seules bases graphes. L’autre concurrent est AWS, dont la base Neptune pourrait aussi rebattre les cartes du secteur.
Pour autant, Neo4J préfère y voir là « une bonne nouvelle », souligne Cédric Fauvet en charge du développement des activités en France de Neo4J. Car ce que n’ont pas forcément ces bases NoSQL multi-domaine est cette spécialisation acquise en ayant été un précurseur du marché. « Nous sommes déjà à l’étape d’après », précise-t-il alors. « Ces sociétés ne sont pas natives. Elles doivent transposer les modèles de stockage de base », souligne-t-il.
Une plateforme pour favoriser les usages
Cette « étape d’après » est celle de la plateforme (Neo4J Graph Platform). Neo4J mise sur l’approche intégrée pour permettre aux entreprises de plus facilement utiliser la plateforme avec leur existant, mais aussi d’accélérer les cas d’usages avec les graphes. Cette plateforme s’appuie logiquement sur la base de la société autour de laquelle est tissé un maillage de fonctions d’ETL, de développements, mais aussi d’analyse de données et d’intelligence artificielle pour cibler les data scientists ou encore de découverte et de visualisation de données pour des utilisateurs plus métiers. Le tout, soutenu par le langage Cypher, qui permet de modéliser et de manipuler les graphes sur la plateforme.
Ce langage n’a pas toujours fait l’unanimité dans la communauté. Conçu par Neo4J, Cypher a seulement été ouvert il y a un peu plus de 2 ans via le projet openCypher. Une ouverture souhaitée certes par la communauté, car les autres outils le sont, comme Gremlin et TinkerPop, mais aussi une ouverture qui permet à Neo4J de proposer la portabilité et l’intégration aux outils déjà en place. Cypher a été ainsi adaptée pour SAP Hana et pour Redis. Parmi les autres développements clé, Cypher pour Gremlin pour mettre en place Cypher au-dessus d’un moteur Gremlin, ou encore Cypher sur Spark qui devrait renforcer les capacités analytiques de la plateforme. Ce module est actuellement en cours de développement (sortie prévue mi-mars).
En France, les services financiers y mettent un pied
Avec cette approche, la société compte 25 clients en France, indique Cédric Fauvet, listant Airbus parmi ceux-ci. Les secteurs bancaires et financiers y sont également présents. Dans ces domaines, « on reproduit les Panama Papers mais pour la détection de fraudes. En fait, il s’agit de compléter les processus d’analyse discrète », explique-t-il. Parmi les clients français, on remarque par exemple la Société Générale ou encore le Crédit Agricole CIB (Corporate and Investment Bank). Ce dernier utilise la plateforme Neo4J pour disposer d’une vue complète et transversale des clients à partir d’informations publiques collectées sur le Web. Les secteurs de l’assurance et des telcos sont également listés par le responsable français.
Si les performances en matière de jointures à l’échelle et les temps de traitement sont souvent cités comme un des avantages des graphes en entreprise, Cédric Fauvet y voit aussi une façon d’inclure plus rapidement les métiers dans la modélisation. Selon lui, en apportant un modèle physique plus proche des métiers, « on passe moins de temps à traduire ce qu’ils veulent». Métiers qui du coup deviennent aussi une porte d’entrée pour Neo4J.