James Thew - Fotolia
GridGain pousse son concept de plateforme In-Memory hybride
La société commercialise des offres premium à partir du projet Apache Ignite, une plateforme de gestion des données en mémoire et distribuée.
Un In-Memory pour tous types d’usage. C’est ainsi que pourrait être présentée la solution de la société californienne GridGain. Cette société développe depuis 2010 une vaste plateforme de traitement des données dont la particularité est de s’adosser à une architecture In-Memory, multi-usage et distribué. Avec cette plateforme GridGain, il s’agit de pouvoir insérer du traitement en mémoire aux architectures en place et de construire ainsi une autoroute entre la couche applicative et celles dédiées aux données.
En 2014, GridGain a décidé de modifier son modèle économique en versant sa technologie dans l’Open Source auprès de la fondation Apache, sous le nom du projet Ignite. GridGain, qui est l’un des principaux contributeurs à Ignite, correspond en fait à l’entité commerciale derrière Ignite et a bâti une offre autour d’éditions Professional et Enterprise, dotées d’une offre de support adaptée et de composants propriétaires. GridGain tire à ce jour 20% de ses revenus des services. La société a pu lever quelque 31 millions de dollars avec ce modèle – Huawei fait partie des investisseurs.
Si la société présente sa solution comme une Data Fabric In-Memory hybride capable d’opérer des traitements tant transactionnels qu’analytiques, c’est parce qu’il s’agit en fait d’un ensemble de composants In-Memory, chacun répondant à un scenario, un type de traitement et enfin, à une méthode d’indexation ou de stockage des données en mémoire (RAM). « Il existe en effet plusieurs stores dans la plateforme », commente Abe Kleinfeld, le président et CEO de GridGain, rencontré dans les locaux de la société, localisée à Foster City en Californie. « Analytics et opérationnel sont gérés dans un datastore unifié », ajoutant : « Nous mettons en RAM tous les cas d’usage en matière de traitement. »
Un ensemble de composants
Techniquement, la plateforme de GridGain renferme un composant Data Grid (qui peut par exemple faire office de cache de type clé/valeur), un composant SQL Grid (qui permet de mettre en place un moteur SQL distribué en mémoire), un moteur de streaming (via notamment Spark), un système de fichier distribué (qui reprend les caractéristiques d’HDFS – ce composant est clé pour accélérer les scenarii bâtis sur Hadoop). D’autres portent également sur la gestion des clusters (comme Services Grid).
L’un des points de forts est – logiquement – de proposer une API unifiée – la même que dans Ignite, d’ailleurs – qui permet de connecter la couche application à celles des données via les langages les plus communément utilisés : SQL, Java, C++, .NET, PHP, MapReduce, Scala, Node.JS et Groovy. Autre élément clé : GridGain assure être ACID pour tout ce qui est transactionnel. Hadoop, bases NoSQL et SQL sont exploitables comme sources de données.
Avec ce dispositif, il est « inutile de tout ré-écrire pour passer à GridGain », assure le CEO qui place sa solution directement comme une alternative à SAP Hana ou encore Oracle In-Memory. Tout en nuançant toutefois : « Nous complétons ce qui existe déjà dans les entreprises », lance-t-il, mais avec l’argument du coût lié à l’Open Source.
Si l’édition Professional donne accès à des mises à jour plus rapides que l’édition communautaire de la fondation Apache, l’édition Enterprise offre les composants propriétaires généralement associés à un fonctionnement critique de la solution.
Dans sa version 2.0, sortie courant mai, l’édition Professional propose plusieurs améliorations, comme le support de DDL pour accentuer la proximité avec SQL ou encore le support d’autre typologie de stockage en mémoire, comme les disques SSD et la Flash.