Les bases de données in-memory ont le vent en poupe, selon les éditeurs
Lors de l’IT Press Tour 42, LeMagIT a pu rencontrer plusieurs éditeurs spécialistes des bases de données in-memory. L’occasion d’observer les tendances de ce marché dont les acteurs - relativement petits - se préparent à une accélération de l’adoption de leurs technologies au fur et à mesure que les traitements en temps réel s’imposent dans les entreprises.
Louées pour leurs performances, les bases de données in-memory sont en réalité de différentes natures. Elles ne reposent pas nécessairement sur le même modèle. Certains de ces SGBD sont purement relationnels, d’autres sont NoSQL et s’appuient le plus souvent sur le modèle clé-valeur.
En tout état de cause, proposer une base de données en mémoire ne suffit plus pour se démarquer. Le cloud, les progrès de la parallélisation et l’essor de nouvelles technologies de stockage tels les standards NVMe et RoCe ont largement contribué à rendre la plupart des bases de données performantes.
IMDB : les efforts pour supporter (presque) tous les cas d’usage
Et si, sur le papier, les IMDB conservent une longueur d’avance parce qu’elles reposent le plus souvent sur des architectures distribuées, leurs éditeurs ne veulent plus dépendre du modèle de données choisie originellement. C’est en tout cas la position de SingleStore, GridGain et Hazelcast qui cherchent à supporter davantage de cas d’usage comme l’IoT et le machine learning.
Selon DB-engines, GridGain et Hazelcast disposent d’un modèle de stockage clé-valeur. Les technologies de SingleStore et Hazelcast traitent toutes deux des documents au format JSON, tandis que SingleStore et GridGain prennent en charge les données relationnelles. SingleStore mise aussi sur sa capacité à traiter des données time series et géospatiales. En outre, GridGain prévoit d’ajouter un modèle de stockage en colonne pour supporter les workloads analytiques.
Dans la même veine, ces acteurs complètent régulièrement leurs librairies afin de supporter plus de langages de programmation, de frameworks de développement et des API vers les logiciels SaaS du marché.
D’après les dires de ces trois acteurs, les IMDB jouent toujours le rôle de couche de cache entre les systèmes des entreprises (mainframes, ERP, bases de données monolithiques, etc) et les applications.
Par exemple, Hazelcast estime que sa technologie est idéale pour inférer des modèles de machine learning en temps réel, en streaming, ou pour accélérer les traitements batchs à large échelle. SingleStore évoque le cas de Hulu, célèbre éditeur d’une plateforme de streaming vidéo, qui analyse les comportements de 42 millions d’abonnés et ingère 2 milliards de ligne de données par heure.
Ces SGBD demeurent très usités pour les analyses des données financières. Ce n’est pas pour rien qu’IBM maintient un partenariat avec GridGain et a investi dans SingleStore. Les banques s’appuient sur ces technologies par-dessus leur mainframe IBM Z pour accélérer les performances dans leurs applications ou pour extraire les données en presque temps réel à des fins analytiques. C’est le notamment le cas de l’entité française de BNP Paribas qui emploient GridGain pour ses jobs ETL allant de ses systèmes de gestion de données boursières à ses outils analytiques. Les opérateurs télécoms, les groupes spécialisés dans la logistique (UPS, par exemple) et les géants technologiques emploient des IMDB pour traiter leurs workloads les plus imposants.
Cela tombe bien, ces éditeurs entendent favoriser des usages de plus en plus massifs. Pour ceux-là, ils ont tous trois ajouté une couche de stockage persistante (ou froide) à leur technologie. Une autre priorité est le support de la mémoire persistante (PMEM), en premier lieu la technologie Intel Optane, pour continuer à rivaliser avec les SGBD et les systèmes de warehousing proposés par Oracle, SAP et IBM.
Car c’est souvent auprès des clients de ces géants du logiciel que ces acteurs trouvent des clients peu enclins à mettre à jour leurs appliances coûteuses pour bénéficier de capacités supplémentaires.
GridGain étudie les traitements in-memory depuis des GPU
En ce qui concerne le support de la mémoire persistante, GridGain accuse un petit retard face à ses deux compétiteurs : il prévoit le « support complet » d’Intel Optane au cours de l’année 2022. En revanche, GridGain espère prendre un train d’avance avec le support de la vectorisation, c’est-à-dire la possibilité de réaliser des traitements in-memory depuis des clusters de GPU.
Un avenir multicloud, serverless, hybride… et économe
Sur site, la promesse des éditeurs de solutions IMDG est en effet de réduire les coûts en s’appuyant sur des infrastructures plus ou moins génériques, du moment que les configurations sont suffisamment musclées pour supporter les usages associés. Ainsi, avec la technologie de SingleStore, Hulu aurait réduit ses coûts d’infrastructure de 50 %. Akamai, lui, a coupé les coûts de gestion de données par cinq par rapport à son ancienne architecture basée sur Oracle Exadata.
Dans le cloud, SingleStore et Hazelcast se mettent au serverless. Ils veulent abstraire la vue des machines sous-jacentes en proposant aux développeurs de déployer des instances depuis un GUI leur permettant d’indiquer des seuils de consommation. GridGain est un peu plus conservateur pour le moment : l’éditeur continue de faire évoluer sa DbaaS Nebula en libre-service, lancée en 2021. Pour autant, le choix des tailles des instances importe.
Tous croient en la nécessité de proposer une approche multicloud et hybride. Ces acteurs ne veulent absolument pas délaisser leur base de clients installés. GridGain, Hazelcast et SingleStore comprennent bien qu’imposer aux clients des migrations ne peut que les desservir, d’autant qu’ils restent considérés comme des acteurs de niche qui, souvent, viennent combler des besoins parfois mis de côté par les autres vendeurs.
« Malgré notre taille relativement restreinte (GridGain revendique plus de 200 clients et 30 millions de dollars de CA, N.D.L.R), les grands groupes achètent notre plateforme. Ce n’est pas acquis. Ils préfèrent généralement traiter avec les grands éditeurs. Ces organisations évitent les petites entreprises, à moins que le « petit » fournisseur propose une technologie dont ils ont vraiment besoin », affirme non sans malice Abe Kleinfeld, président et CEO de GridGain.
SingleStore veut devenir calife à la place du calife
De son côté, SingleStore fait le pari que les entreprises consolideront leurs technologies de bases de données. Certaines d’entre elles ont déjà commencé à le faire en décommissionnant progressivement leurs produits Oracle et SQL Server. L’éditeur fait même le vœu pieu que sa technologie sera parmi le top 3 des solutions retenues par les entreprises. En tout cas, il en rêve. Aussi, SingleStore estime que la convergence des capacités OLAP et OLTP sera à l’avenir la norme, que les moteurs de requête SQL « sont là pour rester ».
Suresh SathyamurphyChief Marketing Officer, SingleStore
« Nous ne croyons pas que le NoSQL soit l'avenir des bases de données, lance Suresh Sathyamurphy, Chief Marketing Officer chez SingleStore. « Bien que certains éditeurs de SGBD NoSQL revendiquent le fait que leur technologie permet d’effectuer des analyses en temps réel, ce n’est pas leur fonction primaire », ajoute-t-il.
Cette approche généraliste n’est pas celle choisie par les fournisseurs de cloud ou certains spécialistes dans leur domaine, comme Neo4j. Ceux-là estiment qu’une technologie doit répondre à un cas d’usage spécifique.
« Les bases de données NoSQL spécifiques comme Redis, Elasticsearch, MongoDB, Neo4j, etc. étaient nécessaires il y a dix ans. Aujourd’hui, le marché est trop complexe pour faire interagir ces produits ensemble et un SGBD multimodèle peut répondre à tous ces cas d’usage », affirme Domenic Ravita, VP, product marketing chez SingleStore.
Ce n’est pas non plus l’avis d’Hazelcast qui voit son offre comme un complément aux systèmes existants. « Vous ne remplacez pas une base de données avec notre technologie, vous la placez par-dessus le système existant », avance Kelly Herrell, PDG d’Hazelcast. « Nous nous différencions par notre capacité à traiter les données à la volée, sans avoir à les extraire ou les pousser vers un moteur de type Apache Spark ».
En ce qui concerne l’approche des fournisseurs de cloud qui vantent les mérites des technologies spécifiques, Suresh Sathyamurphy considère qu’ils encouragent leurs clients à utiliser ces services pour favoriser la consommation de ressources IT. « Plus les clients déploient des bases de données différentes, plus ils utilisent les ressources de calcul sous-jacentes qui sont les sources de revenu principales de ces acteurs ». Abe Kleinfeld de GridGain a tenu à peu de chose près le même discours lors de l’It Press Tour 42.
Open source (ou non) ; l’ingérence des fournisseurs cloud, pas vraiment un problème, selon GridGain
Aussi, l’open source, qui était le modèle originel de ces nouveaux acteurs ayant profondément fait évoluer le marché ne serait plus autant le moteur de l’adoption, selon les responsables de SingleStore. « Aujourd’hui, l’adoption du cloud est le nouveau vecteur de croissance pour nous et les autres éditeurs », affirme Domenic Riveta.
Pour affirmer cela, le responsable s’appuie sur le succès de Snowflake qui a montré qu’en proposant la solution technique attendue par les clients, à savoir le déploiement de datawarehouse multicloud basée sur un modèle SQL traditionnel, l’on rencontrait finalement peu de résistance à l’adoption.
Si GridGain et Hazelcast ont modifié leur modèle économique pour proposer une distribution propriétaire de leur projet open source respectif (Hazelcast et Apache Ignite), ceux-là continuent de miser sur une l’open source. GridGain se félicite des téléchargements en hausse d’Apache Ignite, tandis qu’Hazelcast bénéficie d’un soutien équivalent de la part de sa communauté libre. C’est d’ailleurs pour ces deux acteurs un moyen d’attirer des clients qui chercheraient à obtenir du support ou à bénéficier des fonctionnalités de leurs solutions commerciales.
Là encore, les géants du cloud peuvent jouer au chamboule-tout et tenter de rafler la mise au fur et à mesure que les IDMB gagnent en popularité. Et s’ils viennent à encapsuler des projets open source comme Apache Ignite, ce ne serait pas réellement un mal, selon Abe Kleinfeld. « Quand un acteur comme AWS ou autre arrive sur un marché, il prend une grosse part du gâteau, mais le fait qu’il s’intéresse à une technologie particulière créé une émulsion qui profite aux autres participants », estime-t-il.