Selon Forrester, les bases de données « translytiques » ont le vent en poupe
Forrester identifie les meilleurs fournisseurs dans la catégorie des bases de données translytiques. Le cabinet repère également les éléments communs de ce modèle unifié censé répondre à de multiples cas d’usage.
Suivant les différentes utilisations, les entreprises choisissent le type de base de données le plus adapté. Généralement, elles emploient des modèles transactionnels, opérationnels ou analytiques. Mais il y a une quatrième plateforme qui combine les trois précédemment citées au sein d’une seule instance : la base « translytique ».
Elle est conçue pour éviter la multiplication des databases. Avec un modèle unifié, les métiers bénéficient en principe d’un environnement tout-en-un pour traiter les données en provenance de nombreuses applications.
Utiliser une base de données opérationnelle ou transactionnelle, puis migrer les informations vers une solution analytique est synonyme de pertes de temps et de faibles performances.
Un nouveau mot pour une technologie réputée
Cette technologie de convergence connaît une croissance notable et motive les éditeurs. Le 23 octobre, Forrester a publié son rapport concernant le marché des plateformes « translytiques » au quatrième trimestre 2019. Oracle, SAP, Microsoft et IBM prennent la tête du classement au côté de MongoDB ou encore MemSQL.
« Les bases de données translytiques simplifient considérablement les processus des entreprises puisqu’il suffit de maintenir une seule base, sans qu’il soit nécessaire d’effectuer des mouvements et des rapprochements complexes entre plusieurs d’entre elles », déclare Tirthankar Lahiri, senior vice-président data et in memory technologies chez Oracle. « À mesure que les organisations engagent leur transformation numérique et passent à l’analyse en temps réel, le besoin d’unification se fait encore plus ressentir ».
À titre d’exemple, Tirthankar Lahiri cite les opérateurs télécoms. Ils doivent constamment optimiser leurs services en se basant sur des mesures en temps réel de la congestion. Elles sont recueillies et évaluées à partir d’un volume extrêmement élevé de trafic cellulaire. Cela nécessite un traitement convergent de l’analyse de réseau, du nombre de sessions, des autorisations de connexion et des facturations, le tout au sein d’une même base de données.
Les fonctionnalités types d’une plateforme translytique
Plusieurs caractéristiques constituent une plateforme « translytique ». Parmi celles-ci, la technologie in-memory joue un rôle essentiel, selon Noel Yuhanna, analyste chez Forrester.
« Ce composant important assure des accès à faible latence aux données critiques utilisées pour diverses charges de travail », déclare-t-il.
« La dénomination translytique correspond à une base de données qui supporte les indicateurs transactionnels, analytiques, opérationnels et autres workloads en temps réel sans sacrifier l’intégrité, les performances ou la mise à l’échelle de la plateforme », affirme Noel Yuhanna. « Historiquement, nous avons séparé ces charges de travail dans des bases de données indépendantes en raison de limitations techniques ».
Selon l’analyste, la chute du prix de la RAM et l’apparition de technologies telle qu’Optane d’Intel convaincraient les clients d’adopter ce modèle. Il remarque que les utilisateurs peuvent avoir des centaines de téraoctets de fichiers en mémoire. Cela changerait la manière dont ils stockent, traitent et accèdent aux données au sein des outils analytiques et des applications.
« Le translytique représente la prochaine génération de plateforme de bases de données qui exploite le in-memory et les technologies associées dont la DRAM, la mémoire persistante et les SSD afin de prendre en charge de multiples workloads », déclare-t-il.
Pourtant, la dénomination choisie ne correspond pas à un standard, mais à une utilisation élargie de systèmes en mémoire. Par exemple, SAP propose un modèle « mutualisé » qui permet de gérer plusieurs bases in-memory. Chez MemSQL, une database SQL assure des capacités transactionnelles et analytiques grâce à cette technologie. Les flux de données en temps réel sont opérés à l’aide de Spark et de Kafka.
Le SQL vit, l’ETL meurt
Rappelons que toutes ces plateformes reposent sur deux concepts clés : la capacité à charger et à chercher des données. Traditionnellement, le langage SQL est le standard pour lancer des requêtes en base. Celui-ci est compatible avec le nouvel étalon désigné par Forrester.
« Vous pouvez utiliser le SQL pour accéder à une plateforme translytique, ce qui est suffisant pour supporter diverses charges de travail, y compris opérationnelles, transactionnelles et analytiques », assure Noel Yuhanna. « Mais pouvez également déployer des APIs pour permettre aux développeurs de créer des applications sophistiquées à l’aide de Java, Python, Perl ou d’autres langages populaires », ajoute-t-il.
Si le SQL a encore sa place dans ce nouveau paysage, ce n’est pas le cas pour les technologies ETL. Le chercheur de Forrester assure qu’il n’est plus nécessaire de migrer les données dans ce contexte unifié.
« L’élimination de l’étape ETL est la raison pour laquelle la base translytique est vraiment différente. Vous pouvez lancer des analyses et des indicateurs en temps réel, car les requêtes ont lieu en même temps que les transactions », précise Noel Yuhanna.
Selon Forrester, ce marché évolue au fur et à mesure que les éditeurs étoffent les fonctionnalités de leurs produits.
« Nous allons sans doute observer un effort d’automatisation avec l’optimisation des requêtes, une intégration plus poussée avec la mémoire persistante Intel Optane, et une hiérarchisation des données grâce aux technologies DRAM, flash et SSD, » prédit Yuhanna. « Nous nous attendons également à ce que le translytique gagne en compatibilité avec le cloud, avec l’apparition d’offres as a service dans les années à venir ».
Pour autant, ce n’est pas le choix effectué par certains acteurs, dont Amazon. Le géant du e-commerce a opté pour des produits AWS adaptés à chacun de ses besoins plutôt que d’adopter une base unique.