Partners : Teradata intègre pour simplifier la gestion des données
Teradata a présenté un outil d’agrégation et d’intégration de flux de données, Listener, et présenté Aster Analytics on Hadoop pour connecter directement la base analytique sur HDFS. L’éditeur a aussi dévoilé sa première appliance UDA.
A l’occasion de sa conférence Partners qui s’est tenue la semaine dernière aux Etats-Unis, Teradata a montré que sur ce marché très diffus et hétérogène de la gestion des données, son rôle était étroitement intégré à la simplication et à l’intégration. C’est une idée que l’on pouvait retrouvé au centre de trois annonces réalisées par le groupe : Listener, Aster Analytics on Hadoop et une première appliance UDA.
Listener, d’abord, permet « d’écouter » de multiples flux de données, puis de les intégrer et de les distribuer vers d’autres applications ou flux afin d’être exploités dans un contexte plus métier. L’application fonctionne en mode self-service.
Evidemment, Listener n’est pas le premier outil qui permet d’agréger et de streamer les flux de données en temps réel. Les grandes tendances de l’IT moderne, les objets connectés en premier, ont poussé les fournisseurs de services à développer des solutions allant en ce sens. A l’image d’AWS par exemple avec son service Kinesis.
Mais l’un des points forts de Teradata est d’abord d’intégrer cela au sein de sa plateforme UDA (Unified Data Architectire), au côté de son entrepôt de données, d’Hadoop (Cloudera ou Hortonworks) et d’Aster, la base analytique du groupe (servant pour la découverte d’associations de données par exemple). Puis avec Listener, la groupe propose une industrialisation des composants Open Source Kafka et Spark (la coqueluche de streaming de flux de données, considérée par les observateurs comme un palliatif à Hadoop), qui lui sert de fondation, résume en substance Jean-Marc Bonnet, à la tête des activités conseil en architecture BI et Big Data de Teradata.
Ainsi, Listener forme le 4e composant d’UDA, et prend en charge l’ingestion rapide pour les traitements analytiques. L’ensemble peut au final être intégré via QueryGrid, une technologie de fédération de requêtes maison, qui permet donc de relier l’ensemble des composants pour l’utilisation.
Ce principe, qui consiste à mieux intégrer les composants à un écosystème Hadoop, est également l’un des arguments que l’on retrouve avec Aster Analytics on Hadoop, autre annonce réalisée par Teradata à l’occasion de sa conférence Partners. Et là aussi, Teradata entend proposer une énième option pour faciliter l’usage et l’exploitation des gisements de données stockés dans HDFS (le système de fichiers d’Hadoop).
Brancher Aster sur Hadoop
Aster Analytics on Hadoop permet ainsi de plugguer directement la base analytique de Teradata sur un cluster Hadoop (Cloudera ou Hortonworks) afin d’accélérer la prise en main de ces données et donc de leur analyse.
« Jusqu’alors Aster était disponible sous la forme d’appliance, en format autonome, ou dans le Cloud (aux US) », explique Jean-Marc Bonnet. Aster Analytics on Hadoop propose une nouvelle option pour les utilisateurs ayant déjà des clusters Hadoop en place. La solution se place directement au dessus d’Hadoop, avec la promesse de devenir un processus analytique natif d’Hadoop. Les moteurs de traitement d’Aster se retrouvent piloter et provisionner par YARN. Au final, et c’est un point clé, les fonctions analytiques d’Aster deviennent disponibles directement depuis HDFS, les données n’ont pas besoin d’être déplacées. Teradata a inclus à son offre une centaine de fonctions analytiques pré-câblées pour en faciliter la manipulation – et encore une fois, en direct sur HDFS.
« Cela permet aussi de rationnaliser le cluster Hadoop et de ne pas avoir en place une autre plateforme », commente Jean-Marc Bonnet. Autre gain selon lui, l’industrialisation des processus analytiques qui peuvent être transposés directement en production.
UDA sous forme d’appliance
Enfin, toujours dans cette logique d’intégration, Teradata a profité de son événement partenaires pour dévoiler la première appliance UDA. Un boitier autonome donc qui intègre Aster, entrepôt de données et Hadoop, dans un ensemble pré-câblés et interconnecté via InfiniBand. En gros, trois moteurs qui peuvent être associés ou dissocier, pour proposer un réponse adéquate à différents scenarii de traitement de données.