Big Data : Teradata présente un moteur d’analyse orienté graphe

Teradata a intégré à la nouvelle version de sa plate-forme Aster Data Discovery Platform, un framework capable de proposer une interface SQL unifiée pour attaquer de multiples moteurs analytiques, dont un nouveau orienté graphe.

Avec le lancement de la version 6 de sa plate-forme, Aster Data Discovery Platform, le spécialiste historique de l’entrepôt de données, Teradata, confirme sa volonté de se positionner en tant que référent des manipulations des Big Data pour les non Data Scientists, ce fameux profil de magiciens de l’analyse des données qui fait tant défaut au marché.
La société, qui avait déjà montré son ambition de rapprocher le traditionnel monde de SQL de celui de la sphère Hadoop, a ainsi doté sa plate-forme d’un nouveau moteur analytique orienté graphe, basé sur SQL et baptisé SQL-GR/ Son objectif est de permettre de traiter et d’analyser plus rapidement des données dites complexes. Les bases de données orientées graphes utilisent des méthodes de connexion logiques entre les données (des noeuds ainsi que des arcs), mettant ainsi en avant les relations existant entre les entités. Ce qui a pour effet de mieux modéliser des relations complexes et d’en accélérer ainsi le traitement et la requête.

Avec SQL-GR, Teradata a ainsi complété ses options d’interrogations et d’analyse des Big Data, aux côtés des autres moteurs existants, à savoir SQL-MapReduce, qui permet d’exécuter des requêtes SQL sur le trop complexe MapReduce (cette technologie est née chez Aster Data rachetée par Teradata en 2011, rappelons-le), mais également SQL-H, une forme de connecteur SQL augmenté pour effectuer des requêtes sur un cluster Hadoop - développé en collaboration avec Hortonworks -, nous avait expliqué Mike Koehler, le CEO de Teradata, à l’occasion de Teradata Universe 2013 en avril dernier. SQL-GR vient ainsi s’y greffer, formant la première plate-forme du marché à packager trois moteurs d’analyse de données, indique par ailleurs Chris Twogood, vice président Product et Services Marketing de Teradata dans un entretien avec la rédaction. L’idée est naturellement de «combler le fossé» qui existe en matière d’usage des Big Data en proposant, avec cette approche pluri-moteurs, «plus de flexibilité» aux utilisateurs.

 

Mais finalement, le tour de force n’est pas tant là. Car pour séduire les utilisateurs non spécialistes de l’analytique, mais aguerris au monde SQL, Teradata a doté sa plate-forme 6 d’un framework baptisé SNAP (Teradata Aster Seamless Network Analytic Processing Framework) qui a pour mission d’unifier les approches analytiques à la Hadoop et les approches analytiques traditionnelles et de proposer une interface unique SQL pour activer le ou les meilleurs des moteurs analytiques. Des analyses sont alors effectuées via plusieurs moteurs, et ce sur des jeux de données, structurées, semi-structurées ou non structurées,  réparties entre plusieurs entrepôts de données, en environnement hétérogène. 


Ce framework est  composé de deux modules : Teradata Aster Integrated Optimizer qui «interprète la requête et l'exécute automatiquement en optimisant l'utilisation des ressources et, par conséquent, les performances de traitement des données» et Teradata Aster Integrated Executor, dont la mission est de gérer «tous types de requêtes en permettant la communication entre les moteurs analytiques», assure Teradata.
Il est à noter que ce framework est  évolutif et pourra recevoir des solutions d’entrepôts tiers.

Un système de fichier compatible HDFS

Pour compléter cet édifice, la 6e génération de la plate-forme Aster reçoit également un système de fichiers maison, baptisé Aster File Store, dont l’objectif est de créer une passerelle, transparente et ultra-rapide, entre Aster et un cluster Hadoop. En ce sens, ASF est entièrement compatible avec HDFS et supporte tous types de données multi-structurées, pour reprendre le terme de Chris Twogood, citant notamment comme exemple les données issues de réseaux de capteurs. Avec ASF, les données stockées dans Hadoop sont rapatriées dans Aster et peuvent ainsi subir les traitements et analyses associées. «Les utilisateurs peuvent opter pour le nouveau système Teradata Aster File Store pour les données multi-structurées, en complément des entrepôts existants de données formatées en lignes ou en colonnes», précise encore Teradata.

Teradata n’est aujourd’hui pas le seul spécialiste à se positionner sur ce segment de la démocratisation technologique du Big Data. On se souvient également des travaux de Cloudera, un pure-player du monde Hadoop et de son moteur de requête Impala, qui vise à substituer MapReduce. PIvotal, la nouvelle filiale d'EMC, a aussi fait un pas dans cette voie avec sa distribution Pivotal HD (qui inclut la base de données MPP GreenPlum) et Oracle a aussi une solution avec son appliance Big Data. Quant à Microsoft, il vient tout juste d'annoncer la disponibilité en version générale de son service Hadoop en mode SaaS, HDInsight, le produit d'un partenariat avec Hortonworks, pour porter Hadoop sur Windows et l'intégrer avec les outils analytiques maison.

Pour approfondir sur Outils décisionnels et analytiques