Teratada veut faciliter l'intégration et l'usage des Big Data dans les entreprises
A l'occasion de sa conférence Teradata Universe 2013, le spécialiste des l'entrepôts de données a montré comment il comptait résoudre le problème des Big Data et de l'analytique des entreprises. A la clé, l'intégration à son concept d'architecture unifiée de données de passerelles plus prononcées entre l'entrepôt de données, Aster et Hadoop, ainsi que la mise à jour de son appliance haut de gamme. Avec, en toile de fond, la notion de marketing intégré que le groupe considère comme l'application phare pour l'analytique Big Data.
A l'occasion de Teradata Universe 2013, qui se déroule actuellement à Copenhague, Teradata, le spécialiste de l'entrepôt de données et de l'analytique, a annoncé une série de technologies contribuant à inclure formellement le framework Hadoop au coeur de son concept d'architecture unifiée, Unified Data Platform, pour en faciliter l'intégration.
C'est ainsi que pourrait être présenté Enterprise Access for Hadoop. Cette brique issue de deux technologies, SQL-H et Studio with Smart Loader for Hadoop, se retrouve aujourd'hui intégrés à Unified Data Architecture (UDA), un concept d'architecture de Teradata qui associe l'entrepôt de données du groupe, Aster Analytics pour la découverte des données et l'analytique, et enfin Hadoop. Avec pour objectif une réponse adaptée à tous les cas d'usage en matière d'analyse de données et ce, quel que soit le type et le volume de données. Une vision unifiée, en somme, dans lequel l'utilisateur peut piocher.
Hermann Wimmer, président, International, de Teradata lors du discours d'ouverture
SQL-H correspond à un connecteur SQL augmenté qui permet de réaliser des requêtes sur les données stockées dans un cluster Hadoop, mais "sans avoir à ré-apprendre de nouveaux outils", résume Mike Koehler, le CEO de Teradata. Jusqu'alors les personnes qui avaient placé les données dans le systèmes étaient les seules à pouvoir les en extraire - et donc les analyser. Ainsi, SQL-H concrétise les ambitions de Teradata de combler la pénurie des data scientists et à contourner la difficulté induite de MapReduce, pour porter les possibilités d'analyse avancées du côté du monde SQL, beaucoup plus répandu. Teradata a exploité ses liens avec Hortonworks, contribuant ainsi à l'intégration de HCatalog au sein de SQL-H - qui supporte du coup Hortonworks Data Platform. Selon Teradata, SQL-H permet ainsi d'attaquer un cluster Hadoop, d'y effectuer des requêtes depuis Aster ou Teradata Data Warehouse, et de combiner ces données avec d'autres, de production. Selon Teradata, les analyses sont effectuées dans la mémoire de Teradata, seules les données Hadoop nécessaires à l'analyse ayant été extraites d'Hadoop. Ce rapprochement de Hadoop / MapReduce et de SQL n'est pas une première pour Teradata, qui s'était doté, lors de l'acquisition de Aster Data, d'une technologie de SQL - MapReduce.
Deuxième composant de Enterprise Access for Hadoop, Studio with Smart Loader for Hadoop agit ainsi en complément de SQL-H. Il permet aux analystes de déplacer des données entre l'entrepôt de données Teradata et Hadoop, et ce via une interface utilisateur facilitant l'opération. Cela déporte l'analyse de données Hadoop vers l'environnement Teradata et permet dès lors de se passer - par exemple - d'un connecteur Hadoop. Studio with Smart Loader for Hadoop supporte les distribution Hadoop de Cloudera et d'Hortonworks.
Au final, via ce tandem composant Enterprise Access for Hadoop, "les entreprises peuvent fouiller en profondeur dans les fichiers et données contenues dans Hadoop et les combiner à des données métier et de production, au sein de l'entrepôt de données, pour y effectuer des analyses", résume alors Scott Gnau, qui dirige les Teratada Labs.
Pour Sylvain Le Moël, directeur des solutions mobiles de MicroStrategy, présent lors de Teradata Universe 2013, le message de Teradata est clair : "Teradata veut ainsi rendre les données en volume plus exploitables, et mettre un minimum de structure sur des données non structurées. Car il n'est pas simple de faire de l'analyse sur tout et n'importe quoi", explique-t-il.
Favoriser l'intégration de l'analytique Big Data et Hadoop dans les entreprises
Mais autre point clé, cette approche de Teradata vise également à aborder la prochaine étape : celle de l'intégration de ces fonctions analytiques et de gestion des données au coeur des systèmes d'information des entreprises. C'est notamment le cas avec UDA et Enterprise Access for Hadoop, souligne Stephen Brobst, le CTO de Teradata, dans un entretien avec la rédaction. "Jusqu'alors, l'exploitation des Big Data étaient entre les mains des entreprises de l'Internet, dont le modèle économique repose sur l'usage même des données (comme Google, Facebook ,Twitter et LinkedIn…). Ils ont été les "early adopters" des technologies Hadoop". Mais selon lui, une étape a été franchie en 2012. "A partir de 2012, des exemples ont émergé dans les banques, dans les telcos, dans le retail et dans certaines entreprises du Fortune 500. Ces entreprises veulent quelque chose qui fonctionne comme une appliance, sans la nécessité de grosses équipes d'ingénieurs. Elles n'ont pas la même culture que les Google, Facebook ou LinkedIn, qui bâtissent eux-même leur technologie [il les nomme les DIY - "Do It Yourself", NDLR]", souligne-t-il. D'où l'idée d'un concept d'architecture unifiée pour fédérer tous les cas d'usage, et d'outils pour rapprocher SQL de Hadoop.
Support d'Infiniband
Et justement. Teradata a présenté à l'occasion de son raout européen le modèle 6700 de son appliance de type armoire, Active Entreprise Data Warehouse. Ce modèle, qui constitue le haut de gamme de chez Teradata, nous assure Tasso Argyros, senior vice président en charge du déploiement et de la stratégie produit dans le monde, chez Teradata (et co-président et fondateur de Aster Data), associe désormais la technologie Infiniband de Mellanox à BYNET, un système d'interconnexion haute performance du groupe. Selon Teradata, cela devrait accélérer jusqu'à 20 fois les interconnexions. Ce nouveau modèle d'appliance peut gérer jusqu'à 61 Po de données.
"Cette nouvelle appliance associe le dernier hardware, comme le dernier processeur Intel reposant sur l'architecture Sandy Bridge, ainsi que des connexions réseau accélérées", souligne-t-il, rappelant que "ce modèle utilise le logiciel d'interconnexion de Teradata, BYNET sur Infiniband". L'exécution des workloads et des applications analytiques se retrouvent ainsi accélérées pour 2 raisons, résume-t-il : le réseau est plus rapide, et le processeur gère moins de workloads. L'appliance utilise également un système de stockage hybrides mêlant SSD et disques durs.
Big Data = analytique et marketing
Logiquement, Mike Koehler a rappelé que cette exploitation des Big Data trouvait naturellement son application dans l'analytique et le marketing. La société, historiquement installée sur le secteur de l'entrepôt de données, a fait évoluer son offre sur la couche applicative, vers les métiers du marketing. Les rachats d'Aprimo en décembre 2010 et plus récemment d'Ecircle ont ainsi porté les capacités analytiques de Teradata sur le marketing numérique dit intégré. "Les CMO qui investissent dans le Marketing Performance Management augmenteront leurs revenus de 15%, explique-t-il. "Il s'agit donc de comprendre les besoins métiers et de disposer d'une infrastructure unifiée." Une façon également de donner un vrai cas d'usage du Big Data dans les entreprises, qui restent encore parfois assez frileuses à déclencher des projets. "Teradata a toujours eu une volonté d'être vu comme une société d'applications et non pas uniquement comme une société de seule base de donnée, raconte Sylvain Le Moël (MicroStrategy), illustrant la démarche de Teradata. En s'ouvrant au marketing, Teradata vient également toucher les départements métiers. Un élément clé dans l'équation Big Data, qui nécessite de "bousculer le IT". Et comme d'une pierre deux coup, la société parvient à toucher des lignes budgétaires supplémentaires, tout en donnant "un case study".
"Les personnes qui achètent l'entrepôt de données de Teradata sont dans les départements IT. Mais les personnes qui l'utilisent et créent des rapports sont les utilisateurs métiers, du marketing à la logistique. […] nous vendons à la fois au marketing ainsi qu'au IT", résument alors de concert Mike Koehler et Hermann Wimmer, président en charge de l'international chez Teradata, dans un entretien avec la rédaction. "Et parfois, dans certains cas, le marketing est le propriétaire de l'entrepôt de données […] l'achat de la solution peut être une combinaison entre le IT et le business". Toutefois, admet Hermann Wimmer, "eCircle ne s'adresse en revanche qu'aux utilisateurs métiers. Car nous pensons que le marketing utilisera des fonctions analytiques dans le futur et c'est la raison pour laquelle nous avons investi dans l'applicatif sur ce secteur ces dernières années".