Avec HDP 1.0, Hortonworks veut simplifier l’accès à Hadoop
Hortonworks, la spin-off de Yahoo spécialisée Hadoop, publie la version 1.0 de sa plate-forme, Hortonworks Data Platform avec une volonté de faciliter le déploiement de cluster Hadoop, ainsi que la gestion du framework.
Presque un an jour pour jour après la création de la société, Hortonworks publie la version 1.0 de sa plate-forme Hadoop, Hortonworks Data Platform (HDP). Disponible dès le 15 juin, cette distribution de Hadoop sera prête pour les déploiements en production, souligne ainsi la société, qui entend bien rivaliser sur ce segment très tendance, alors que le marché compte des pure-players, comme MapR, Cloudera et des mastodontes comme IBM ou EMC (avec Greenplum). Mais surtout la technologie de cluster distribué et le système de fichiers HDFS (Hadoop Distributed File System) de la fondation Apache devient le composant à supporter pour affronter le monde du Big Data.
Microsoft s’est ainsi associé à Hortonworks pour développer des déclinaisons de Hadoop pour Azure et Windows Server. Teradata a également choisi Hortonworks pour développer une architecture de référence couplant Hadoop à la base de données de Teradata et Teradata Aster. Sans oublier Talend qui a connecté son ETL à Hadoop via Hortonworks.
Hortonworks, une spin-off de Yahoo, a la particularité de rassembler la matière grise Hadoop du portail multimédia. Cette expertise, associée à un contexte tourné sur la gestion des données en volume, très propice à Hadoop, Hortonworks compte justement la digérer et la traduire de façon dé-complexifiée auprès des clients de sa distribution. En clair, pour Hortonworks, l’industrialisation d’Hadoop passe logiquement par sa facilité d’approche et d’apprentissage. «Hortonworks Data Platform a été développée pour faciliter l’installation, l’intégration, la gestion et l’utilisation d’Apache Hadoop, aux entreprises et aux fournisseurs de solutions», écrit d’ailleurs John Kreisa, le vie président du marketing d’Hortonworks sur le blog de la société.
Basée sur la version 1.0 de Hadoop, HDP package des outils de développement comme Pig pour le scripting, Hive pour le requêtage, Oozie pour le workflow et HBase pour la base de données NoSQL. Mais - et c’est un point important - Hortonworks, en ligne avec sa stratégie de démocratisation de Hadoop, y a associé de puissants outils de gestion. On note l’intégration d’Apache Ambari, qui permet de configurer et de provisioner rapidement un cluster Hadoop, via une interface graphique. Selon Hortonworks, l’utilisateur suit une simple procédure de configuration en 7 étapes. Par exemple, l’outil analyse le cluster cible et recommande la configuration logicielle adéquate. Ambari propose également des services de gestion et de monitoring qui cartographient dans des tableaux de bord l’état du cluster.
HDP embarque également HCatalog - également de la fondation Apache - pour une couche de Metadata services, qui permet de définir une structure de données dans Hadoop pour attaquer des données dans des bases de données traditionnelles. Enfin, Talend Open Studio forme la brique services d’intégration de données.
Disponible gratuitement et 100% Open Source, se vante Hortonworks, HDP est également couplée à une offre de support commercialisée par la société, selon 4 formules, l’édition Enterprise Support pour la plus élevée au Support Starter Pack.