boscorelli - Fotolia

Après Azure, Hortonworks veut séduire les utilisateurs AWS

Hortonworks Data Cloud for AWS donne accès à des services Hadoop de data science, de préparation des données, d’analytique et d’ETL . La solution est optimisée pour les services AWS comme S3.

Mieux cibler les adeptes d’AWS. C’est ainsi que pourrait être résumé le lancement par Hortonworks, le spécialiste de la distribution Hadoop, de Hortonworks Data Cloud for AWS, un service de traitement des données en volume - comme la société sait en faire - mais adapté particulièrement à l’infrastructure d’Amazon Web Services. La société avait déjà trouvé sa place dans le Cloud Azure de Microsoft avec Azure HD Insight, ou proposait d’installer sa plateforme HDP (Hortonworks Data Platform) sur les deux Iaas. Mais elle n’avait pas encore attaché étroitement certains de ses outils à ceux d’AWS.

Concrètement, Data Cloud for AWS (disponible sur la marketplace d’AWS) s’adosse à HDP, mais permet surtout de déployer rapidement Hive ou des clusters Spark dans un environnement AWS, résume Shaun Connolly, Chief Strategy Officer chez Hortonworks. Sous le capot, explique-t-il, on retrouve aussi des composants clés comme Zeppelin, Tez et LLAP (pour Hive), Ambari et Cloudbreak. Surtout là où Hortonworks a souhaité mettre l’accent : simplifier la mise en service. Avec ce produit, lance encore Shaun Connolly, «  nous configurons les bons composants pour la bonne tâche, pour que nos clients ne soient pas freinés par la complexité ».

Cette facilité d’usage est notamment rendue possible via une intégration étroite de la solution d’Hortonworks avec les services d’AWS. Celle-ci a donc été optimisée pour fonctionner de pair avec S3, EC2 ou encore RDS, des services clés du Cloud AWS. « Par exemple, explique le responsable, nous avons beaucoup travaillé à optimiser les connexions à Amazon S3 puisque les workloads d’ Hortonworks Data Cloud for AWS ont accès en écriture et en lecture aux données stockées dans S3 ».

Azure ou AWS : quels sont les cas d’usage ?

Logiquement,  le spécialiste Hadoop  positionne son offre AWS sur des usages dédiés,  comme la data science, l’exploration, la préparation, l’extraction (ETL), l’analyse des données et enfin le reporting. Des scenarii où il convient d’exploiter les services Cloud pour des besoins spécifiques, temporaires et accessibles en self-service.

« Azure HDInsight est un service Cloud managé qui offre un SLA de 99,9% et offre un champ fonctionnel plus étendu, adapté aux workloads permanentes ou temporaires », ajoute encore Shaun Connolly. Alors que selon lui, la solution sur AWS dispose de fonctionnalités plus ciblées, « proposant un accès rapide hautement prescriptif aux utilisateurs qui débutent leur projet, souhaitent une facturation calée sur l’usage, démarrent  leur environnement, l’utilisent et le stoppent ; ce qui leur permet de gérer leurs coûts », souligne-t-il.   La solution est ainsi facturée à l’heure (entre 0,10$ et 0,60$, selon le type d’instances AWS choisies), ou à l’année.

En ce sens, la solution convient à ceux qui utilise AWS pour des tâches temporaires, avec des données stockées dans S3 », conclut-il, rappelant à demi-mot que la base installée d’AWS est aujourd’hui une aubaine pour Hortonworks.

 

Pour approfondir sur Applications et services