Hadoop à l’ère du multicloud et de l’analytique en temps réel
Introduction
Le lac de données a connu une forte vague de popularité. Il a permis de développer les cas d’usage Big Data et analytique, puis de machine learning. Ces installations sur site ont petit à petit migré dans le cloud. Même si les frameworks comme Hadoop n’ont pas perdu leurs qualités, les éditeurs et les entreprises ont trouvé de nouveaux moyens de traiter leurs jeux de données, par exemple avec Apache Spark, et de les stocker, avec Amazon S3. Dès lors, la différence entre Data Lake et Data Warehouse est de plus en plus ténue.
Ce passage dans le cloud, n’a pas réussi à Cloudera, HortonWorks, et MapR. Le premier a racheté le deuxième, et le troisième appartient aujourd’hui à HPE. Cela ne veut pas pour autant dire qu’Hadoop est mort. Ces éditeurs prennent différentes voies. HPE défend une approche propriétaire. Cloudera voit sa rédemption dans le mutlicloud et dans l’agrégation de technologies, à l’instar de Microsoft, Google, et AWS.
A travers ce guide, comprenez les bénéfices d’une architecture Hadoop. Puis découvrez les critères qui vous aideront à bien choisir la distribution répondant à vos besoins en matière de Big Data et d’analytique. Enfin, restez informé sur les perspectives de ce marché en pleine transformation.
1Bénéfices-
Les bénéfices d’Hadoop dans une approche Big Data
7 étapes pour créer son data lake
Peupler un cluster Hadoop de données qui ne sont ni organisées ni gérées correctement risque de nuire à vos projets analytiques. Voici 7 étapes clé qui vous permettrons de mieux utiliser les données de votre data lake. Lire la suite
Bien comprendre Hadoop pour gérer les Big Data
Hadoop est devenu aujourd’hui le moteur d’applications clés pour les entreprises. Mais pourquoi ce framework attire-t-il le monde professionnel ? Lire la suite
2Sélectionner-
Bien choisir sa distribution Hadoop
4 critères pour comparer les distributions Hadoop
En passant à la loupe les spécificités des distributions Hadoop, vous pouvez mieux identifier l’offre de support qui convient le mieux à votre entreprise Lire la suite
Les principales distributions Hadoop sur le marché
Voici les principales distributions Hadoop sur le marché et un ensemble d'éléments pour choisir celle qui convient le mieux aux pratiques analytiques en entreprise. Lire la suite
Cloudera vs AWS EMR : quelle distribution Hadoop choisir pour vos projets Big Data
Les entreprises qui ont besoin d’une plateforme Big Data doivent généralement sonder eux-mêmes le marché pour choisir un fournisseur. La complémentarité des services AWS est indéniable, mais la solution de Cloudera est-elle un meilleur choix ? Lire la suite
3Perspectives-
Un changement d’ère
MapR se vend à HPE : vers l’hiver des pure-players du Big Data
La disparition de MapR, grand pionnier du Big Data, dans HPE pourrait bien être le signe du début de l'extinction des dinosaures d'Hadoop dont Hortonworks et Cloudera. Lire la suite
Cloudera ouvre les voies du multicloud à ses clients
Cloudera a lancé à la fin du mois de septembre sa plateforme Big Data combinant ses technologies et celles d’Hortonworks dans le cloud AWS. Le support du multicloud est d’ores et déjà annoncé. Lire la suite