Guide : tout savoir sur Hadoop
Où en est la plateforme en 2016 ?
Introduction
Quand on parle de Big Data, Hadoop n'est plus aujourd'hui une technologie de niche. Il n'en reste pas moins que malgré sa forte popularité, le framework analytique Java développé au sein de la fondation Apache reste un mystère pour nombre d’utilisateurs.
Ce guide, actualisé, revient donc sur l'histoire de la plateforme (pour comprendre ce qu'est réellement Hadoop), sur son présent (pour en appréhender la portée et ses usages concrets) et sur des conseils pour bien choisir et exploiter tout son potentiel.
A lire également sur le sujet, les Guides Essentiels :
- Spark et SQL-On-Hadoop : vers un Hadoop augmenté
- Big Data et analytique : de nouveaux éclaireurs pour les entreprises
1Du passé...-
Historique
A la découverte d'Hadoop
LeMagIT part à la découverte d'Hadoop, le framework Java emblématique du mouvement dit "big data". Premier article, pour comprendre Hadoop et le rôle de ses principaux composants. Lire la suite
Hadoop 2 veut étendre le champ d'application d'Hadoop au-delà du Batch
Avec le lancement officiel d'Hadoop 2 le 15 octobre, la fondation Apache veut notamment étendre l'usage de son framework analytique aux usage non batch. Lire la suite
Hadoop User Group : passer du pilote à la production, pas si simple
Quelle grande entreprise française n’a pas aujourd’hui un projet Big Data ? Mais entre les pilotes et la production, une étape reste à franchir. Si les logiciels sont là, reste la question de la méthode. Lire la suite
2... au présent-
Hadoop en 2016
Hadoop Summit 2016 : Hortonworks voit au-delà d’Hadoop
A l’occasion de l’Hadoop Summit qui se tient actuellement à Dublin, Hortonworks a annoncé des alliances clés et des évolutions de sa roadmap, avec un axe fort portant sur les données en mouvement. Lire la suite
Big Data Paris : l’heure des projets a (légèrement) sonné
L’édition 2016 de Big Data Paris est marquée par une progression des projets où le Big Data joue un rôle clé. Même si l’industrialisation des PoC reste encore aléatoire. Le lac de données reste le cas d’usage premier. Lire la suite
Entrepôt de données vs Hadoop : ces frères ennemis qui doivent cohabiter
Hadoop ne tuera pas l’entrepôt de données. Il peut offrir en revanche des capacités de délestage de données pour accroître la flexibilité des environnements des entreprises. Lire la suite
3Conseils Pratiques-
Bien choisir, bien utiliser Hadoop
Quand utiliser Hadoop... et quand s'en passer ?
Hadoop est devenu la coqueluche du Big Data. Mais ses capacités ne sont pas illimitées : les entreprises avisées doivent s'assurer qu'il répond bien à leurs besoins. Lire la suite
Clusters Hadoop : avantages et limites pour l'analyse des Big Data
Avec Brien Posey, découvrez les avantages substantiels des clusters Hadoop dans la prise en charge de grands volumes de données non structurées et leurs limites dans d’autres environnements. Lire la suite
Bien comprendre Hadoop pour gérer les Big Data
Hadoop est devenu aujourd’hui le moteur d’applications clés pour les entreprises. Mais pourquoi ce framework attire-t-il le monde professionnel ? Lire la suite
Quels cas d’usage pour un cluster Hadoop dans votre entreprise
Pour vous aider à comprendre le potentiel d’Hadoop dans votre entreprise, le consultant David Loshin passe en revue différents cas d’usage que peut supporter le framework. Lire la suite
Ce qu’il faut savoir pour évaluer des distributions Hadoop
Avant d’évaluer une distribution Hadoop spécifique, il convient d’examiner les fonctions proposées par le fournisseur et bien comprendre si celles-ci répondent au mieux aux besoins. Lire la suite
4 critères pour comparer les distributions Hadoop
En passant à la loupe les spécificités des distributions Hadoop, vous pouvez mieux identifier l’offre de support qui convient le mieux à votre entreprise Lire la suite
4Sur le terrain-
Retours d'expériences
Marks & Spencer déploie Hadoop pour créer de nouvelles fonctionnalités analytiques
Après avoir retiré son site web d’AWS, le distributeur britannique a créé « un hub de données » pour mieux analyser les retombées marketing et mieux comprendre les comportements clients dans un contexte multi-canal. Au cœur de ce projet Big Data : la distribution Hadoop de Cloudera. Lire la suite
Carrefour dote son SI d'une architecture « data-centric »
Le numéro 1 français de la distribution a entrepris la modernisation de son système d'information en déployant un Data Lake. Baptisé PHENIX, ce projet vise à faire basculer l'informatique de l'entreprise dans le temps réel. Lire la suite
Bouygues Telecom déploie Cloudera pour réduire les incidents de la 4G
L'opérateur voulait comprendre à chaud les incidents réseaux en interprétant mieux ses logs. C'est chose faite avec la distribution Hadoop, qui lui a "fait gagner des clients entreprises" dixit son responsable SI Réseaux Lire la suite
Gulf Air analyse les sentiments de ses clients avec Hadoop
La compagnie aérienne utilise un Cloud privé et l’Open Source pour analyser les réseaux sociaux et mieux comprendre ce que pensent ses clients. Lire la suite
Airbus passe au Big Data avec Oracle pour l’analyse de ses essais en vol
Face à la quantité de données générées par la conception des prototypes d’avions, le Big Data apporte chez Airbus de jeunes, mais prometteuses, réponses. L’avionneur a travaillé sur la question avec Oracle. Lire la suite