Definition

Gestion des Big Data

La gestion des Big Data correspond à l’organisation, la gestion et la gouvernance d’un grand volume de données à la fois structurées et non structurées.

Le rôle de la gestion des Big Data est de garantir un niveau élevé de qualité des données et d’accessibilité aux applications de Business Intelligence et d’analyse des Big Data. Les entreprises, les administrations ainsi que toutes autres organisations mettent en place des stratégie de gestion des Big Data pour les aider à faire face à la quantité grandissante de données. Des données qui se comptent en teraoctets, voire en pétaoctets et sont stockées dans une multitude de formats.

Une gestion efficace des Big Data permet aux entreprises d’identifier et de localiser des informations clés dans une masse de données non structurées et semi-structurées, issues de sources différentes, telles que des systèmes d’enregistrements d’appels, des logs systèmes ou encore des réseaux sociaux.

La plupart des environnements Big Data s’étendent au delà des bases de données relationnelles et des traditionnels entrepôts de données. Ils intègrent des technologies capables de traiter et de stockées des formats de données non transactionnelles.

Cette tendance autour de la collecte et de l’analyse des Big Data a donné naissance à de nouvelles plates-formes qui associent une technologie classique d’entrepôt de données à des systèmes Big Data dans une architecture logique. Le système décide par exemple quelles données doivent être conservées pour des raisons de conformité, quelles autres données doivent être supprimées et celles qui doivent être conservées et analysées pour améliorer les processus métier et fournir un avantage concurrentiel à l’entreprise.

Ces processus nécessitent une classification minutieuse des données afin qu’au final des petits ensembles de données puissent être analysés rapidement et de manière productive.

Cette définition a été mise à jour en août 2014

Pour approfondir sur Big Data et Data lake