Definition

Collecte de données

Par collecte de données, on entend l'approche systématique qui consiste à réunir et à mesurer des informations en provenance de sources variées, afin d'obtenir une vue complète et précise d'un domaine d'intérêt. La collecte des données permet à une personne ou à une entreprise de répondre à des questions pertinentes, d'évaluer des résultats et de mieux anticiper les probabilités et les tendances à venir.

La précision est de rigueur pour la collecte des données, si l'on veut assurer l'intégrité d'une étude, prendre des décisions commerciales avisées et garantir l'assurance qualité. Par exemple, dans le commerce et la distribution, pour mieux connaître les clients, il sera possible de collecter des données depuis les applications mobiles, les visites de sites Web, les programmes de fidélité et les sondages en ligne. Dans un projet de consolidation de serveurs, la collecte des données consistera non seulement à faire l'inventaire physique de tous les serveurs, mais aussi à obtenir une description exacte de ce qui est installé sur chacun d'entre eux : système d'exploitation, middleware et application ou base de données que le serveur prend en charge.

Méthodes de collecte des données

Les sondages, entretiens et groupes d'intérêt sont les principaux instruments de la collecte d'informations. Aujourd'hui, avec l'aide d'outils Web et analytiques, les entreprises peuvent également collecter les données issues des terminaux mobiles, du trafic des sites Web, de l'activité des serveurs et d'autres sources pertinentes, selon le projet.

Big Data et collecte des données

Le terme Big data représente le volume colossal de données structurées, semi-structurées et non structurées que les entreprises peuvent collecter. Charger des ressources Big Data dans une base de données relationnelle classique revient cher et prend beaucoup de temps. C'est pourquoi de nouvelles approches ont vu le jour pour la collecte et l'analyse des données. Pour réunir puis analyser les données du Big Data afin d'en tirer des informations exploitables, des données brutes accompagnées de métadonnées sont agrégées dans un lac de données. De là, les programmes d'apprentissage machine et d'intelligence artificielle utilisent des algorithmes complexes pour rechercher des modèles reproductibles.

Types de données

En règle générale, il existe deux types de données : les données quantitatives et les données qualitatives. Les données quantitatives sont des données présentées sous forme numérique : statistiques, pourcentages, etc. Les données qualitatives sont des données descriptives : couleur, odeur, apparence, qualité, etc.

En plus des données quantitatives et qualitatives, certaines entreprises souhaiteront éventuellement utiliser des données auxiliaires pour faciliter la prise de décision. Les données auxiliaires sont, par nature, quantitatives et ont déjà été collectés par un tiers à des fins différentes. Par exemple, une entreprise pourra se fonder sur les données de recensement des États-Unis pour prendre des décisions quant à ses campagnes marketing. Dans les médias, l'équipe chargée des actualités pourra s'appuyer sur les statistiques de santé de l'État ou sur des études médicales pour définir une stratégie de contenu.

La collecte des données évolue au rythme de la technologie. Les récentes avancées de la technologie mobile et de l'Internet des objets obligent les entreprises à revoir la façon de collecter, d'analyser et de monétiser de nouvelles données. En parallèle, les questions de confidentialité et de sécurité entourant la collecte des données s'intensifient.

Cette définition a été mise à jour en avril 2018

Pour approfondir sur Base de données