Definition

numérisation

numérisation

La numérisation fait référence à la conversion d'informations dans un format numérique. Les informations ainsi numérisées sont organisées en unités de données discrètes (les bits) adressables séparément (généralement en groupes de plusieurs bits appelés multiplets). Les données binaires obtenues peuvent alors être traitées par les ordinateurs et de nombreux équipements informatiques, tels que des appareils photo ou des appareils auditifs numériques, par exemple.

Le même procédé permet de numériser du texte et des images : un scanneur capture l'image (il peut s'agir d'une image de texte) et la convertit en fichier image, par exemple un bitmap. Un programme de reconnaissance optique des caractères (OCR, Optical Character Recognition) analyse les zones d'ombre et de lumière d'une image de texte afin d'identifier chaque lettre ou chiffre, et les convertit en code ASCII.

La numérisation audio et vidéo utilise l'un des nombreux procédés de conversion analogique-numérique : un signal variant de façon continue (analogique) est transformé en signal multiniveau (numérique), tout en conservant l'essentiel du contenu. Le procédé d'échantillonnage mesure l'amplitude (force du signal) d'une forme d'onde analogique à intervalles temporels réguliers et représente les échantillons sous forme de valeurs numériques utilisables en tant que données numériques.

Numériser les informations permet d'en faciliter la conservation, l'accès et le partage. Par exemple, un document historique original n'est consultable que par les personnes qui se rendent physiquement sur le lieu où il est conservé. S'il est numérisé, en revanche, il devient accessible dans le monde entier. De plus en plus de documents historiques et culturels sont ainsi numérisés à des fins de conservation et de partage.

D'après un article paru dans The Guardian en mars 2007, si l'intégralité du langage parlé depuis ses origines était numérisé, il occuperait cinq exa-octets d'espace de stockage. La capacité totale des informations numérisées était estimée à 161 millions d'exa-octets en 2006. Les e-mails à eux seuls constituaient six exa-octets de ce volume.

 

Cette définition a été mise à jour en avril 2018

Pour approfondir sur SaaS