Definition

archive

archive

Une archive est une collection de données que l'on déplace vers un référentiel de sauvegarde, afin de l'isoler pour des obligations de sécurité ou d'alléger le support de stockage principal. Il peut s'agir d'une simple liste de fichiers ou d'une structure de fichiers organisés en répertoires ou catalogues (selon la façon dont un programme particulier gère l'archivage).

Les sites Web et FTP (File Transfer Protocol) qui proposent des logiciels en téléchargement nomment souvent archive ou archives la liste contenant les fichiers à télécharger.

Différence entre sauvegarde et archive

Si la sauvegarde et l'archivage des données semblent similaires, ils présentent toutefois des différences distinctes. Les sauvegardes sont des copies des données stockées à des fins de restauration, en cas de corruption. Elles résultent généralement d'une réplication ou d'une mise en miroir, et sont mises à jour au fur et à mesure de l'évolution des fichiers. Il s'agit d'un stockage à court terme qui doit s'exécuter correctement pour permettre la restauration rapide des données. Les sauvegardes sont en principe stockées sous forme de blocs afin de faciliter la récupération simultanée de gros volumes de données.

Les données archivées ne sont nullement une copie, mais plutôt des données inactives et rarement modifiées dont la conservation est prévue sur de longues périodes. En cas de stockage d'archive, la performance n'est pas aussi essentielle. Au lieu d'être stockées en blocs, les données archivées se présentent plus généralement sous forme de fichier ou d'objet assorti de métadonnées, afin d'en faciliter un accès granulaire.

Options de stockage d'archive

En cas de stockage d'archive, il doit être possible de stocker de gros volumes de données sur de longues périodes et à faible coût. Voici les options les plus couramment utilisées pour les données archivées :

Bande. La bande reste un moyen efficace d'archiver le stockage des données, car elle revient peu cher. Mais, comparativement aux autres options, il faut prévoir beaucoup plus de temps pour accéder aux données qui y sont stockées. C'est pourquoi elle est souvent utilisée comme un support d'archivage à long terme, lorsque l'accès aux données est peu probable.

Disque. Les disques durs peuvent intervenir dans le stockage d'archive. Toutefois, l'alimentation et le refroidissement de ces unités de stockage rendent cette option onéreuse.

Cloud. Le Cloud paraît une solution avantageuse de par sa capacité d'évolution et l'absence de coûts de matériel, d'alimentation et de refroidissement. Toutefois, en cas de grands datacenters où le volume des archives ne cesse d'augmenter, le coût permanent du stockage en Cloud peut commencer à peser. Parmi les principaux fournisseurs de Cloud, certains proposent des plateformes d'archivage dans le Cloud, qui offrent des performances moins rapides pour un coût moindre.

Objet. Le stockage objet est une option intéressante pour les archives du fait de sa capacité à stocker de gros volumes de métadonnées, éléments essentiels pour faciliter l'accès aux données. Il est également économique et en mesure de stocker d'énormes quantités de données.

Outils d'archivage de données d'entreprise

Les logiciels d'archivage permettent, en fonction des besoins, de déplacer les données, du stockage de production vers le stockage d'archivage. De nombreux logiciels d'archivage peuvent automatiquement transférer les données vers un emplacement de stockage selon des règles définies par l'utilisateur ou lorsque la fréquence d'accès aux données diminue. Certains logiciels d'archivage se connectent directement à un fournisseur de Cloud, tandis que d'autres aident le stockage bande ou objet à agir à titre d'extension du disque utilisé pour stocker les données de production.

Dans bien des cas, les logiciels d'archivage et de stockage sont intégrés. Certains logiciels donnent aussi la possibilité de mettre en cache des segments de données archivés sur disque, alors que la plus grande majorité est stockée sur objet ou bande, pour accélérer les temps de réponse lors de l'accès aux données.

Cette définition a été mise à jour en avril 2018

Pour approfondir sur Administration du stockage