Comment créer une stratégie efficace d'archivage des données

Les outils nécessaires pour une stratégie efficace d'archivage des données dépendent entièrement des exigences d'une entreprise en matière de conformité, de gouvernance des données et de gestion du stockage.

A la question de savoir combien de temps des données doivent être archivées, on pourrait répondre « assez longtemps pour s'assurer qu'elles seront disponibles quand vous en aurez besoin ». Cette affirmation illustre bien les deux variables les plus importantes dans l'équation de l'archivage des données : le temps et l'accessibilité.

Le temps, ou plus précisément la durée de conservation, constitue le « nerf de la guerre » quand il s'agit de trouver des solutions d'archivage adaptées aux besoins d'une entreprise. Or, les exigences en matière de rétention des données peuvent varier considérablement, souvent d'une application à l'autre. Par exemple, toutes les entreprises doivent gérer des données financières qui sont généralement à conserver pendant sept à 10 ans.

Archives

Pour les données relatives aux ressources humaines, le délai peut être plus court, mais la réglementation diffère selon les pays. Les données médicales pourront être conservées pendant toute la durée de vie du patient (voire un peu plus), et les données relatives à l'énergie atomique, pendant 70 ans, etc.

Mais quel est le paramètre commun à toutes ces durées ?

C'est très simple : la conformité. Dans la plupart des cas, les exigences en matière de rétention correspondent au délai de prescription au terme duquel une partie (qu'elle soit publique ou privée) ne peut plus intenter une action en justice contre l'entreprise. En effet, tout manquement à l'obligation de produire des documents exigés par une décision judiciaire est passible de sanctions civiles voire, dans certains cas, pénales.

En revanche, conserver des documents au-delà de la période obligatoire les expose à une investigation légale et peut inutilement compromettre la situation juridique de l'entreprise.

Inventorier les données et à leur affecter un calendrier de conservation

Malheureusement (ou peut-être est-ce une chance !), la plupart des informaticiens n'ont aucune connaissance juridique. Par conséquent, la première étape dans l'élaboration d'une stratégie d'archivage consiste à inventorier les données et à leur affecter un calendrier de conservation.

Les conseillers juridiques de l'entreprise pourront sans doute fournir les paramètres nécessaires. Si les avocats ne peuvent pas s'en charger (et vous serez surpris de constater qu'ils refusent souvent de le faire), les chefs des différents services auxquels « appartiennent » les données pourront fournir les informations nécessaires, puisqu'ils sont censés connaître l'environnement réglementaire de leur domaine d'activité.

Parfois, avocats et responsables de service préfèrent ne pas fixer de calendrier déterminé. Dans ce cas, les services informatiques ne doivent pas jouer aux devinettes. En l'absence de définition d'une durée spécifique, la période de rétention par défaut devient « ad vitam aeternam ».

Ce n'est pas l'idéal, mais les responsables informatiques n'ont pas toujours d'autre choix.

Le terme d'archive est utilisé un peu à la légère depuis quelques années. L'archivage peut désigner le déplacement des données rarement utilisées vers des disques de grande capacité peu coûteux, la sauvegarde sur bande et le stockage hors ligne ou hors site. De même qu'il existe de nombreuses solutions de protection des données (associant instantanés, réplication et sauvegarde), les entreprises ont à leur disposition tout un arsenal dédié à l'archivage.

Une telle infrastructure s'avère nécessaire pour répondre de manière économique à la diversité des exigences de conservation citées ci-dessus. Il convient de trouver l'équilibre entre ces divers besoins et la complexité des solutions.

Ainsi, une bonne solution d'archivage apportera l'automatisation nécessaire pour assurer la granularité requise au niveau des applications, tout en minimisant l'incidence sur les opérations informatiques.

Avantages de l'archivage des données

Les services informatiques seront enclins à mettre en œuvre l'archivage dans un but d'amélioration générale ou pour des raisons propres à une application. Dans les deux cas, les avantages attendus sont les suivants :

  • Réduction des coûts. L'archivage des données participe largement, bien que non exclusivement, d'un effort pour baisser les coûts. Cette économie se mesure en euros/dollars par Gigaoctet stocké. De nombreux fournisseurs proposent une analyse du coût total de possession (CTP). Tous les modèles étant censés produire des résultats positifs, ces derniers ne sont significatifs que si vous vous entendez à la fois sur les données entrées et sur les principes qui sous-tendent le modèle de CTP.
  • Réduction de la fenêtre de sauvegarde. Même avec la sauvegarde sur disque, la compression et la déduplication des données, les fenêtres de sauvegarde sont soumises à des pressions permanentes dues à des taux de croissance des données souvent supérieurs à 50 % par an. Il ne rime à rien de sauvegarder régulièrement des données inchangées. Or, l'archivage permet de supprimer des dizaines de téraoctets de données, voire plus, du jeu de sauvegarde.
  • Conformité. Comme indiqué précédemment, la réglementation nationale et les obligations légales constituent des raisons majeures pour mettre en œuvre une stratégie d'archivage des données. Le tout est de parvenir à le faire au meilleur coût.
  • Préservation des connaissances. A l'ère du Big Data, les entreprises apprennent à mesurer la valeur qu'elles peuvent retirer de l'analyse de vastes quantités de données. Dans ce cas, ce n'est pas le coût qui est en jeu, mais la volonté de bénéficier d'un avantage concurrentiel sur le marché.
  • Amélioration des performances. En réduisant le volume des données à gérer, ou en séparant les données inutilisées des données actives, les entreprises pourront obtenir une amélioration non négligeable des performances de leur système.

Certains produits d'archivage sont conçus pour offrir ces avantages dans des environnements spécifiques. On peut citer par exemple SAP, Oracle et les applications de messagerie électronique.

Les produits spécialisés tiennent compte des caractéristiques de l'application ; ainsi, ils peuvent élaguer ou séparer les données de façon à optimiser l'application sans mettre en péril son intégrité référentielle.

En revanche, les programmes d'archivage génériques n'offrent pas toujours de telles capacités. Un outil spécialisé devrait amplement suffire si les volumes de données ne justifient pas une mise en œuvre au niveau de l'ensemble du système, si le problème se pose principalement au niveau d'une application particulière ou si un produit générique ne prend pas correctement en charge une application donnée.

Pour approfondir sur Formats et Archivage