Definition

Gestion des copies de données (CDM, copy data management)

La gestion des copies de données (CDM, Copy Data Management) vise à réduire la consommation de stockage en supprimant les doublons inutiles des données de production.

Les logiciels de sauvegarde et autres applications d'entreprise fonctionnent de façon indépendante, ce qui crée souvent de multiples copies des mêmes données. Or, ces doublons peuvent encombrer l'espace de stockage, ralentir les performances du réseau et compliquer l'accès aux données stratégiques ou leur restauration. Les logiciels CDM remédient à ces problèmes en virtualisant les données pour réduire le nombre de copies intégrales.

Fonctionnement de la CDM

La plupart des logiciels de gestion des copies de données créent une copie virtuelle complète des données. Lorsque des modifications uniques sont apportées à l'environnement de production, le logiciel crée et stocke un instantané des modifications incrémentielles au niveau du bloc. Le mécanisme d'instantané crée un disque différentiel en lecture/écriture lié à la copie de sauvegarde par une relation parent-enfant, sans créer une nouvelle copie intégrale. Les opérations d'écriture n'étant pas dirigées vers la copie de sauvegarde, les administrateurs n'ont pas à craindre une modification accidentelle du contenu de la sauvegarde principale. La réduction du nombre de copies intégrales limite également le risque de prolifération des serveurs et a un effet positif sur les coûts, car l'espace de stockage n'est pas encombré par des copies inutiles des données.


Jason Buffington, analyste en chef
chez Enterprise Strategy Group,
explique l'importance de la gestion
des copies de données.

Le terme de gestion des copies de données a été popularisé par Actifio, éditeur de logiciels de virtualisation. Actifio capture les données de production, tient à jour une version de référence, dite « golden master », et génère sans limite des exemplaires virtuels dès qu'une copie des données de production est requise. Dans un environnement de développement, d'analyse ou de test, cette approche est particulièrement importante, car l'environnement, quel qu'il soit, peut utiliser une réplique exacte des données de production de l'organisation sans consommer inutilement de l'espace de stockage avant que cela soit nécessaire.

Importance de la gestion des copies de données

Plus la capacité de stockage se développe, plus le besoin de gestion des copies de données se fait sentir. Les données se multiplient à un rythme constant, et les copies inutiles occupent un espace de stockage très en demande. La virtualisation du stockage apporte des bénéfices en matière de sauvegarde et de récupération, mais la création et le stockage de copies supplémentaires des données peuvent poser problème.

Le stockage de copies multiples et la sauvegarde fréquente étant des pratiques standard de protection des données, il n'est pas surprenant que le nombre de copies augmente rapidement et de façon exponentielle. Ces volumes excessifs peuvent nuire à l'efficacité et à la productivité et, pour de nombreuses entreprises, un système subissant des lenteurs est inacceptable.

En outre, cet espace de stockage supplémentaire a un coût. Le stockage des données est onéreux, et plus la capacité de stockage accordée aux copies est grande, plus des sommes importantes sont gaspillées en stockage inutile. En supprimant les copies supplémentaires de données, les entreprises peuvent à la fois accroître leur efficacité et libérer un espace de stockage coûteux.

Avantages de la gestion des copies de données

  • Accélérer les cycles de déploiement des applications, améliorer la prise de décision, augmenter l'efficacité et la productivité grâce à un accès rapide, facile et autonome aux copies des données dans le format approprié.
  • Assurer la conformité et atténuer les risques liés à la sécurité, grâce à une meilleure visibilité de l'utilisation des copies de données.
  • Réduire les coûts d'administration du stockage par le contrôle centralisé, l'automatisation et l'orchestration.
  • Réduire les coûts de stockage, par le maintien d'un nombre adapté de copies, avec les stratégies adaptées et sur le stockage adapté.

Source : Steve Ricketts

Comparaison entre gestion des copies de données et sauvegarde

La gestion des copies de données est un outil de sauvegarde très pratique, mais qui ne doit pas se substituer à une sauvegarde classique. En effet, la CDM n'a pas été conçue pour assurer la protection des données, mais pour optimiser le stockage. Si elle permet de créer des points de récupération des données, elle ne crée pas de véritable sauvegarde des données source.

Les instantanés de stockage étant utilisés à la fois pour la sauvegarde traditionnelle et pour la CDM, certaines entreprises estiment qu'ils peuvent remplacer la sauvegarde. Les instantanés et la sauvegarde offrent souvent une certaine tranquillité d'esprit grâce à redondance, mais la CDM ne poursuit pas le même objectif.

Comment trouver le produit CDM approprié

Si certaines fonctionnalités sont incontournables sur les plateformes de gestion des copies de données, les produits varient selon les fournisseurs. Certains systèmes CDM sont donc mieux adaptés que d'autres suivant les organisations.

Actifio Inc., Catalogic Software, Cohesity Inc., Commvault Systems Inc., Delphix Corp. et Rubrik Inc. sont parmi les fournisseurs les plus réputés en matière de solutions CDM.

Questions à poser aux vendeurs de CDM

A l'heure actuelle, les fonctionnalités des différents produits du marché présentent de nombreuses similitudes. La plupart des éditeurs CDM commercialisent des solutions qui importent les données des plateformes de production vers le stockage géré par leur logiciel. D'autres permettent la gestion des données via différentes solutions de stockage classiques d'autres fournisseurs. Toutes les solutions CDM courantes fonctionnent à partir de sources physiques et virtuelles, et certaines proposent des appliances à titre de stockage secondaire. Le marché gagne en maturité et de plus en plus de fournisseurs ajoutent des fonctionnalités de cloud public à leurs produits.

Perspectives du marché de la gestion des copies des données

La lutte contre la prolifération des données devient une priorité, et la question de l'expansion des données ne sera pas résolue de sitôt. D'après une étude réalisée en 2017 par Taneja Group, plus de 30 % des entreprises envisagent ou sont en train de s'équiper de produits CDM.

Ce chiffre pourrait encore progresser au fur et à mesure que les fournisseurs ajoutent des fonctionnalités à leurs logiciels de gestion des copies pour tenter de remédier aux problèmes récurrents de protection et de sauvegarde des données.

Cette définition a été mise à jour en mars 2019

Pour approfondir sur Administration du stockage