Complète, incrémentale, différentielle… Quelle sauvegarde choisir ?
Il existe plusieurs types de sauvegarde. Cet article explique comment choisir le moyen le plus adapté pour sauvegarder vos données et les récupérer en cas d’incident.
L’objectif de la plupart des sauvegardes est de créer une copie des données afin de pouvoir restaurer un fichier ou une application particulière après une perte, une corruption ou une suppression de données, voire après un sinistre. La sauvegarde n’est pas l’objectif, mais plutôt un moyen d’atteindre l’objectif d’une protection des données. En théorie, le principe de ménager une copie de secours est simple. Mais la mise en œuvre d’un ensemble efficace d’opérations liées à la sauvegarde est relativement complexe.
Les solutions logicielles dédiées à la sauvegarde – ou backup, en anglais – réduisent cette complexité. Pour autant, la sauvegarde des données n’est qu’une partie d’un plan plus vaste de protection contre les incidents. La solution de sauvegarde n’aidera ainsi à relancer l’activité après un incident qu’au prix d’une conception minutieuse et de tests qui le sont tout autant.
Les applications de sauvegarde offrent historiquement plusieurs manières de procéder. Les procédés les plus courants sont la sauvegarde complète, la sauvegarde incrémentale et la sauvegarde différentielle. Citons aussi les sauvegardes complètes synthétiques et la copie en miroir.
Le choix de la bonne stratégie dépend de plusieurs facteurs. Par exemple, si vous sauvegardez vers le cloud, les sauvegardes incrémentales sont généralement plus adaptées, car elles consomment moins de ressources. Vous pouvez commencer par une sauvegarde complète vers le cloud, puis passer aux sauvegardes incrémentales. La sauvegarde en miroir, quant à elle, est une approche plus adaptée au backup sur site et est conditionnée par la quantité de disques disponibles.
Qu’est-ce qu’une sauvegarde complète ?
La sauvegarde complète est l’opération de base. Comme son nom l’indique, il s’agit d’effectuer une copie de toutes les données vers un équipement de stockage, de type disque ou bande. Le principal intérêt d’effectuer une sauvegarde complète à chaque sauvegarde est qu’une copie de toutes les données est entièrement disponible depuis un seul média. Il en résulte un temps minimal pour restaurer les données, une métrique connue sous le nom d’objectif de temps de récupération (RTO, pour Recovery Time Objective).
Mais il y a des inconvénients. Une sauvegarde complète est le procédé le plus long ; elle met parfois 10 fois plus longtemps à s’achever comparativement aux autres procédés. De plus, elle nécessite plus d’espace de stockage.
Par conséquent, les sauvegardes complètes ne sont généralement exécutées que périodiquement. Les datacenters qui ont une petite quantité de données (ou d’applications critiques) peuvent choisir d’exécuter une sauvegarde complète quotidiennement, voire plus souvent. En général, les opérations de sauvegarde utilisent une sauvegarde complète en combinaison avec des sauvegardes incrémentales ou différentielles.
Qu’est-ce qu’une sauvegarde incrémentale ?
Une sauvegarde incrémentale copie uniquement les données qui ont été modifiées depuis la précédente sauvegarde. Généralement, elle fonctionne en comparant l’horodatage des fichiers en production avec celui de la dernière sauvegarde.
Étant donné qu’une sauvegarde incrémentale ne copie que les nouvelles données depuis la dernière sauvegarde, une entreprise peut l’exécuter aussi souvent qu’elle le souhaite, car le processus est beaucoup plus rapide qu’une sauvegarde complète. Par ailleurs, la sauvegarde incrémentale occupe moins de place que la sauvegarde complète, ce qui signifie moins de supports utilisés.
Qu’est-ce qu’une sauvegarde différentielle ?
La sauvegarde différentielle est comme la première sauvegarde incrémentale : elle copie toutes les données qui ont été modifiées depuis la dernière sauvegarde complète. Et le fait à chaque fois, sans tenir compte des sauvegardes différentielles effectuées entretemps.
Recopiant ainsi à chaque fois toutes les données qui ont été modifiées depuis le départ, la sauvegarde différentielle présente l’inconvénient d’être plus longue à s’achever que la sauvegarde incrémentale, sans pour autant être aussi longue qu’une sauvegarde complète. Sa taille sera aussi plus importante qu’une sauvegarde incrémentale.
Quelles sont les combinaisons possibles ?
Résumons. Comme le montre le tableau ci-dessous, chaque processus de sauvegarde fonctionne différemment. Une entreprise doit exécuter une sauvegarde complète au moins une fois. La bonne pratique que l’on rencontre le plus souvent consiste à effectuer une sauvegarde complète chaque semaine, typiquement lors du week-end, pour que le transfert des données copiées sur le réseau ne pénalise pas le trafic des utilisateurs.
Les sauvegardes suivantes seront idéalement quotidiennes, elles s’effectueront durant la nuit. Généralement, il s’agira soit d’une sauvegarde incrémentale, soit d’une sauvegarde différentielle.
Dans cet exemple, la première sauvegarde partielle est effectuée le lundi soir. Qu’elle soit différentielle ou incrémentale, elle contiendra les mêmes données. À partir de la troisième opération de sauvegarde, dès le mardi soir, les données qui sont sauvegardées de manière incrémentale ne contiennent que les modifications apportées depuis la dernière sauvegarde incrémentale, celle de la veille. Tandis que la troisième sauvegarde différentielle sauvegarde tous les changements depuis la dernière sauvegarde complète, celle du week-end précédent.
Ces trois types de sauvegarde servent à personnaliser la stratégie la plus optimale pour une protection complète des données. Chaque alternative implique de faire des compromis entre performances, niveaux de protection des données, quantité totale de données conservées et coût. Le tableau ci-dessous donne un exemple chiffré de l’espace requis par les données sauvegardées selon les trois scénarios possibles, tout en indiquant quelles sauvegardes sont nécessaires pour restaurer l’activité. Ces calculs sont basés sur 22 jours ouvrables dans un mois et une période de rétention des données d’un mois.
Comme indiqué ci-dessus, l’exécution d’une sauvegarde complète quotidienne nécessite le plus d’espace et prend le plus de temps. Cependant, plus de copies totales de données sont disponibles, et moins de supports sont nécessaires pour effectuer une opération de restauration. Par conséquent, la mise en œuvre de cette politique de sauvegarde a une plus grande tolérance aux désastres, et fournit une restauration en un temps minimum.
Une autre solution consiste à effectuer une sauvegarde complète hebdomadaire, associée à des sauvegardes incrémentales quotidiennes, ce qui permet à la fois d’obtenir le temps de sauvegarde le plus court pendant les jours de semaine et d’utiliser le moins d’espace de stockage.
Cependant, il y a moins de copies de données disponibles et le temps de restauration est le plus long, puisqu’une entreprise peut avoir besoin d’utiliser six jeux de supports pour récupérer les informations nécessaires. Si des données sont nécessaires à partir de données sauvegardées le mercredi, la sauvegarde complète du dimanche, ainsi que les jeux de supports incrémentaux du lundi, mardi et mercredi, sont requis. Cela peut augmenter considérablement les temps de restauration et exige que chaque jeu de médias fonctionne correctement ; la défaillance d’un jeu de sauvegarde peut avoir un impact sur l’ensemble de la restauration.
L’exécution d’une sauvegarde complète hebdomadaire, plus des sauvegardes différentielles quotidiennes, donne des résultats intermédiaires. En effet, la restauration nécessite plus de jeux de supports de sauvegarde qu’avec une politique quotidienne complète, mais moins qu’avec une politique quotidienne incrémentale. De même, le temps de restauration est inférieur à celui des sauvegardes incrémentales quotidiennes, et supérieur à celui des sauvegardes complètes quotidiennes. Afin de restaurer les données d’un jour particulier, deux jeux de supports au maximum sont nécessaires, ce qui diminue le temps nécessaire à la restauration et le risque de problèmes liés à un jeu de sauvegarde illisible.
Qu’est-ce qu’une sauvegarde en miroir ?
Une sauvegarde en miroir – ou mirroring – est comparable à une copie directement utilisable des données sources. Selon un responsable de l’éditeur de solutions de sauvegarde Nakivo, « Tous les différents fichiers sauvegardés sont stockés séparément, comme ils le sont dans la source. C’est pourquoi on appelle ce type de sauvegarde un miroir des données sources. »
L’un des avantages du mirroring est un temps de récupération des données extrêmement rapide. Il est également plus facile d’accéder aux différents fichiers sauvegardés.
L’un des principaux inconvénients, cependant, est la quantité d’espace de stockage nécessaire. Avec ce stockage supplémentaire, les entreprises doivent se méfier de l’augmentation des coûts et des besoins de maintenance. En outre, si un problème survient dans le jeu de données source, tel qu’une corruption ou une suppression, la sauvegarde miroir subit le même sort. Par conséquent, il est préférable de ne pas compter exclusivement sur le mirroring pour protéger ses données.
Le RAID 1 est un type de mirroring connu au niveau disque. Ce processus réplique les données sur deux disques ou plus. La mise en miroir des disques est une option intéressante pour les données nécessitant une haute disponibilité, en raison de son temps de récupération rapide. Il est également utile pour la reprise après sinistre en raison de sa capacité de basculement immédiat. La mise en miroir de disques nécessite au moins deux disques physiques. Si un disque dur tombe en panne, l’entreprise peut utiliser la copie miroir. Si la mise en miroir de disques offre une protection complète des données, elle nécessite en revanche une grande capacité de stockage.
Quelle stratégie pour quels cas d’usage ?
Pour les entreprises disposant de petits ensembles de données, l’exécution d’une sauvegarde complète quotidienne offre un niveau élevé de protection sans entraîner de coûts d’espace de stockage supplémentaires.
Les entreprises de plus grande taille ou celles dont le volume de données ou de serveurs est plus important considèrent que l’exécution d’une sauvegarde complète hebdomadaire, associée à des sauvegardes incrémentales ou différentielles quotidiennes, constitue la meilleure option. L’utilisation des sauvegardes différentielles offre un niveau plus élevé de protection des données avec un temps de restauration plus court dans la plupart des scénarios, moyennant une légère augmentation de la consommation du stockage.
Mais la stratégie ne s’arrête pas là. D’une manière générale, vous voudrez suivre la bonne pratique dite « 3-2-1 », c’est-à-dire trois copies des données sur deux supports différents, avec une copie hors site.
Dans cette perspective, vous pourrez recourir à la sauvegarde complète synthétique, qui constitue plus exactement une copie de la sauvegarde elle-même. Une sauvegarde complète synthétique reconstruit simplement une image de sauvegarde complète en utilisant toutes les sauvegardes incrémentales ou différentielles requises. Cette sauvegarde complète synthétique peut ensuite être stockée sur bande pour un stockage hors site, l’avantage étant un temps de restauration réduit puisque toutes les données sont regroupées.
Enfin, ne perdez pas de vue que le but de la sauvegarde est de permettre la restauration des données à un moment ultérieur. À ce titre, il est primordial de tester ses sauvegardes. Sans tests périodiques, il est impossible de garantir que l’objectif de protection des données est atteint.