Maintenance des sauvegardes : l’essentiel en 5 points
Pour être efficaces, les sauvegardes doivent protéger la totalité des données et détecter les changements de supports comme de logiciels. Nous vous livrons l’essentiel sur le sujet en 5 points.
Si les données sont vitales pour les entreprises, il va de soi que les sauvegardes doivent être renforcées. Reste à savoir si elles sont efficaces. En dix ans, les systèmes de sauvegarde ont gagné en simplicité : les technologies ont progressé, les systèmes de stockage sont plus performants et le cloud a fait son apparition. Aujourd’hui, les entreprises ne sont plus tributaires de supports physiques complexes et fragiles.
Mais, toute médaille ayant son revers, la prolifération des données rend la procédure plus complexe. Pour tenir les objectifs de délai de récupération (recovery time objective, RTO), les équipes doivent veiller au bon fonctionnement des sauvegardes. Et pour cela, elles doivent assurer la maintenance de l’infrastructure de sauvegarde.
Dans son étude 2022 sur la protection des données, Veeam relève des prévisions des dépenses de sauvegarde et de reprise d’activité après sinistre à la hausse (5,9 %). Cette augmentation est logique si l’on se réfère aux chiffres 2021 de la même enquête, qui indiquaient un taux d’échec de 37 % des tâches de sauvegarde et de 34 % des opérations de récupération.
1/ S'intéresser à la taille des fichiers
Premier point sur la liste : les entreprises doivent savoir où se trouvent leurs données et disposer des informations de volume et de format. Pour les données structurées stockées dans une base locale, la question est relativement simple.
Mais dès qu’il s’agit de données non structurées disséminées sur des systèmes NAS locaux et des clouds privés et publics, l’affaire se corse. Sans parler des données des applications SaaS (Software-as-a-Service), des machines virtuelles (VM) et containerisées qui peuvent compliquer la donne encore davantage.
Pour planifier sauvegarde et récupération, il faut s’intéresser de près à la taille des fichiers et des volumes, en local comme dans le cloud. Il s’agit de maîtriser les contraintes de temps sur des fenêtres de sauvegarde, de s’assurer que les sauvegardes sont réalisées, mais aussi de gérer la récupération. Vouloir faire des économies sur une sauvegarde dans le cloud ne présente aucun intérêt si le temps de récupération des fichiers est trop important.
Ce qui nous ramène aux objectifs de délai de récupération (RTO) et de point de récupération (recovery point objective, RPO). En l’absence de contrôle, les plans de récupération risquent de ne pas fonctionner comme prévu. Et sans maintenance des systèmes de sauvegarde, l’augmentation des volumes de données, la taille des VM ou le nombre de containers risquent de faire déraper le RTO.
2/ Toutes les données doivent être sauvegardées
Souvent, les procédures de sauvegarde échouent, non à cause d’un problème technique ou de la corruption des données, mais parce qu’il y manque des données essentielles, voire une application ou une VM entière.
« Pour élaborer une stratégie de sauvegarde efficace, vous devez connaître vos données, leur emplacement et la taille des jeux de données », explique Stephen Young, directeur chez AssureStor, un fournisseur de solution de sauvegarde pour le secteur informatique. « Pour y parvenir, donnez-vous le temps et les moyens de dresser une carte exhaustive des données. »
Il conseille également de faire le point sur l’emplacement des sauvegardes. En local, elles sont rapides, mais ne sont pas protégées contre les interruptions. Celles dans le cloud le sont, mais dépendent d’Internet.
Même la gestion automatique des sauvegardes et l’intelligence artificielle, désormais répandues, ne sont pas infaillibles. « Malheureusement, aucune solution ne sait détecter l’absence d’un composant d’infrastructure dans la sauvegarde », déplore Alex MacDonald, président de la SNIA pour la zone EMEA.
Parfois, des ressources installées ne sont pas intégrées à la politique de sauvegarde ; d’autres fois, c’est la sauvegarde qui n’est pas prévue pour une nouvelle ressource… Dans tous les cas, les nouveaux systèmes doivent systématiquement être inclus dans la politique de sauvegarde.
3/ Maintenance et optimisation des sauvegardes
En général, une solution de sauvegarde à jour est fiable, tout comme le stockage sur support SSD. En général… car les disques durs peuvent tomber en panne, les bandes supportent un nombre restreint d’opérations de réécriture et les SSD ont eux-mêmes une durée limitée.
Les services IT doivent donc suivre les cycles de vie du matériel et planifier les remplacements, mais aussi utiliser des solutions de surveillance et de reporting pour obtenir une vue actualisée du système de sauvegarde.
« Les technologies ont réellement gagné en fiabilité avec le passage de la bande au disque et l’introduction des plateformes de déduplication », affirme le président de la SNIA. « Les pannes n’ont pas été éradiquées, mais elles relèvent très rarement du stockage, désormais. »
Le reporting fournit toutes les informations sur la dernière sauvegarde réussie comme sur la moindre erreur, et permet de localiser précisément les zones à risque. Pour repérer les pannes, les entreprises peuvent s’aider du processus de gestion des incidents ITIL.
La SNIA relève également une tendance à adopter l’IA dans les applications de sauvegarde « pour alléger la tâche des administrateurs qui devaient pointer des milliers de tâches au quotidien ». La multiplication des copies des données importantes limite encore les risques.
La maintenance doit en outre être étendue aux environnements virtuels, VM et conteneurs inclus. Si ces services ont évolué depuis l’installation de la solution de sauvegarde, il est possible qu’ils en soient exclus.
« La mise en place de machines virtuelles est devenue tellement simple que l’on peut facilement passer à côté de la question de la sauvegarde », affirme Adrian Moir, ingénieur principal pour la société de gestion informatique Quest. « Une méthode de provisionnement qui détecte automatiquement les nouvelles sources et notifie les responsables de la sauvegarde constitue un véritable atout. »
Le volume des données sauvegardées doit également être surveillé. En local, bien sûr, lors de l’optimisation et de la mise à niveau des équipements, mais surtout dans le cloud. Extensible par nature, le cloud permet de stocker de très importants volumes de données. Ce qui fait grimper les coûts et rend inapplicable toute restauration.
Fermons le chapitre des sauvegardes physiques avec l’accès aux supports. Où sont stockées vos bandes, et combien de temps vous faut-il pour les récupérer ? Vous devez vous assurer de la sécurité des emplacements hors site comme central.
4/ Tester, encore et toujours
Un plan de sauvegarde et de récupération qui n’a pas été testé est inabouti ; les tests font partie intégrante du cycle de maintenance.
Il s’agit de s’assurer du bon fonctionnement des sauvegardes et, plus important encore, de la capacité de récupération. Y compris, par exemple, la restauration depuis, mais aussi vers le cloud, en faisant tourner non seulement le stockage, mais aussi les instances de calcul.
« Certaines entreprises exécutent des tests périodiques de restauration pour vérifier le fonctionnement des sauvegardes ; d’autres analysent la restauration de l’environnement de production et s’assurent que chaque instance ou ressource de production est restaurée au moins une fois par an », détaille Alex Macdonald, de la SNIA.
Les tests sont le meilleur moyen de détecter les erreurs de configuration, les pannes, les sauvegardes corrompues et les défaillances du plan de sauvegarde. Certes ils peuvent perturber les systèmes de production, entre autres, mais ils en valent la peine.
Bien que fiables la plupart du temps, les solutions de sauvegarde ne sont pas à l’abri d’erreurs provoquées par des problèmes de configuration, d’ouverture de fichiers pendant la procédure ou de présence d’un pare-feu entre un client et le serveur de sauvegarde, par exemple.
« Pour éviter les déconvenues, les entreprises doivent élaborer une politique de test des sauvegardes et de la récupération », martèle Adrian Moir, de Quest. « Si une solution de sauvegarde n’est pas configurée pour l’envoi automatique de notifications en cas de problème, les tests sont la seule solution. »
5/ Planifier les mises à niveau des solutions de sauvegarde
Dernier point, même s’il n’est pas directement lié à la maintenance, la planification des mises à niveau des solutions de sauvegarde.
Les systèmes de sauvegarde doivent bénéficier de maintenance et de mise à niveau. Les entreprises doivent déployer les mises à jour des fournisseurs, mais aussi les mises à jour et correctifs du système d’exploitation. Ce point est d’autant plus important, au vu de l’explosion des rançongiciels. Ces derniers traquent la moindre vulnérabilité, y compris dans les outils de sauvegarde.
De leur côté, les fournisseurs enrichissent leurs solutions, notamment en y ajoutant une protection contre les rançongiciels avec prise en charge de sauvegardes immuables, et en améliorant la prise en charge des VM et des conteneurs.
Les solutions de sauvegarde sont soumises comme les autres à une « dette technique » et perdent en efficacité avec le temps. Les anciens logiciels peuvent être plus lents, moins robustes ou moins riches en reporting, autant de critères qui s’ajoutent à la question des correctifs de sécurité.
Les équipes informatiques doivent veiller à maîtriser les cycles de mise à niveau fournisseur, pour planifier les mises à jour de leurs propres charges de travail et garder le temps nécessaire pour effectuer les tests.