.shock - Fotolia
Sauvegarde des machines virtuelles : les 12 erreurs courantes
Malgré tous les efforts de l’administrateur, les sauvegardes de machines virtuelles peuvent échouer. Déterminez la cause de l’échec et modifiez la stratégie de sauvegarde des machines virtuelles pour éviter de nouvelles erreurs.
Les erreurs de sauvegarde des machines virtuelles peuvent se produire à tous les niveaux. Il appartient aux administrateurs de sauvegardes de repérer et de rectifier ces erreurs afin de réduire le risque de perte de données.
Les sauvegardes de machines virtuelles permettent aux entreprises de protéger les machines virtuelles avec la même fiabilité et la même sécurité que les sauvegardes traditionnelles de serveurs physiques. Cependant, la sauvegarde des machines virtuelles peut se dérouler de plusieurs façons.
Certains obstacles sont relativement simples, comme les goulets d’étranglement et le manque de ressources. Des problèmes plus complexes, tels que les difficultés liées au système d’exploitation invité et la corruption des disques virtuels, peuvent compliquer considérablement les efforts de protection des données.
Vous trouverez ci-dessous 12 erreurs courantes de sauvegarde de machines virtuelles auxquelles les administrateurs doivent faire attention. Il est essentiel de détecter ces erreurs et d’y remédier rapidement pour préserver la sécurité des données des machines virtuelles.
1/ Sauvegarder le système d’exploitation de la VM
La sauvegarde via le système d’exploitation invité est probablement l’erreur la plus courante en matière de sauvegarde de machines virtuelles. Il est préférable d’effectuer les sauvegardes au niveau de l’hôte de la VM plutôt que d’installer un agent de sauvegarde sur le système d’exploitation de la VM.
La raison pour laquelle il est préférable d’éviter autant que possible les sauvegardes du système d’exploitation invité est que ces sauvegardes sont inefficaces et difficiles à gérer à grande échelle. En outre, si plusieurs machines virtuelles exécutent simultanément des sauvegardes de systèmes d’exploitation invités, elles peuvent collectivement provoquer d’importants goulets d’étranglement au niveau des performances.
Une autre raison pour laquelle il est préférable d’effectuer des sauvegardes au niveau de l’hôte est que cela évite aux administrateurs d’avoir à gérer individuellement la sauvegarde de chaque machine virtuelle. De nouvelles machines virtuelles sont créées en permanence et il est facile d’oublier d’inclure une nouvelle machine virtuelle dans les sauvegardes. La sauvegarde au niveau de l’hôte évite complètement ce problème, car les machines virtuelles nouvellement créées sont sauvegardées automatiquement.
2/ Sauvegarder les images des disques durs virtuels
Les utilisateurs ne doivent jamais essayer de sauvegarder des fichiers images des disques durs virtuels directement sur l’équipement de stockage physique, en contournant la couche de virtualisation. Bien qu’il existe des moyens de sauvegarder en toute sécurité un disque dur virtuel en dehors de la couche de virtualisation, cette opération contourne les différentes mesures de protection intégrées au système d’exploitation. Une simple erreur peut corrompre l’ensemble du disque dur virtuel, en particulier si des instantanés ou des points de contrôle sont présents.
3/ Considérer les instantanés de VM comme une sauvegarde
Les instantanés, ou snapshots de VM – ou les points de contrôle, si l’on utilise l’appellation de Microsoft – préservent l’état d’une VM à partir du moment où l’instantané a été capturé. En outre, les utilisateurs peuvent créer plusieurs instantanés afin de disposer de plusieurs points de restauration. Bien que cela puisse être utile dans certaines situations, il ne faut jamais l’utiliser comme méthode principale de sauvegarde des machines virtuelles.
Une sauvegarde de machine virtuelle contient une copie complète du disque dur virtuel de la VM. À l’inverse, un instantané ne copie pas le contenu d’une machine virtuelle. C’est pourquoi les instantanés ne sont pas de véritables sauvegardes. Si un problème de stockage entraîne la perte d’une machine virtuelle, les instantanés seront probablement détruits. Même si les instantanés sont conservés, ils sont inutiles sans le disque dur virtuel d’origine. Les instantanés doivent être considérés comme une fonction pratique plutôt que comme une alternative de sauvegarde.
Les instantanés ont également tendance à diminuer les performances de lecture, en particulier s’il existe plusieurs instantanés pour une VM. Chaque fournisseur d’hyperviseur a sa propre façon de procéder, mais en règle générale, la création d’un instantané entraîne la création d’un nouveau disque dur virtuel. Le disque dur virtuel d’origine est traité en lecture seule.
Cela signifie que lors d’une opération de lecture, l’hyperviseur doit d’abord lire le disque virtuel snapshot, puis effectuer une seconde lecture sur le disque dur virtuel d’origine si le disque dur virtuel snapshot ne contient pas les données demandées. La création de plusieurs instantanés peut avoir pour conséquence que plusieurs disques durs virtuels doivent être lus à chaque fois qu’une opération de lecture se produit.
4/ Sauvegarder avec un logiciel qui n’est pas à jour
Les applications de sauvegarde sont comme toutes les autres applications : elles peuvent contenir des bogues ou des failles de sécurité. Elles doivent être maintenues à jour par l’application de correctifs. La particularité des applications de sauvegarde, cependant, est qu’un bogue peut compromettre des sauvegardes entières.
À titre d’exemple, il fut un temps où VMware Data Recovery présentait un problème qui entraînait la corruption de ses catalogues. Un catalogue est essentiellement un index des données qui ont été sauvegardées et est utilisé par la plupart des applications de sauvegarde. Le problème de corruption des catalogues a été corrigé par un correctif, mais certains administrateurs qui n’ont pas mis à jour leur logiciel en temps voulu ont dû reconstruire leurs catalogues de sauvegarde à partir de zéro.
5/ Ne pas attribuer les bonnes autorisations
Certaines applications de sauvegarde exigent que chaque serveur hôte protégé dispose d’un compte dédié au processus de sauvegarde. Ces types d’applications de sauvegarde peuvent être sujets à des erreurs de sauvegarde liées à des autorisations insuffisantes. Par exemple, une sauvegarde peut échouer si la politique de compte impose un changement de mot de passe, alors que l’application de sauvegarde elle-même n’est pas informée de ce changement. Dans ce cas, la sauvegarde échoue généralement avant que les données puissent être traitées, et les journaux indiquent une erreur de sécurité ou un échec de lecture.
S’il est important qu’une application de sauvegarde dispose des autorisations nécessaires, il est également important d’éviter d’attribuer des autorisations excessives à un compte de sauvegarde. Si une application sauvegarde des données dans un coffre-fort de sauvegarde, par exemple, il est préférable de supprimer les autorisations requises pour supprimer, chiffrer ou modifier le coffre-fort ou les données qu’il contient. Ainsi, si le compte de sauvegarde est compromis, un cybercriminel ne pourra pas l’utiliser pour détruire les sauvegardes existantes.
6/ Sauvegarder des systèmes d’exploitation non pris en charge
Les systèmes d’exploitation invités non pris en charge sont une autre cause potentielle d’échec des sauvegardes de machines virtuelles. Par exemple, une application de sauvegarde qui prend entièrement en charge la sauvegarde des machines virtuelles exécutant Windows Server 2022 peut considérer Windows Server 2025 comme un système d’exploitation non pris en charge, à moins que le logiciel de sauvegarde ne soit mis à jour pour prendre en compte la nouvelle version du système d’exploitation.
Les problèmes causés par un manque de prise en charge du système d’exploitation peuvent être évités, en vérifiant la prise en charge de la sauvegarde avant de mettre à niveau les machines virtuelles vers un nouveau système d’exploitation. Il est possible, cependant, que même si une application de sauvegarde ne reconnaît pas l’application fonctionnant sur une VM, elle puisse quand même créer une image de sauvegarde de cette VM.
7/ Surcharger le serveur hôte
Une autre erreur de sauvegarde des machines virtuelles consiste à surcharger le serveur hôte. Si une VM réside sur un disque qui est déjà limité en E/S, le disque peut ne pas être en mesure de fournir des performances suffisantes pour que la sauvegarde ne s’interrompe pas. La solution à ce problème consiste à éliminer le goulet d’étranglement du stockage.
Bien que la sauvegarde au niveau de la couche de virtualisation réduise l’utilisation des ressources sur les machines virtuelles lors des sauvegardes, l’utilisation des ressources reste élevée sur les hôtes et les périphériques de stockage lorsque les sauvegardes sont en cours d’exécution.
Les problèmes de pénurie de ressources sont souvent liés à la planification des sauvegardes. Les hôtes partagent généralement les mêmes volumes de données dans les environnements virtuels, et les goulets d’étranglement causés par un trop grand nombre de sauvegardes simultanées de VM sur un seul volume de données affecteront tous les hôtes sur lesquels s’exécutent des VM. De même, si trop de machines virtuelles sont sauvegardées en même temps sur le même hôte, cela créera des goulets d’étranglement pour toutes les machines virtuelles de cet hôte.
Une meilleure option consiste à utiliser la protection continue des données. Au départ, ces sauvegardes seront volumineuses et consommeront beaucoup de ressources. Cependant, une fois la sauvegarde initiale terminée, toutes les sauvegardes ultérieures seront généralement de petite taille. La raison en est que les petites sauvegardes s’exécutent en permanence – toutes les quelques secondes ou toutes les quelques minutes –, contrairement à une sauvegarde monolithique récurrente.
8/ Corrompre un disque dur virtuel
Tout comme un disque dur physique peut être corrompu, un disque dur virtuel peut l’être aussi. Si un disque dur virtuel est corrompu, une application de sauvegarde peut avoir des difficultés à sauvegarder la machine virtuelle correspondante.
En général, lorsque cela se produit, les logs de l’application de sauvegarde contiennent soit des erreurs de lecture, soit des erreurs d’intégrité des données. Ces erreurs peuvent indiquer qu’une corruption existe dans un disque dur virtuel.
9/ Créer un défaut de mise en pause
Les sauvegardes de machines virtuelles qui exécutent Windows Server en tant que système d’exploitation invité reposent généralement sur le service de cliché instantané des volumes (VSS, Volume Shadow Copy Service). Ce service effectue une opération de mise en pause qui permet aux applications exécutées sur la machine virtuelle d’être sauvegardées de manière cohérente avec leur fonctionnement, par opposition à une manière adaptée aux pannes brutales.
Le service de cliché instantané des volumes utilise un ensemble d’enregistreurs VSS pour faciliter la sauvegarde de diverses applications et composants du système d’exploitation, tels qu’Active Directory. Si l’un des enregistreurs VSS requis par le processus de sauvegarde devait échouer, la sauvegarde entière pourrait rater par rebond.
Si un administrateur soupçonne qu’une défaillance de VSS peut être à l’origine d’un échec de sauvegarde de machine virtuelle, il doit vérifier l’état des enregistreurs VSS au sein de la machine virtuelle. La commande vssadmin list writers, dans le système d’exploitation invité, affiche l’état de chaque enregistreur VSS.
10/ Utiliser des applications boguées
Les sauvegardes de machines virtuelles peuvent échouer parce qu’une application exécutée sur une machine virtuelle est boguée. Par exemple, Microsoft a publié un correctif Exchange Server appelé Cumulative Update 3 pour Exchange Server 2013. Entre autres choses, le correctif contenait un correctif pour un bogue qui provoquait de manière aléatoire l’échec des sauvegardes Exchange Server.
Si vous rencontrez des problèmes incohérents lors de la sauvegarde d’une machine virtuelle, vérifiez s’il existe des bogues connus avec les applications exécutées sur la machine virtuelle.
11/ Laisser des problèmes de configuration dans les logiciels de sécurité
Parfois, les logiciels de sécurité peuvent empêcher une sauvegarde de se terminer correctement. Par exemple, de nombreux cas documentés de logiciels anti-programme malveillant interférant avec certaines applications de sauvegarde ont été signalés. De même, certaines applications de sauvegarde peuvent nécessiter l’ajout d’exceptions sur le firewall.
12/ Utiliser des serveurs de sauvegarde en mal de ressources
Les serveurs de sauvegarde sont fondamentalement comme des pompes : les données sont lues à partir d’une source, passent dans le serveur de sauvegarde, puis sont envoyées du serveur de sauvegarde vers le périphérique cible. Le volume qu’un serveur de sauvegarde peut gérer est déterminé par les ressources qui lui sont attribuées, et plus il y a de ressources disponibles, plus il peut pomper rapidement les données.
La sauvegarde des machines virtuelles peut considérablement solliciter les ressources de stockage principales et de sauvegarde, ainsi que le réseau, mais les sauvegardes ne se limitent pas au simple déplacement des données du point A au point B. Les serveurs de sauvegarde gèrent des fonctions avancées, notamment la déduplication, la compression et la détermination des blocs de disque à sauvegarder. Pour qu’un serveur de sauvegarde atteigne un débit maximal, il doit disposer de ressources suffisantes afin d’éviter de créer un goulet d’étranglement dans une zone de ressources.
Les administrateurs de sauvegarde doivent surveiller l’utilisation des ressources du serveur de sauvegarde. En pratique, il est préférable qu’un serveur de sauvegarde dispose de trop de ressources que de trop peu. S’assurer qu’un serveur de sauvegarde dispose des ressources dont il a besoin peut permettre aux données de se déplacer à la vitesse maximale. Cela réduira le temps nécessaire à la sauvegarde des données.