Construire une stratégie de réplication de données à distance
La réplication à distance synchrone et la réplication asynchrone offrent des options différentes de protection pour les données informatiques de l'entreprise. Il est important de comprendre les différences et les effets potentiels sur votre réseau pour assurer la sécurité des données d'entreprise.
Protéger une application, c’est assurer sa résilience, c'est-à-dire au final assurer sa disponibilité optimale. Mais ce qui est encore plus important, c'est la protection des données de l'entreprise. L'informatique peut toujours réinstaller ou faire tourner de nouvelles itérations d'applications. Cependant, il n'existe aucun substitut immédiat à la perte ou à l’inaccessibilité des données.
Une stratégie de réplication distante des données peut aider les professionnels de l’informatique à protéger les données vitales de l'entreprise, et il existe de nombreuses alternatives à envisager.
Comment fonctionne la réplication de données à distance ?
Le principe de la réplication à distance est simple : les équipes informatiques capturent une copie des données de production, puis sauvegardent cette copie dans un emplacement autre que le centre de données principal.
Les équipes informatiques peuvent répliquer les données d'un centre de données primaire vers un ou plusieurs centres de données secondaires, un fournisseur de services externalisés ou vers le cloud public. La destination finale dépendra du coût, de la disponibilité et du contrôle requis. Réfléchissez également à ce qui pilotera le processus de réplication ; la réplication peut se produire au niveau de l'hôte, au niveau de la baie de stockage ou du réseau.
Pour créer une stratégie de réplication des données, les responsables informatiques doivent également décider s'ils copient les données de manière synchrone ou asynchrone. La réplication synchrone des données garantit que les données primaires et secondaires sont toutes écrites simultanément avec succès, éliminant ainsi le risque de perte de données entre les sites primaires et secondaires. La réplication synchrone offre le plus petit objectif de point de récupération (RPO) et de temps de récupération (RTO), mais les demandes de bande passante réseau peuvent être importantes et les contraintes de latence sont importantes ; une latence trop élevée étant un obstacle à la réplication synchrone et pouvant nuire à la performance du stockage.
Si la réplication à distance doit se faire sur de grandes distances ou si la bande passante disponible est insuffisante pour la prendre en charge, l’alternative est d’utiliser la réplication asynchrone. La réplication asynchrone découple essentiellement les écritures primaires et secondaires, ce qui permet d'achever ultérieurement les écritures sur le ou les sites secondaires. Le corollaire est qu’en cas de défaillance du site primaire, toutes les données n’auront pas forcément été transmises au site secondaire. Le RPO n’est donc pas nul.
Comment le réseau affecte-t-il une stratégie de réplication de données à distance ?
Si la réplication locale dépend d'un réseau local, la réplication à distance repose sur un réseau étendu (WAN). Le WAN peut être un réseau dédié, mais il s'agit généralement d'un réseau IP mutualisé (cas d’un réseau MPLS d’opérateur) ou d’un réseau partagé, comme Internet. Cela signifie que tout problème affectant la disponibilité et les performances du réseau affectera également la réplication et la restauration à distance.
Les pannes de réseau peuvent empêcher les processus de réplication ou de reprise. Les réseaux dédiés, ou l'utilisation de plusieurs fournisseurs de télécommunications, peuvent fournir une fiabilité supérieure.
Il doit également y avoir une largeur de bande suffisante pour acheminer la copie de données requise du centre de données primaire à l'emplacement secondaire dans un délai raisonnable. Par exemple, déplacer 10 Go de données répliquées sur une connexion 1 Gbit/s prend idéalement moins de deux minutes, mais la réplication a rarement le contrôle exclusif du réseau. Chaque application métier doit encore fonctionner avec peu de perte de performance pendant le processus de réplication à distance, de sorte que le temps réel de copie des données peut être beaucoup plus long.
La bande passante n'est pas si critique pour la réplication asynchrone, mais elle peut sérieusement affecter les performances de la réplication distante synchrone. L’agrégation de liens WAN dédiés ou partagés peut alors permettre de fournir une bande passante adéquate. Les administrateurs peuvent également utiliser des technologies d’optimisation, telles que la déduplication des données, pour réduire les besoins en bande passante.
Considérations relatives à la sécurité des données
Bien que les administrateurs n'aient pas besoin de chiffrer le stockage local des données, ils peuvent avoir besoin de chiffrer les données copiées pour la réplication à distance avant qu'elles ne soient envoyées sur le réseau étendu. Ces données devraient rester cryptées au repos lorsqu'elles sont stockées dans un endroit éloigné. Un chiffrement efficace peut être un élément essentiel de la gouvernance d'entreprise et de la conformité réglementaire.
Quelles sont les caractéristiques des outils de réplication de données à distance ?
Il existe un certain nombre d'outils qui peuvent aider à mettre en place une stratégie de réplication de données à distance, mais les professionnels de l’IT doivent bien évaluer leurs besoins avant d'en choisir un.
Tout d'abord, évaluez l'impact de la plate-forme de réplication à distance sur votre environnement de production et envisagez un outil de réplication qui minimise toute charge d'E/S supplémentaire. Par exemple, un outil de réplication basé sur l'hôte tel que Quest vRanger ou Double-Take DR by Vision Solutions devra s'exécuter sur un serveur, ce qui exigera à la fois puissance de calcul et E/S disque pour effectuer les tâches de réplication. En comparaison, une appliance de réplication à distance peut généralement copier les données écrites en ligne dans le SAN, ce qui élimine essentiellement tout impact sur les performances des serveurs et du stockage.
Lorsque la réplication distante synchrone reflète toujours les écritures d'une source de stockage vers une cible de stockage, la réplication distante asynchrone peut subir un délai entre les écritures source et cible. Cela signifie que la réplication asynchrone exige une technologie qui peut s'adapter aux RPO et RTO. Les technologies de réplication continue telles que l'outil de réplication pour environnements virtualisés de Zerto ou Xen Orchestra sont deux options potentielles.
Recherchez les capacités de journalisation qui permettent aux administrateurs de récupérer des points spécifiques dans le temps. Ce type de fonctionnalité peut offrir plus de flexibilité et de granularité que la simple conservation et la récupération des dernières répliques de données.
Misez sur une intégration entre la plate-forme de réplication à distance et les outils de reprise après sinistre ou de gestion des systèmes de l'entreprise. Par exemple, l'exploitation de la plate-forme de réplication à distance à l'aide d'outils tels que VMware vCenter Site Recovery Manager ou Microsoft System Center réduit le nombre d'outils dans le centre de données et simplifie la gestion.
Comment une stratégie de réplication de données à distance se compare-t-elle à d'autres options de sauvegarde ?
La réplication à distance reste une technologie importante de protection des données, mais il existe d'autres solutions que les organisations devraient envisager.
Tout d'abord, il y a plus d'options disponibles pour le stockage cible, en particulier dans le cloud. Les entreprises peuvent copier des données vers des instances de stockage dans des nuages publics tels que Amazon Web Services, Microsoft Azure et Google Cloud Platform. Les utilisateurs ne paient que ce dont ils ont besoin, mais il y a des frais lorsque les données entrent et sortent des plates-formes des fournisseurs de cloud computing, ce qui peut rendre coûteuses de vastes opérations de récupération.
Une autre option est une cible de réplication locale, telle que la Black Box durcie d'Axxana, qui est construite pour résister à des défis physiques, comme un incendie. Toutefois, ces options de réplication sur site ne conviennent pas à tous les scénarios de catastrophe, et les entreprises peuvent avoir besoin de les utiliser conjointement avec des options de réplication à distance asynchrone.
Enfin, les administrateurs peuvent utiliser les snapshots de la machine virtuelle pour capturer l'état d'une machine virtuelle en mémoire serveur à tout moment. Les administrateurs peuvent généralement réaliser des snapshots en quelques secondes sans qu'il soit nécessaire d'arrêter la plupart des applications, et ils ont relativement peu de charge d'E/S. Les administrateurs peuvent ensuite répliquer l'instantané à distance si nécessaire.