You can more - Fotolia
Reprise instantanée dans le Cloud : ajoutez des données... c'est prêt !
Considérées comme l’une des « applications clés» du Cloud, la reprise après désastre (DR, Disaster Recovery) permettent à la plupart des entreprises de lancer des reprises rapides et peu coûteuses.
Sur une plateforme Cloud, la reprise après désastre (ou DR pour Disaster Recovery) est l’une des « Killer Application », une application clé. Elle offre des avantages particulièrement intéressants par rapport aux solutions de DR traditionnelles, qu'il s'agisse de scénarios classiques impliquant une infrastructure informatique dédiée installée sur un site secondaire ou d'un simple support amovible acheminé hors site.
La DR en Cloud offre simplicité, reprise rapide et faibles coûts, à la fois en termes d'infrastructure et de gestion induite. En bref, tirer parti du Cloud en l'utilisant comme une plateforme DR peut apporter plus de valeur que les méthodes classiques, et mettre une solution de reprise après désastre hautement efficace à la portée de nombreuses entreprises, quelle que soit leur taille.
Cet article définit la reprise après désastre (DR) en Cloud, examine les technologies qui ont fait de celle-ci (ou de la DR en tant que service) un sujet aussi important, et passe en revue les différents types de solutions DR en Cloud. Nous examinerons également certains détails sous-jacents de ces technologies que les entreprises doivent connaître avant de mettre en oeuvre un de ces services.
Définition de la DR
On appelle désastre tout événement qui engendre une immobilisation non planifiée d'un serveur ou d'une application, et suffisamment importante pour nécessiter en premier lieu un plan de reprise assurant la reprise planifiée de l’exploitation. En d'autres termes, un désastre peut être engendré par une défaillances matérielle isolée, la corruption de données sur un système de stockage ou l'arrêt accidentel d'un serveur par l'administrateur. Il n'est pas forcément provoqué par une tornade ou une inondation de trois mètres d'eau dans le datacenter. En fait, la majorité des immobilisations ne sont pas provoquées par un désastre à l'échelle du site entier.
La reprise, quant à elle, est la capacité à redémarrer les applications et à y reconnecter les utilisateurs ainsi que d'autres applications ; il ne s'agit pas seulement de restaurer les données. Auparavant, pour être efficace, la reprise nécessitait des infrastructures redondantes. Désormais, dans des environnements hautement virtualisés, un hôte disponible et capable d'exécuter une copie de la machine virtuelle (VM, Virtual Machine) critique suffit à constituer une solution de reprise après désastre (DR). Pour qu'elle soit fiable, il ne suffit pas que la reprise après désastre maintienne les VM dans un datacenter en Cloud, mais cette technologie permet de simplifier le processus de récupération et de réduire le coût des solutions DR héritées.
Définition de la DR Cloud
La DR en Cloud peut être définie de plusieurs manières, mais dans cet article nous considérerons qu'elle s'applique à une entreprise qui exécute des applications critiques dans son propre datacenter et copie les données correspondantes sous la forme d'images de VM vers le Cloud. La solution comprend généralement la possibilité de restaurer ces VM sur l'infrastructure hôte d’origine. La virtualisation des serveurs a considérablement simplifié le processus de reprise. Encapsuler l'intégralité d'une instance de serveur dans un ou deux fichiers rend le redémarrage d'une VM aussi simple que la restauration d'un fichier VMDK ou VHD. La solution DR minimale peut consister tout simplement à localiser une VM sauvegardée et à copier de nouveau les fichiers associés sur le serveur d'origine, même si elle ne répondra probablement pas aux exigences de toutes les entreprises.
Reprise sur place
Les VM peuvent également s'exécuter « sur place » en pointant vers un serveur de reprise à l'emplacement du stockage de sauvegarde. C'est d'ailleurs cette fonctionnalité qui a réussi à transformer la sauvegarde en Cloud en DR en Cloud, et qui a donné naissance au segment de marché de la DR en tant que service, ou DRaaS (voir la section « Qu'est-ce que la DRaaS ? »). Cependant, si elle promet des délais de reprise plus courts que le déplacement d'images de VM depuis le Cloud, elle ne va pas sans poser certains problèmes potentiels – essentiellement des questions de latence – que les utilisateurs doivent connaître (voir la section « Quand la sauvegarde en Cloud devient le traitement en Cloud ».
Fournisseur de DR en mode Cloud
Les deux approches de DR en Cloud les plus courantes sont les suivantes :
1. Un fournisseur de solutions de sauvegarde existant ajoute l'option qui permet de stocker et d'exécuter des images de VM dans son Cloud.
2. Un fournisseur de stockage/traitement/infrastructure en Cloud en tant que service existant ajoute un service de reprise après désastre.
Fournisseur de sauvegarde en Cloud. Les fonctions de sauvegarde et de reprise après désastre finissent par empiéter l'une sur l'autre. Et pour être exhaustive, une solution de protection des données a besoin des deux. Aussi est-il logique qu'un fournisseur de solutions de sauvegarde existant propose un stockage hors site qui, à l'instar de nombreux services, viendra s'ajouter à la DR en Cloud. Il existe une architecture courante qui consiste à utiliser une appliance sur site – un boîtier physique ou une VM – pour contrôler les sauvegardes locales et administrer les transferts de données vers le Cloud. Nombre de ces solutions proposent une conversion du physique au virtuel. Elles peuvent ainsi fournir une protection de données pour les serveurs purement matériels – ou « bare-metal » (non virtualisés) – qui doivent être intégrés au plan DR.
La majorité de ces fournisseurs de services offrent aussi la possibilité d'exécuter des VM côté Cloud, généralement dans leur propre Cloud. Toutefois, les processus de basculement et de reprise varient selon les fournisseurs, en fonction de la sophistication de leurs infrastructures en Cloud.
Nombre de ces produits sont adaptés aux petites et moyennes entreprises, avec un message vantant la reprise après désastre comme une solution « activable d'un clic ». Bien évidemment, les acheteurs doivent comprendre le fonctionnement de ces solutions et les risques potentiels associés. Il n'en demeure pas moins que cette approche présente des avantages.
La combinaison des fonctions de sauvegarde et DR simplifie la protection des données, et l'utilisation d'une appliance sur site implique qu'une copie locale des données saura, si nécessaire, accélérer la récupération des serveurs et la restauration des fichiers. Sachant que dans la plupart des cas, les événements d'immobilisation concernent un seul serveur ou une seule application et ne sont pas une panne générale à l'échelle du site, disposer d'une copie locale de récupération constitue une solution logique et efficace. Une appliance hybride simplifie les transferts de données avec le Cloud et absorbe la charge de gestion qu'induit le processus. Elle offre par ailleurs différentes options visant à améliorer la reprise, via une prise en charge de la synchronisation avec les serveurs hôtes.
Acronis nScaled, Axcient, Barracuda Networks, Datto, Quantum, Quorum et Unitrends comptent parmi les nombreux fournisseurs d’appliances de sauvegarde qui ont ajouté la DR en Cloud à leurs solutions de protection de données grâce à une appliance sur site. Certaines solutions de sauvegarde en Cloud sont dotées d'options de reprise qui ne comprennent aucune appliance sur site. Toutefois, la méthode hybride reste la mise en oeuvre la plus répandue et offre des avantages considérables.
Le fournisseur d’infrastructure en Cloud. L'autre approche courante de la DR en Cloud comprend des services qui gèrent généralement un hébergement ou un stockage en Cloud, traitent les activités d'infrastructure et sont dotés d'une option DR. D'autres fournisseurs proposent des solutions spécifiques aux plateformes, capables de s'intégrer avec les systèmes de stockage existants du client, afin d'optimiser les fonctions de réplication mises en oeuvre. Toutefois, la majorité d'entre eux offrent des services de traitement et de stockage en Cloud génériques qui prennent en charge l'exécution et le stockage de VM depuis le Cloud.
Leurs offres varient considérablement, de la solution clés en main complète, installée sur site et administrée par le fournisseur lui-même, à la simple mise à disposition de « blocs d'assemblage » dont le client a besoin essentiellement pour élaborer sa propre solution DR en Cloud. L'architecture spécifique utilisée dépendra du fournisseur de services et de l'environnement de l'entreprise cliente. Toutefois, la majorité des architectures comprennent un logiciel exécuté sur un serveur ou une VM dédié afin de gérer les transferts de données avec le Cloud.
Ces fournisseurs se concentrent essentiellement sur le haut de gamme du marché : ils mettent l'accent sur la nécessité d'aller au-delà d'un simple hôte en Cloud. Leur message avance que la qualité de l'infrastructure en Cloud ne doit pas être prise pour argent comptant, pas plus que les nécessaires services d'assistance et d'ingénierie que propose la majorité des fournisseurs. Nombre d'entre eux s'efforcent d'offrir à l'utilisateur une interaction transparente lorsqu'une application cesse de fonctionner et bascule vers le Cloud. Pour ce faire, ils s'attaquent aux problèmes d'avant-plan : reconnecter les utilisateurs et autres applications aux serveurs jusque là défaillants, et ne pas se contenter de tâches d'arrière-plan consistant à garantir l'exécution des VM enregistrées.
Certaines des entreprises qui proposent ces services officiaient sur le marché DR traditionnel, en proposant des solutions à infrastructure redondante. Elles adoptent désormais les avantages d'une reprise après désastre reposant sur des VM. Amazon (via ses partenaires), Databarracks, Egenera, IBM SoftLayer, Rackspace, Seagate’s EVault et Windstream sont quelques-uns des fournisseurs de ce groupe. VMware a également mis en place un service DR en Cloud. Il utilise pour cela son moteur de réplication sur hyperviseur qui lui permet d'acquérir des images de VM dans son propre Cloud.
Qu'est-ce que la DRaaS ?
La reprise après désastre en tant que service – DRaaS (Disaster Recovery as a Service) – est essentiellement une option DR en Cloud telle que nous l'avons définie plus haut. En fait, la majorité des fournisseurs qui souhaitent « ratisser large » utilisent ces deux termes de manière interchangeable. Le mode de facturation mensuelle de l'infrastructure peut varier ; selon, par exemple, que le fournisseur de solutions en Cloud se contente de louer les ressources ou qu'il fournisse une appliance sur site. Toutefois, sachant que la DR en Cloud ne constitue pas un type de solution en collocation dans lequel l'utilisateur fournit l'équipement, ces fournisseurs continuent de vendre la DR sous la forme d'une prestation de services.
Aspects importants de la DR en mode Cloud
Pensez aux désastres locaux. Si les ouragans et autres catastrophes naturelles locales font les gros titres, une entreprise sera probablement davantage confrontée à l'immobilisation d'une application pour des raisons bien plus banales, telles qu'une défaillance matérielle, un logiciel corrompu ou une erreur humaine. Aussi, une solution DR en Cloud comprenant un composant de stockage sur site et la possibilité d'offrir la récupération sur réseau local (LAN) des serveurs défaillants peut avoir un attrait considérable.
Quand la sauvegarde en Cloud devient le traitement en Cloud. Lorsqu'une entreprise doit exécuter une application dans le Cloud, sa relation au fournisseur de solutions en Cloud change. La prestation passe du statut de sauvegarde en Cloud à celui de traitement en Cloud. L'entreprise doit alors comprendre le type d'accords de niveau de service (SLA ; Service-Level Agreements) que propose le fournisseur, ainsi que la durée de prise en charge de l'exécution des applications. En cas de désastre à l'échelle régionale, l'infrastructure de traitement d'un fournisseur de solutions de sauvegarde en Cloud peut se trouver rapidement débordée par le nombre d'entreprises qui lanceront simultanément des processus de reprise. Pour être sûre de bénéficier du service attendu, l'entreprise a besoin de SLA de classe « traitement » et non de la seule garantie des meilleurs efforts.
Pensez à la reconnexion. Le redémarrage de serveurs défaillants dans le Cloud est la première étape du processus de reprise, mais ce n'est pas la seule. Les utilisateurs et autres serveurs d'applications doivent également se reconnecter aux VM incriminées. Si elles envisagent d'exécuter des applications de production dans le Cloud, parallèlement au rétablissement de leurs infrastructures principales, les entreprises à la recherche d'une DR en Cloud doivent tenir compte de détails tels que la gestion du réseau, les pare-feu, la surveillance des ports, la protection contre les intrusions ou encore la sécurité.
Stratégie de sortie. Enfin, les entreprises doivent se pencher sur le processus de sortie, à savoir le fonctionnement et la durée de la reprise. Plus longue est la durée d'exécution d'une application dans le Cloud, plus celle-ci mettra de temps à se resynchroniser avec le serveur principal via une liaison étendue (WAN). Pour les grands ensembles de données, la solution peut inclure l'expédition d'une appliance de stockage, mais ce procédé implique quand même une resynchronisation pour compenser le délai de livraison.
Ce qu'il faut retenir de la DR dans le Cloud
La reprise après désastre en Cloud constitue une excellente utilisation des technologies de Cloud et de virtualisation. La croissance de la virtualisation des serveurs, des services en Cloud et des solutions de sauvegarde hybrides font de la « vraie » DR une option viable pour les entreprises qui ne pourront jamais justifier une infrastructure DR classique. Toutefois, il convient de porter attention à certains détails d'une solution DR en Cloud, particulièrement aux aspects touchant à la récupération, notamment les SLA que propose le fournisseur, la manière dont l'environnement en Cloud gère la reconnexion des utilisateurs et des applications, ainsi que la stratégie de sortie à l'issue du désastre. Les entreprises doivent également réfléchir à une solution incluant une appliance sur site afin de prendre en charge les reprises à l'issue de désastres locaux ou restreints.
ERIC SLACK est analyste à Storage Switzerland, cabinet d’analystes du secteur informatique spécialisé dans le stockage et la virtualisation.