Fotolia
PRA en cloud: quel hyperscaler choisir
Cet article fait le point sur les possibilités offertes par AWS, Azure et GCP en matière de Plan de Reprise d’Activité. Le choix se fera entre les solutions clés en main, celles qui ont plus de fonctions et celles qui sont plus modulaires.
Les hébergeurs de cloud public que l’on appelle les « hyperscalers » – Amazon Web Services (AWS), Google Cloud Platform (GCP) et Microsoft Azure – sont désormais des acteurs importants du stockage, de l’archivage et de la sauvegarde des données. Ils proposent également des options de plan de reprise d’activité après sinistre (PRA).
Avant l’avènement du cloud, un PRA impliquait soit d’acheter et mettre en production des infrastructures redondantes pour les installer dans un datacenter secondaire, soit de recourir aux services dédiés chez un sous-traitant.
Le cloud public offre le potentiel d’un service flexible et moins cher. Les spécialistes de la reprise d’activité après sinistre s’adressent aux grandes entreprises dans des secteurs où la tolérance aux pannes est faible. Mais une entreprise peut créer sa propre instance de PRA en cloud avec un simple navigateur web et une carte de crédit.
Et puisque la plupart des DSI préfèrent au moins un accompagnement et des services dédiés au PRA plutôt qu’une approche bricolée en interne, les fournisseurs de cloud publics ont adapté leurs offres IaaS pour proposer des solutions clés en main de PRA.
L’approche de chaque fournisseur diffère. Les équipes informatiques devront donc comprendre les offres au regard des contraintes de leur propre infrastructure, avant de choisir une solution de PRA en cloud public. Chaque plateforme a ses avantages et ses inconvénients.
Le meilleur pour une solution clés en main : Microsoft Azure
Les options de reprise d’activité après sinistre d’Azure sont probablement les plus abouties parmi les offres des trois principaux fournisseurs de cloud public.
Avec l’offre Site Recovery chez Azure, les utilisateurs peuvent répliquer des machines physiques et des machines virtuelles (VM) dans la région Azure de leur choix, simplement depuis leur console Azure. Ils peuvent aussi répliquer des VM Azure d’une région à l’autre.
Azure réplique les machines virtuelles VMware, Linux et, sans surprise, les serveurs physiques Windows. Les clients peuvent les convertir en des instances Azure pour qu’elles soient restaurées directement sur le cloud. Microsoft prend bien évidemment en charge la réplication des VM Azure Stack, puisque ce sont des instances Azure fonctionnant sur du matériel local loué aux clients de Microsoft.
Site Recovery permet par ailleurs de répliquer les VM sur le site d’origine ou sur un site secondaire. Enfin, Azure propose les délais de remise en route (RTO) et les restaurations de données récentes (RPO) les plus intéressants : avec l’hyperviseur Hyper-V, on restaure en 30 secondes des données qui datent de 30 secondes avant l’incident.
Les Recovery Services Vaults (des coffres pour les services à restaurer, en français) – un autre outil Azure – préservent des informations sur la configuration des machines virtuelles. Elles sont utilisées pour restaurer les contenus des VM d’origine dans des services Azure. Les coffres actionnent des VM Linux ou Windows, toujours pilotées à partir de la console principale d’Azure.
Le portefeuille de fonctions le plus complet : AWS
AWS propose plusieurs services de PRA ou, plus exactement, des services qui peuvent être adaptés à la reprise d’activité après sinistre. Officiellement, il n’y a qu’un service estampillé PRA : Cloud Endure.
Les composants susceptibles de servir à un PRA comprennent AWS Warm Standby, AWS Multi-Site et AWS Backup & Restore. Cloud Endure est pour sa part destiné aux entreprises qui ont besoin d’un service proche de la haute disponibilité, mais sans ses coûts élevés.
AWS Backup & Restore constitue le niveau le plus élémentaire de reprise d’activité après sinistre. Les utilisateurs indiquent quelles données ils sauvegardent sur S3 et les relisent depuis ce dépôt pour les restaurer ou les tester.
AWS Warm Standby, lui, crée un jumeau de l’environnement de production, déjà prêt à prendre la relève en cas d’incident. Toutefois, ses performances sont limitées. On parle plutôt d’un mode dégradé.
Les entreprises peuvent également utiliser le mode Pilot Light, encore plus dépouillé, où seuls les services de base sont capables de redémarrer tout de suite. Ceux-ci s’exécutent dans une région AWS distincte. Basculer sur un environnement Pilot Light est généralement insuffisant pour relancer l’activité : les entreprises doivent lui attribuer de nouvelles instances pour qu’il puisse prendre pleinement la relève. Toutefois, Pilot Light permet de relancer la production plus rapidement que Backup & Restore et coûte moins cher que Warm Standby.
AWS Multi-Site crée un clone de l’environnement de production pleinement opérationnel, en mode actif-actif, chaque environnement étant situé dans une région distincte. Cette option est censée éviter, ou quasiment éviter, tout temps d’arrêt. Revers de la médaille, l’entreprise doit payer pour deux environnements.
Cloud Endure est une offre récente. Ce service fonctionne comme AWS Multi-Site, à cette différence près qu’il synchronise aussi les contenus des serveurs physiques et des VM qui fonctionnent depuis le datacenter de l’entreprise. Toutefois, Cloud Endure n’est pas aussi synchrone qu’AWS Multi-Site. AWS argumente qu’il permet toutefois de relancer l’activité « en quelques minutes » et, ce, depuis une zone d’AWS dont le coût est moindre.
Selon AWS, dans cette zone, les capacités de calcul seraient 95 % moins chères. Les licences des systèmes d’exploitation et des logiciels seraient aussi moins chères. Seule la capacité de stockage utilisée aurait le même prix.
La meilleure approche modulaire : Google Cloud Platform
Contrairement à AWS et Azure, Google Cloud Patform (GCP) n’a pas de service de PRA dédié. En revanche, il fournit des conseils détaillés aux équipes informatiques qui souhaitent créer leur propre environnement PRA basé sur son cloud.
Google recommande d’utiliser son Deployment Manager pour automatiser le provisionnement des ressources, dont les VM. L’environnement Google sera ainsi activé si, par exemple, l’informatique sur site tombe en panne. Le service IaaS Compute Engine enregistre les configurations des machines virtuelles nécessaires à une reprise d’activité dans des « Instance Templates ». Les utilisateurs se servent ensuite de ces templates pour déployer les instances de calcul nécessaires. L’intérêt est que les entreprises peuvent relancer un minimum d’instances, juste ce qu’il faut pour fonctionner depuis le cloud dans un mode dégradé acceptable, à la manière d’AWS Warm Standby. Les entreprises qui doivent minimiser les temps d’arrêt choisiront d’exécuter les serveurs de secours en permanence, mais à un coût plus élevé.
Google recommande également d’utiliser ses disques persistants pour le stockage, car ils contiennent toujours leurs données même lorsque les instances de calcul associées disparaissent. Les équipes informatiques utiliseront les disques persistants pour stocker les sauvegardes incrémentielles ou les snapshots.
Une fonctionnalité de GCP qui n’est actuellement pas proposée par AWS ou Azure est la migration en continu des VM, utile aux entreprises qui ont une faible tolérance aux temps d’arrêt. Bien que GCP soit accessible depuis Internet, Google recommande d’utiliser dans ce cas des liens Direct Connect vers ses instances situées dans les datacenters en colocation les plus proches de l’entreprise.
Par ailleurs, une grande partie de l’architecture PRA recommandée par Google est réplicable ailleurs, dans d’autres clouds publics ou privés, voire dans le datacenter même des entreprises. Google prétend travailler avec des partenaires (OVHcloud en France, par exemple) qui assemblent ses technologies de base sous la forme de solutions prêtes à l’emploi. Ces technologies sont des briques Open source, donc il faudra que l’équipe informatique soit à l’aise avec l’Open source pour mettre au point un PRA qui réplique les serveurs physiques d’un site vers l’IaaS d’un partenaire de GCP.
Une option attrayante, mais attention aux bricolages
Le recours aux trois grands fournisseurs de cloud public est en somme une option attrayante en raison de leur réputation de fiabilité et de faible coût. Toutefois, il ne faut pas sous-estimer le travail nécessaire à la conception de l’infrastructure et à la réplication des systèmes sur site ou en cloud.
À l’heure actuelle, Azure dispose de l’offre de PRA la plus complète, tandis que Cloud Endure d’AWS est une alternative intéressante pour les entreprises qui cherchent à équilibrer le coût d’un PRA avec le risque posé par un temps d’arrêt.
Pour le reste, les services courants de PRA chez GCP et AWS sont encore très proches des solutions à assembler soi-même. Ils inciteront les DSI à passer plutôt par des partenaires experts sur ces questions.
Pour approfondir sur Stockage en Cloud
-
Search AI Lake : Elastic renomme son architecture « stateless » pour mieux surfer sur la genAI
-
NetApp étend son « stockage unifié » avec des baies virtuelles sur GCP
-
Choisir le cloud pour restaurer l’activité : les 5 points essentiels
-
Elastic Cloud : Elastic esquisse sa nouvelle architecture « stateless »