Strateact

Sans haut débit, l’agglomération de Roissy sauvegarde ses VM avec Zerto

Aucun logiciel de sauvegarde ne voulant fonctionner sur un réseau dont la latence est supérieure à 5ms, la Communauté d’agglomération a choisi de protéger ses sites en répliquant leurs VM vers ses deux datacenters.

Parvenir à sauvegarder en continu les sites critiques, même lorsque ceux-ci ne sont pas reliés en haut débit au datacenter central. Telle a été la problématique qu’a réussi à résoudre la Communauté d’agglomération de Roissy Pays de France en utilisant le logiciel de sauvegarde Zerto.

« Notre communauté d’agglomération réunit 42 communes qui vont de 60 à 60.000 habitants. Nous gérons en tout sur notre territoire 1600 postes et 200 serveurs virtuels qui exécutent essentiellement des applications métier (état civil, élections, gestion des bâtiments publics, etc.) avec des données plus ou moins critiques. Il est donc essentiel de pouvoir en restaurer des copies les plus récentes en cas d’incident. Sauf que, sans la fibre entre les mairies et nos deux datacenters centraux (l’un pour le nord du territoire et l’autre pour le sud, ndr), nos solutions étaient incapables de générer des sauvegardes aussi souvent que nécessaire », témoigne Christophe Da Apresentação, DSI de Communauté d'agglomération de Roissy Pays de France.

Une seule sauvegarde par jour : une protection insuffisante contre les ransomwares

La Communauté de communes a en effet beau être située à 40km de Paris, elle n’est couverte par la fibre que sur 7% de son territoire. « Pour pallier à la misère du bas débit en ADSL, nous avons installé un réseau en boucle locale radio (BLR) qui fonctionne un peu comme un Wifi territorial, à base d’antennes sur nos bâtiments. Selon les générations d’antennes, nous parvenons à atteindre jusqu’à 300 Mbits/s de débit. Cependant, la latence d’environ 10 à 15 millisecondes est trop importante pour faire transiter rapidement tout un flux de sauvegardes, limitant donc l’opération à une fois par jour », explique le DSI.

Un mercredi de l’été dernier, à 18h30, c’est le drame : une cyber-attaque à base de Ransomware impacte les équipements informatiques de plusieurs mairies. Or, le logiciel de sauvegarde alors en place est configuré pour effectuer les sauvegardes quotidiennes à 19H30. La communauté d’agglomération n’a plus que la possibilité de restaurer des informations datant de la veille, en faisant le deuil de toutes les précieuses écritures comptables effectuées dans la journée. « Il s’agissait d’une attaque dite zero-day : tous nos antivirus, tous nos pare-feu, pourtant correctement mis à jour, ont été incapables de l’arrêter », se souvient Christophe Da Apresentação.

Le DSI envisage un temps d’équiper chaque mairie de postes virtuels, pour restreindre le chemin des sauvegardes au seul réseau interne des deux datacenters de la communauté d’agglomérations. « Hélas, cela ne faisait que déplacer le problème, puisque la latence impactait dès lors le travail des utilisateurs sur leurs postes ».

La réplication plutôt que la sauvegarde pour supporter plus de 5ms de latence

Le DSI de la communauté d’agglomération se met alors en quête d’une solution de sauvegarde capable de fonctionner en continue malgré la latence importante.

« J’ai rencontré l’équipe de Zerto au hasard d’un meeting informatique. Nous avons évalué leur solution de réplication au même titre que d’autres de sauvegarde. Lors de notre PoC, Zerto a été le seul à pouvoir maintenir un flux constant de sauvegardes entre un site relié en BLR et l’un de nos deux datacenters ; les autres réclamaient un maximum de 5 millisecondes pour fonctionner. Qui plus est, Zerto avait le mérite d’être extrêmement simple à installer. Au point qu’au bout d’une heure à peine deux machines commençaient déjà à se répliquer. Nous avons donc acheté en septembre des licences pour protéger nos 15 serveurs les plus critiques », raconte-t-il.

Zerto prend la forme d’un plug-in à installer dans VMware vCenter, lequel commande aux hyperviseurs ESX qui exécutent les serveurs virtuels en mairie d’envoyer une copie de leurs VM vers l’un des deux datacenters centraux. Zerto étant un logiciel de réplication, le datacenter doit disposer d’un cluster VMware dédié au duplicata des VM. L’éditeur de Zerto recommande d’équiper ce cluster d’un stockage 20% plus important que celui dédié sur site aux 15 VM à protéger.

La réplication a la même finalité que la sauvegarde, à savoir créer une copie de secours que l’on peut restaurer en cas d’incident. La différence est qu’une réplication peut envoyer des copies des nouvelles données au fil de l’eau, alors qu’une sauvegarde les insère dans un format d’archive dont la cohérence doit être vérifiée en permanence.

La seule limite est le coût du stockage

« Nous avons fait le choix de dimensionner ce cluster pour 35 VM, avec encore 40% de stockage en plus. En effet, nous comptons passer bientôt commande pour protéger 20 VM supplémentaires et peut-être encore plus demain », dit Christophe Da Apresentação qui précise que, concernant l’aspect financier, le prix des licences Zerto importe peu au regard du coût du stockage nécessaire sur le site de sauvegarde. « C’est ce coût, en définitif, qui limitera le nombre de VM que nous dupliquerons ».

La duplication s’effectuant en continue, Zerto montre dans son outil d’administration une jauge qui affiche en permanence le % de données en cours dupliquées pour chacun des serveurs, la jauge diminuant en dessous des 100% à chaque fois qu’un serveur virtuel est modifié en mairie, pour remonter rapidement ensuite. « L’interface est très plaisante. La jauge nous permet même, de manière inattendue, de mesurer la bande passante de notre réseau BLR », remarque Christophe Da Apresentação.

À date, la Communauté d’agglomération de Roissy Pays de France n’a observé aucun dysfonctionnement lié à Zerto. « Des utilisateurs ont noté des ralentissements sur leur réseau dès lors que la duplication était déployée sur leur site. Après vérification, nous nous sommes rendus compte que la faute n’en incombait pas à Zerto mais à leurs antennes BLR d’ancienne génération à 14 Mbits/s. Il a été simple de résoudre le problème en remplaçant ces antennes par des modèles plus performants, à 300 Mbits/s ».

Christophe Da Apresentação se dit désormais serein : même si une cyber-attaque déjouant ses pare-feu et ses antivirus devait survenir, il sait désormais qu’il pourra récupérer les données telles qu’elles étaient juste avant d’avoir été effacées.

Pour approfondir sur PRA, Reprise après incident