À la pointe de la sauvegarde de données
Les logiciels de sauvegarde modernes font plus que de créer des copies de secours des données. Ces plates-formes affichent des ambitions en matière de disponibilité en étendant leurs fonctions à la reprise après sinistre ou à l’archivage.
Le Backup ne se contente plus de copier des données depuis les systèmes de stockage de production vers le stockage de protection. Aujourd’hui, les solutions de sauvegarde les plus pointues visent aussi à répondre aux demandes des datacenters qui ont de plus en plus des obligations de production en continu.
Pour ces entreprises, les fenêtres de sauvegarde et de restauration font partie du passé. Les données doivent être protégées en temps réel et les restaurations doivent être quasiment instantanées.
De nombreuses organisations doivent, en sus, conserver une plus grande quantité de données, et ce pour des périodes plus longues – dans certains cas pour toujours.
Il y a encore quelques années, répondre à ces besoins semblait impossible. Mais aujourd’hui, des technologies émergent pour faire face à ces défis.
Sauvegardes en temps réel
« La question n’est pas la sauvegarde, mais la restauration » est un argument régulièrement mis en avant par les responsables marketing des éditeurs. Mais la réalité est que si une copie de sauvegarde valide n’existe pas, aucune restauration n’est possible.
Dans le datacenter moderne, les backups doivent se dérouler plus régulièrement, de telle sorte que si un sinistre intervient, seule une petite quantité de données doit être restaurée. Dans la pratique, les fournisseurs atteignent cet objectif de multiples façons.
Protection au niveau bloc
Le mode de fonctionnement des logiciels de backup historique est de générer une copie de sauvegarde des données selon le calendrier défini par l’administrateur.
Avec ces logiciels, même une sauvegarde incrémentale copie une quantité de données supérieure à celle réellement modifiée. Cet écart est largement lié au fait que la granularité de sauvegarde est historiquement faible. Mais les logiciels de sauvegarde moderne ont la capacité de gérer les données à un niveau bien plus granulaire et opèrent typiquement au niveau du bloc. Cela signifie que lorsqu’une base de données est protégée, seuls les blocs modifiés sont transférés.
Le processus de sauvegarde dit « en mode bloc incrémental » réduit de façon significative la quantité de données transférées vers le stockage de protection. Ce qui se traduit par des sauvegardes plus rapides.
L’ironie est que la sauvegarde au niveau bloc est disponible depuis de nombreuses années, mais qu’elle n’est mise en œuvre avec confiance que depuis peu. L’adoption est liée en large partie au fait que des éditeurs comme Oracle ou VMware ont fourni aux éditeurs de sauvegarde des API riches permettant la sauvegarde incrémentale en mode bloc pour les applications ou les VM.
Des fenêtres de protection inférieures à 15 minutes
Avec ces technologies, certaines entreprises effectuent des sauvegardes à des intervalles pouvant atteindre 15 minutes, là où précédemment, elles réalisaient un backup par jour.
Les fournisseurs de solutions de protection de données ne s’arrêtent toutefois pas à cette limite et ont de plus en plus tendance à intégrer snapshots et réplications à leurs applications (comme le font par exemple ArcServe, Commvault, EMC, HPE, IBM ou Veeam).
La réplication en continu permet de capturer les données en quasi-temps réel sur les systèmes de stockage primaires avant de les basculer vers le stockage de protection. Les logiciels de sauvegarde modernes continuent ainsi à faire du backup à l’ancienne mais savent aussi sauvegarder les données répliquées automatiquement.
Cela signifie qu’un processus unique, piloté par le logiciel de sauvegarde, est désormais capable de fournir des capacités de restauration quasi-instantanées.
L’intégration des snapshot
Les applications de sauvegarde moderne interopèrent ainsi de plus en plus étroitement avec le stockage primaire et ses capacités de protection.
Certains peuvent planifier et déclencher des snapshots directement depuis la console de l’application de sauvegarde, ce qui permet à une unique application de devenir le point central de coordination des activités de protection de données.
D’autres intègrent aussi ces snapshots à leur catalogue, ce qui permet par exemple, lorsque l’on cherche à restaurer un fichier, d’utiliser la copie qui prendra le moins de temps à restaurer.
Une application de sauvegarde peut déclencher un snapshot, le répliquer vers un système de stockage secondaire puis vers un site de reprise après sinistre. Le résultat est une protection renforcée et la possibilité de récupérer rapidement en cas de sinistre depuis une console unique.
Éliminer les serveurs de sauvegarde
De plus en plus, l’intégration avec le stockage primaire permet de se passer de serveur de backup.
Avec des technologies comme DDBoost chez EMC ou HPE Catalyst, il est possible de sauvegarder les données d’applications comme Oracle ou MS-SQL directement vers le stockage de protection (respectivement Data Domain ou StoreOnce). Et dans certains cas, on peut même sauvegarder des données directement depuis le système de stockage primaire vers le stockage de protection via un chemin direct (d’un VMAX à une baie Data Domain avec EMC Protectpoint ou d’une baie 3Par à un StoreOnce avec HPE Express Protect).
Dans ce modèle, le pilotage de la sauvegarde est souvent délégué aux gestionnaires de l’application, ceux qui sont les mieux placés pour connaître les besoins de protection de leurs applications. Cela permet aussi aux équipes gérant la sauvegarde de se concentrer sur des tâches de supervision ou sur d’autres tâches plus importantes.
Il est à noter que le transfert direct de données depuis le stockage primaire via un chemin dédié élimine non seulement le serveur de backup, mais aussi le réseau de backup, puisque les données transitent directement du stockage vers l’appliance de sauvegarde. On peut ainsi en théorie doper les performances de sauvegarde.
Reprendre depuis le stockage de protection
Si la réplication vers un stockage secondaire permet en général de tenir des objectifs de RPO et de RTO serrés, la mise en œuvre d’une architecture double est aussi coûteuse. Une alternative, de plus en plus populaire est de reprendre la production directement depuis le stockage de protection.
Les logiciels qui fournissent cette capacité s’appuient en général sur des sauvegardes incrémentales en mode bloc et sur les capacités des hyperviseurs. En cas d’incident sur le stockage primaire, il suffit de pointer l’hyperviseur vers la copie située sur le stockage de protection et d’utiliser ce dernier comme un stockage secondaire temporaire.
Typiquement la réplication incrémentale en mode bloc n’est pas aussi fine que la réplication et les temps de reprise un peu plus long. Au lieu de reprendre une production en moins de 15 minutes, on vise un délai de reprise inférieur à l’heure, ce qui est adéquat pour la plupart des environnements.
On peut ainsi réaliser de réelles économies en acceptant toutefois que les performances de l’application soient dégradées en attendant le retour à la normale. Le stockage de protection n’est en effet pas conçu pour offrir les mêmes performances qu’une baie de stockage primaire ou secondaire.
La protection des postes de travail
La protection des postes de travail a aussi évolué au cours des dernières années. De nombreux fournisseurs de services peuvent sauvegarder les données de multiples terminaux allant du PC de bureau au téléphone mobile en passant par les PC portables ou les tablettes.
Avec les solutions et services de backup modernes, un utilisateur peut retrouver sur sa tablette un fichier effacé sur son PC ou vice-versa.
C’est ce que proposent des solutions on-premise comme Druva ou Simpana ou des services en ligne comme Mozy, Cloud 42 ou Backblaze.
Fonctions d’archivage intégrées
Les applications de backup sont aussi en train d’évoluer pour fournir des fonctions autrefois réservées aux applications de backup traditionnelles. Certaines applications de sauvegarde modernes incluent désormais des bases de données évoluées permettant de gérer des catalogues sur plusieurs années et de fournir des services de recherche rapide.
Ces fonctions sont bien adaptées aux besoins d’archivage des PME, pour peu que ces dernières ne soient pas soumises à des contraintes réglementaires fortes en matière de verrouillage de contenus (WORM).
Des stockages de protection à la pointe des technologies
Au cours des dernières années, le stockage de protection n’a cessé d’évoluer pour répondre aux besoins de restauration « en place » des applications de backup. L’idée est de pouvoir satisfaire à la fois les besoins d’ingestion à haut débit des données de backup, mais aussi de délivrer les performances en IOPS nécessaires pour servir de stockage temporaire de production en cas de sinistre.
De nouveaux acteurs émergents. Rubrik ou Cohesity évoquent déjà l’utilisation de SSD et de mécanisme de stockage hybride dans le stockage de protection. D’autres comme EMC ou Quantum ont fait évoluer leur offre pour gérer des mécanismes d’archivage.
De plus en plus, on voit le stockage de protection migrer vers des mécanismes de stockage distribués à même de répondre à la fois à l’évolution des besoins en matière de performance et de capacité.
Rubrik, Cohesity et Exablock mettent déjà en avant ces capacités distribuées, tandis qu’HPE permet de fédérer plusieurs baies StoreOnce. Quantum, lui, s’appuie sur son file System distribué StorNext, pour ses baies de sauvegarde Dxi, ce qui ouvre la porte à l’émergence de futurs systèmes Dxi distribués.
Les systèmes Data Domain d’EMC, qui contrôlent environ deux tiers du marché, n’ont pour l’instant pas de capacités scale-out. Mais la logique voudrait que dans le futur ces systèmes évoluent vers un tel mécanisme.
Intégration avec le cloud
Une autre tendance est l’évolution vers le backup en cloud. La bande passante internet devient plus abordable et dans les grands centres urbains, il devient facile de disposer de débits de l’ordre de quelques centaines de mégabit/s à 1 Gigabit/s.
Les PME peuvent ainsi, dans certains cas, faire l’économie d’une appliance de sauvegarde locale et s’appuyer sur le stockage en cloud.
Certains fournisseurs proposent une option de sauvegarde directe vers le cloud (c’est le cas de Veeam, d’ArcServe, d’IBM, etc.). D’autres permettent depuis une appliance de sauvegarde d’externaliser des données vers le cloud afin de limiter les coûts (EMC DataDomain ou Quantum Dxi, par exemple).
Avec cette dernière approche, un sous-ensemble des données - les plus récentes - est conservé en local. Les données les plus anciennes ou les moins critiques sont externalisées vers le cloud. Cela permet à la fois de récupérer des données rapidement depuis les copies locales tout en bénéficiant des économies liées à l’externalisation des copies les plus anciennes vers le Cloud.
De façon générale, la plupart des fournisseurs s’accordent à recommander aux entreprises de conserver une large partie de leurs sauvegardes les plus récentes en local, sous peine de souffrir de temps de reprise accrus s’il faut restaurer les données depuis le cloud.
Il est à noter que les données envoyées vers le cloud peuvent servir de base à un service de DR en Cloud. Cette capacité permet à une organisation d’éliminer le principal problème lié à la sauvegarde hébergée : celle du temps de restauration des données. L’idée est alors de reprendre la production directement dans le cloud en s’appuyant sur les données déjà sauvegardées dans le nuage.
C’est le type de service que proposent aujourd’hui des acteurs comme Veeam ou ArcServe.