Magazine Storage 37 : Le retour en grâce des sauvegardes
Longtemps considérées comme une corvée vaguement nécessaire et très coûteuse, les sauvegardes catalysent aujourd’hui les investissements des entreprises, car elles constituent la bouée de secours la plus fiable face aux ransomwares. Ce numéro de Storage leur est consacré.
L’explosion des attaques par ransomwares a placé la sauvegarde des données en première ligne des stratégies de cyberdéfense. Faute de pouvoir récupérer des données infectées et parce qu’il ne faut jamais céder au chantage d’une rançon pour obtenir l’antidote des pirates, les entreprises voient dans les sauvegardes le moyen le plus rapide de restaurer leurs systèmes avant que leurs activités économiques ne s’effondrent.
Pour autant, décupler ses efforts de sauvegardes reste une théorie. Le succès constant des cyberattaques prouve que de trop nombreuses entreprises ont compris le principe, mais n’ont toujours pas pris le temps de passer à la pratique. Pire, dans certains cas, des entreprises n’essuient aucune cyberattaque, mais doivent tout de même suspendre leurs activités économiques, car elles n’ont pas fait les sauvegardes nécessaires pour se sortir d’une simple panne informatique.
C’est justement ce qui est arrivé récemment à Toyota. Une mésaventure que nous racontons dans ce nouveau numéro de Storage. Suite à une erreur humaine, ses serveurs n’ont plus pu accéder à leurs données et, faute de PCA (Plan de continuité d’activité), Toyota a été contraint de fermer pendant une journée quatorze usines, soit un tiers de sa production mondiale.
L’enjeu de démultiplier les sauvegardes sans démultiplier leur coût
L’un des principaux freins à la mise en place de solutions de sauvegardes efficaces et le coût de leur stockage. Pour que les données restaurées soient pertinentes, pour qu’elles ne soient ni trop obsolètes ni tellement récentes qu’elles ont été enregistrées après leur corruption, il faut multiplier les sauvegardes sur des intervalles de plus en plus courts. Problème, la place qu’elles occupent est multipliée d’autant. Or, même à 20 centimes le Go, des NAS à base de SSD QLC (les moins chers) peuvent coûter plusieurs centaines de milliers d’euros pour stocker les quelques Po nécessaires.
Heureusement, certains constructeurs maintiennent des solutions très peu chères à base de disques durs mécaniques. C’est par exemple le cas de Seagate qui propose une baie de 3,18 Po bruts pour moins de 60 000 €. Dans ce numéro de Storage nous décrivons ainsi sa nouvelle baie Exos Corvault, qui occupe seulement 4U d’espace dans une armoire rack, mais offre 106 disques durs de 30 To. Il s’agit des disques durs HAMR, que Seagate promet depuis des années. Ils sont équipés d’un laser sur leur tête d’écriture qui permet de stocker les informations de manière plus dense, soit 30 To au lieu de 22 To sur les disques durs actuels qui disposent pourtant des mêmes plateaux.
Il faut aussi pouvoir administrer de telles capacités. Principalement, il s’agit de pouvoir retrouver rapidement la copie de données (document, e-mail, etc.) qui ont été supprimées par erreur en production, sans devoir restaurer l’intégralité d’un serveur ou d’un PC. Et, toujours, sans que cela coûte cher. À cette fin, nous évoquons dans ce numéro de Storage la solution Open source de Versity.
Spécialisée dans la conservation d’Exaoctets de données, la startup Versity propose une solution qui n’est plus basée sur MinIO, mais dispose d’un nouveau moteur S3 sous licence GPL. Dans son architecture de conservation des données, Versity a travaillé sur trois secteurs : les namespaces (passant de 100 millions à 10 milliards, copie brute et restauration); le parallélisme (données, mais aussi métadonnées) et une architecture modulaire plus facile à installer et à administrer. Versity a de plus développé pour son système de fichiers ScoutFS sa propre version de S3, afin de stocker et de récupérer facilement les données sur un système compatible avec ce protocole objet.
Une autre possibilité pour réduire le coût du stockage des sauvegardes est de passer aux NAS en cloud. Les grands fournisseurs de cloud comme les fournisseurs de NAS – NetApp principalement – proposent des services en ligne destinés spécifiquement aux marchés de la sauvegarde avec des structures de coûts plus favorables que les équipements NAS du datacenter. Un NAS en cloud n’a théoriquement pas de limites de capacité, bien que les fournisseurs puissent fixer une limite supérieure à des fins de gestion. Google Cloud Platform, par exemple, limite un espace de noms unique à 50 Po.
Perfectionner les sauvegardes
Cela dit, les simples sauvegardes ne sont plus aussi efficaces qu’elles l’ont été contre les ransomwares. Et pour cause : les attaquants sont passés du chiffrement des données de production au ciblage des sauvegardes. En réaction, les responsables de la sécurité des systèmes d’information (RSSI) et les directeurs des systèmes d’information (DSI) ont cherché à renforcer les systèmes contre les attaques de ransomware, en utilisant des snapshots immuables et des sauvegardes déconnectées.
Les snapshots immuables sont un service qui pose un verrou en écriture sur une sauvegarde jusqu’à une date donnée, ce qui garantit que la sauvegarde sera conservée intacte jusqu’à ce moment-là et que ni un pirate ni un responsable informatique ne pourront l’effacer. Et d’ici à sa date de péremption, d’autres snapshots immuables auront été réalisés. Toutefois, il faut prendre garde à empêcher que le service (en cloud) ou le serveur (physique) qui gère ces snapshots immuables ne soit pas mis lui-même hors service, ou que son horloge n’ait pas été corrompue.
C’est pourquoi la sauvegarde déconnectée (ou « air-gapped ») est importante. Il s’agit tout simplement de sauvegardes qui ne sont pas atteignables en réseau. Que ce soit sur le réseau local, ou sur le service de stockage en cloud auquel on peut accéder dès lors que l’on a récupéré les bons mots de passe. L’un des meilleurs stockages déconnectés qui soient est la bonne vieille bande : une cassette que l’on sort du lecteur sitôt l’enregistrement effectué et que l’on stocke dans une armoire.
Nous parlons dans ce numéro de Storage du nouveau lecteur TS1170 que lance IBM pour ses propres bibliothèques et celles de Spectra Logic. Il stocke 150 To par bande. Malgré le peu de fabricants, les grandes entreprises se disent fidèles à ce format propriétaire plus capacitif que le standard LTO. L’augmentation de la capacité est destinée à des cas d’utilisation importants tels que l’archivage à long terme, l’archivage actif et la mise hors ligne des données pour parer aux cyberattaques.
Marier sauvegardes et IA : la prochaine étape
Enfin, ce numéro de Storage évoque la toute dernière évolution dans le milieu de la sauvegarde pour être un rempart encore plus efficace contre les cyberattaques : l’utilisation de l’IA. Cohesity dote sa solution d’un nouveau chatbot d’assistance qui évite aux clients de lancer une procédure de ticketing en cas de problème. Il interprète les questions des administrateurs des sauvegardes, diagnostique tout seul les problèmes, résume les articles techniques qui permettent de les résoudre. Les questions posées par les administrateurs sont automatiquement classées dans une file d’attente de ticketing, pour une mise en relation avec un agent de support humain dans les plus brefs délais.
Au-delà de l’intérêt pratique de cet assistant, Cohesity veut montrer à ses clients qu’il dispose d’une technologie pour entraîner des moteurs de Machine learning à partir des sauvegardes. Technologie qui correspond en l’occurrence à la présence de fonctions de formatage des données et de connexions logicielles vers les moteurs d’IA les plus courants. Il espère sur cette base construire d’autres applications d’IA, ce qui permettrait de rentabiliser encore plus les coûts des sauvegardes. Reste à savoir si les données sauvegardées peuvent constituer une source pertinente pour entraîner des modèles d’IA. C’est une question qui n’aura pas de réponse objective avant au moins plusieurs mois.