Storage 26 : Il est temps d’améliorer le stockage des données froides
Les données froides sont souvent abandonnées sur des supports auxquels on s’intéresse peu. Pour autant, les attaques par ransomware et les catastrophes récentes ont montré que ce stockage mérite une meilleure attention de la part des entreprises.
Le numéro 26 de Storage se penche sur la problématique de stocker durablement les données froides. Cette question est devenue brûlante, si l’on peut dire, depuis que l’hébergeur OVHcloud a été victime, en mars dernier, d’un incendie qui a détruit certaines des sauvegardes dormantes. Car, si nombre d’entreprises n’ont pu relancer leur activité dans les plus brefs délais, voire ont eu le malheur de perdre à tout jamais des données, ce n’est guère à cause d’une négligence de l’hébergeur. Non, le problème est que les données de secours n’étaient pas correctement stockées.
Les données froides sont celles que l’on sort des machines de production, car elles n’ont plus besoin d’être accessibles à tout bout de champ, et leur activité ne justifie plus de les garder sur des disques très coûteux. Ce sont des archives, des copies de secours, des bases documentaires, des historiques. Les cas dans lesquels on aura besoin de rouvrir ces contenus sont peu fréquents. En revanche, les perdre signifierait l’impossibilité de revenir en arrière pour se documenter, pour analyser l’activité, pour répondre à des exigences réglementaires, ou le plus souvent pour restaurer ce qu’un incident vient d’effacer.
Trouver le support le plus adapté
Mieux stocker les données froides ne signifie pas pour autant les stocker de toutes les manières possibles. Dans un récent article du MagIT, l’éditeur Jamespot expliquait ainsi que prendre absolument toutes les mesures pour récupérer des données quoiqu’il arrive et dans les meilleurs délais pouvait coûter jusqu’à huit fois plus cher que le simple stockage de base. La criticité de certaines sauvegardes commande de faire de telles dépenses. Mais pour la majorité des données froides, il s’agit seulement de ne pas se tromper de support.
Le cas d’usage emblématique de cette problématique est celui de l’institut américain IHME, qui collecte des données pour faire progresser la recherche contre le Covid-19. Même si sa mission a un caractère urgent, les informations qu’il manipule s’apparentent à une base documentaire. S’agit-il dès lors de données froides ou de données chaudes ? L’institut a tranché : ses données n’ont pas besoin des baies Flash très coûteuses que souhaitait lui vendre le fournisseur, mais ce n’est pas pour autant qu’il fallait les recaler sur des NAS capacitifs, mais trop lents. Donc, il a opté pour des NAS hybrides, qui mélangent des SSD – pour accélérer les accès –, et des disques durs capacitifs – pour emmagasiner la grande quantité de données.
L’erreur, ici, aurait consisté à opter pour des baies à bases de SSD QLC, présentés comme un juste milieu entre rapidité et capacité, mais au final encore bien trop chers pour l’usage non commercial de l’institut.
L’immortelle bande
Au jeu du meilleur support selon l’usage, il en est un qui, décidément, ne compte pas mourir : la bande. Le numéro 26 de Storage présente deux retours d’expérience dans lesquels la bande s’est avérée le plus adapté des supports de stockage, malgré tous les analystes qui prévoient sa fin depuis des années.
En Antarctique, les expéditions scientifiques britanniques louent la petitesse des cartouches qui permettent de ramener 100 To de données à l’université de Cambridge sans occuper trop d’espace sur leur bateau. En revanche, ce bénéfice risquait d’être annulé par l’espace qu’occupe d’ordinaire une bibliothèque de bandes. Passer aux disques amovibles n’aurait rien résolu. La solution a été trouvée : il suffisait de chercher pour trouver qu’un modèle de bibliothèque tout intégré était disponible dans le catalogue de Quantum.
En région parisienne, le studio de postproduction À La Plage était convaincu que les cartouches LTO étaient le média idéal pour archiver sur ses étagères les rushes des films sur lesquels ses équipes travaillent. Mais il avait un problème : comment accéder à seulement un plan, à seulement une image lorsque les producteurs veulent retoucher leur long-métrage à l’occasion d’une rediffusion ?
La mauvaise réponse aurait été d’abandonner la bande pour revenir à des disques durs qui sont conçus pour des accès fichier par fichier. Car les disques sont bien plus chers, bien plus encombrants et bien moins pérennes. Là aussi, une étude un peu plus poussée du marché a servi à découvrir qu’il existait une solution, en l’occurrence le logiciel ADA de l’éditeur Atempo qui permet d’accéder aux contenus des bandes comme s’il s’agissait de fichiers sur un disque dur.
Passer à la réplication des données en continu
Concernant les sauvegardes, il est utile de se pencher sur la manière dont les solutions historiques évoluent. En l’occurrence, ce n’est pas dans le support physique que l’on trouvera désormais des moyens d’améliorer la pérennité des données froides, mais dans la manière de les gérer d’un point de vue logiciel.
C’est ainsi que la dernière version de Veeam Backup & Replication a intégré, comme ses concurrents, la réplication des données en continu et la protection en écriture des données enregistrées. Cette dernière caractéristique, toute simple, est en fait bien plus efficace contre les ransomwares que le fait d’exporter les contenus des disques sur des baies de stockage objet, au prétexte que le protocole plus complexe de ces matériels suffirait à se protéger des attaques génériques des pirates.
Dans ce numéro de Storage, nous nous penchons également sur la solution en dernier recours : récupérer les contenus depuis les disques détruits. Il s’avère qu’une entreprise française, Recoveo, excelle dans cette pratique. Nous vous proposons une enquête immersive dans ses laboratoires.