L'adoption de LTFS pourrait bouleverser les pratiques d'archivage sur bande

Le système de fichiers pour lecteurs de bande conçu par IBM et HP pour les lecteurs LTO-5 connait une popularité croissante. Son adoption par l'industrie et par les éditeurs de logiciels pourrait avoir un impact profond sur la façon dont les entreprises sauvegardent et archivent leurs données sur bandes.

Cela fait moins d'un an qu'IBM a présenté son système de fichiers LTFS (Linear Tape File System) pour les systèmes à base de bandes LTO-5, mais de plus en plus de fournisseurs ont commencé à supporter le standard dans leurs produits afin de simplifier la lecture et l'écriture des données sur les systèmes base de bandes. IBM, en mai, a ajouté le support de LTFS à ses propres librairies de bande et Oracle a annoncé le support du système de gestion de fichiers sur ses librairies et lecteurs LTO-5 StorageTek. Hewlett-Packard, de son côté, a déclaré qu'il travaille sur le support de LTFS dans les librairies robotisées.

Le soutien de LTFS devrait aussi faire son apparition dans des systèmes autres que des librairies de bandes, notamment ceux de Crossroads Systems. Quantum a quant à lui annoncé qu'une prochaine version de son système de gestion de fichier SAN StorNext pourra importer et exporter des données vers des systèmes de bande LTFS dans le courant du premier semestre 2012.

IBM et HP sont les développeurs initiaux de LTFS. IBM supporte aujourd'hui les OS Linux, Windows et Mac OS X, tandis que HP ne propose pour l'instant que le support de Linux et travaille au support de Windows.

LTFS pourrait simplifier l'archivage des données

Les fournisseurs et les analystes s'accordent sur le fait que LTFS pourrait jouer un rôle significatif dans la façon dont les données sont archivées et récupérées à partir de bandes. Dans les deux cas, le système de gestion de fichiers pourrait en effet éliminer le besoins d'applications spécifiques pour réaliser ces fonctions.

Contrairement aux versions précédentes de LTO, LTO-5 supporte le partitionnement des médias. Cela permet à une mécanique LTO-5 de créer deux partitions sur chaque bande. L'une contient un système de fichier hiérarchique et son index et la seconde héberge les données proprement dites. Le contenu de la bande tel qu'inscrit dans l'index du système de fichiers est disponible dès le chargement d'une cassette et peut être consulté par un navigateur ou toute autre application qui a accès au lecteur de bande. Tout OS qui supporte LTFS peut ainsi accéder au contenu d'une bande écrite par un autre OS supportant aussi LTFS.


«LTFS essaie tout bonnement de faire de la bande un média de stockage comme un autre" explique  Randy Kerns du cabinet d'analyse Evaluator Group. «LTFS a ouvert une nouvelle opportunité pour l'archivage sur bande. Maintenant, avec LTFS, je peux écrire des fichiers de manière séquentielle sur une bande, mais j'ai un index que je peux lire rapidement afin de positionner la tête au bon endroit de la bande et lire ce fichier. La partition comprenant le système de fichiers est organisée sur toute la longueur de la bande et consomme environ 5 % de la capacité de la bande pour le stockage de l'index. Quand une bande avec un index est insérée, LTFS présente au système d'exploitation les informations concernant les fichiers actifs stockés sur la bande. "

Tous les lecteurs autonomes LTO-5 supportent LTFS. Pour utiliser la capacité, il suffit d'installer le file system sur le poste de travail connecté au lecteur. Matt Starr, directeur technique de Spectra Logic, explique qu'historiquement les logiciels d'archivage séparaient les métadonnées du contenu, ce qui faisait que seul le logiciel ayant écrit les données pouvait les relire.  «Avec LTFS, toutes les métadonnées nécessaires pour comprendre les données sont stockées sur la bande, ce qui fait de cette bande une entité capable de se décrire elle-même. C'est l'équivalent de brancher une clé USB sur un ordinateur" explique Starr.

Utiliser la bande comme un disque

Kerns explique qu'avant LTFS, les logiciels d'archivage faisaient souvent appel au logiciel de sauvegarde pour écrire les données sur bande. Avec LTFS, ils peuvent écrire directement sur une bande car celle-ci se comporte plus comme un disque que comme une bande. "Maintenant, vous pouvez écrire un fichier comme sur un disque plutôt que d'utiliser une application de sauvegarde".

Un autre avantage est que le logiciel d'archivage n'est pas forcément nécessaire pour récupérer les données sur la bande, ajoute Kerns. Par exemple, si le logiciel d'archivage peut écrire nativement sur bande comme un fichier, puis il n'est plus nécessaire pour récupérer les données. Mais si le logiciel d'archivage encapsule les données, puis le logiciel d'archivage qui serait nécessaire pour récupérer les données, sauf bien sûr dans le scénario ou ce logiciel d'archivage utiliserait un schéma d'encapsulage propriétaire au-dessus de LTFS, par exemple pour regrouper un certain nombre de fichiers distincts au sein d'une archive unique.

Les fournisseurs commencent à trouver des façons de tirer profit des caractéristiques de LTFS. Par exemple, IBM Library Edition offre la possibilité de créer un point unique de montage  pour un ensemble de cartouches LTFS. Le logiciel Library Edition réside sur un serveur connecté à une bibliothèque et stocke l'index des différentes cartouches dans le cache du serveur. Cela permet d'exploiter l'index sans que les cartouches ne soient nécessairement chargées.

Crossroads de son côté a conçu la strongBox, un système d'archivage à base bande qui dispose d'un étage de cache disque intégré et qui pour l'utilisateur final s'utilise comme un NAS accessible au travers de protocoles standards comme CIFS ou NFS.

Un impact sur la capacité utilisable des bandes

Il est à noter que LTFS a un petit impact sur la capacité qui augmente avec la fréquence des changements apportés au contenu de la bande. Si un fichier est mis à jour, son contenu intégral sera ajouté à la bande et l'emplacement occupé par la version antérieure sera gelé et donc la capacité qu'il utilisait "perdue". En cas de mises à jour fréquentes, une stratégie pour éviter de trop perdre de place sera de retransférer ponctuellement le contenu des bandes "non optimisées" vers des bandes fraîchement formatées ce qui permet de réclamer l'espace gaspillé en ne copiant que les versions "à jour" des fichiers.

Adapté d'un texte original en anglais rédigé par Sonia R. Lelii, SearchStorage.com, par Christophe Bardy, LeMagIT.

A lire aussi sur LeMagIT :

Le consortium LTO ajoute deux nouvelles générations à sa roadmap

Sauvegarde sur bande : LTO-5 passe les 1,5 To et concurrence IBM et Oracle

Pour approfondir sur Backup