kubais - stock.adobe.com
Archivage en cloud : OVHcloud commercialise son concurrent de S3 Glacier
La nouvelle offre Cold Archive de l’hyperscaler français coûte un peu moins cher que S3 Glacier Deep Archive et se présente comme souveraine. Elle utilise les bandes 3592 d’IBM et le moteur Miria d’Atempo.
L’hyperscaler français OVHcloud commercialise enfin son offre Cold Archive de stockage très longue durée et très peu chère : le Go peut n’y coûter que 0,13 centime d’euro par mois. Censée concurrencer S3 Glacier Deep Archive chez AWS (0,16 centime d’euros par Go et par mois), l’offre avait été présentée en avant-première en décembre dernier. La recette, iso-fonctionnelle avec celle d’AWS, n’a pas changé entretemps : les données sont stockées sur des bandes via des bibliothèques IBM et accessibles au format objet. Le logiciel Miria du Français Atempo se charge des sauvegardes et des restaurations.
À l’instar de S3 Glacier Deep Archive, le but de ce nouveau service est de stocker des archives, comprendre des données sur lesquelles on ne travaille plus, mais qu’il faut garder sur le long terme. OVHcloud cite les exemples des rushs vidéo originaux dans les studios de production, des données de santé que la loi impose de conserver pendant des décennies, des documents comptables ou RH réglementaires…
Et puis, bien entendu, des copies de secours qui permettront de revenir en arrière même dans le pire des cas, ou encore des données de productions qu’il est bon d’emmagasiner en attendant de mettre la main sur une IA qui saura piocher dedans pour prédire l’avenir commercial.
Physiquement, le service Cold Archive est déployé dans quatre datacenters répartis sur le territoire, avec au moins 100 kilomètres de distance entre eux. OVHcloud précise qu’il s’agit de datacenters dédiés, physiquement éloignés des datacenters depuis lesquels il exécute les machines virtuelles de ses clients. Le traumatisme de l’incendie de son site à Strasbourg en 2021 et des dommages subis par ses clients est toujours bien présent.
Le fait que ces quatre datacenters soient situés en France permet à OVHcloud de présenter Cold Archive comme une solution souveraine. Et le fait que les données soient réparties entre ces datacenters avec un système d’Erasure coding (sorte de RAID à l’échelle de machines distantes) justifie que cette solution soit résiliente.
Un stockage sur bandes IBM 3592
Chaque site dispose d’une bibliothèque de bandes capable de référencer 18 000 cassettes pour une capacité locale de 3 Exaoctets.
De manière assez étonnante, il ne s’agit pas ici des cassettes LTO standard, mais de cassettes 3592, un format propre à IBM, également revendu par SpectraLogic. A priori, il s’agit plus précisément de l’évolution 3592-60F, alias TS1160, qui stocke 20 To bruts par cassette et 60 To compressés. Cette évolution du format 3592, la sixième, a été lancée en 2018. Depuis, IBM a annoncé des versions TS1165 (30 To bruts par cassette), TS1170 (40 To) et TS1165 (80 To), mais ces évolutions n’ont pas encore vu le jour. Et, ce, malgré un calendrier initial qui prévoyait une nouvelle génération tous les trois ans.
Comparativement, le format LTO-9, le dernier, apporte 18 To de capacité brute par cassette et 45 To de capacité compressée.
Les données sont stockées (avec un chiffrement AES-256 systématique), interrogeables et récupérables via un protocole objet S3 classique. Pour autant, des contraintes tarifaires s’appliquent, exactement comme chez AWS, dès lors que l’on utilise ces accès. Ainsi, la relecture des bandes est réputée si lente – OVHcloud n’indique pas la durée – qu’il faudra stocker les données sur des disques durs si l’on souhaite les analyser avec des algorithmes d’IA. Dans ce cas, le coût du stockage passe à 0,7 centime d’euro par Go et par mois.
L’opération de restauration des archives sur des machines de production sera facturée 0,5 centime d’euro par Go restauré. Enfin, l’export des données en dehors du cloud d’OVHcloud est facturé 1 centime par Go transféré. L’export correspond par exemple au besoin de restaurer les archives sur les machines d’un datacenter privé, ou encore à la fourniture des données à une application tierce qui est exécutée depuis un autre cloud.
Atempo Miria comme moteur de sauvegarde
D’aussi loin que remonte la mémoire du MagIT, Atempo travaille avec OVHcloud sur cette solution depuis au moins 2021. Soit juste après que les deux fournisseurs se sont unis en 2020 pour proposer une solution de sauvegarde gratuite aux administrations, le temps de la crise pandémique.
Atempo dispose de trois outils de sauvegarde : Lina pour les postes de travail, Tina pour les serveurs et Miria pour les données. C’est ce dernier qu’OVHcloud utilise derrière l’interface qu’il propose à ses utilisateurs pour effectuer les sauvegardes.
L’avantage de Miria est qu’il dispose d’une riche bibliothèque de fonctions pour transférer rapidement des données entre deux points géographiques éloignés (par compression et décompression à la volée, notamment), comme pour restaurer les données dans un format différent de celui de départ.
Plus exactement, Miria possède des dizaines de connecteurs logiciels qui lui servent à extraire le format natif de n’importe quelle solution de stockage et à réencoder les données dans le format natif de n’importe quelle autre solution. Parmi ces connecteurs, on trouve donc celui du stockage objet d’OVHcloud et celui des bibliothèques de bandes d’IBM.
En l’état, Cold Archive se pilote depuis un portail qui, en quelques clics, sert à définir quels services de stockage objet archiver. Pour autant, Atempo expliquait en fin d’année dernière au MagIT sa volonté de décliner Miria en modules intégrables à des applications SaaS. Il est probable qu’OVHcloud propose à terme d’intégrer la fonction de sauvegarde Miria aux applications SaaS qu’il héberge. La sauvegarde des données depuis les applications SaaS est en effet un sujet qui préoccupe de plus en plus les entreprises et auquel seul l’éditeur Hycu semble pour l’heure s’intéresser.