Amazon Glacier : un service d'archivage économique, à condition de ne pas en sortir
Amazon a annoncé cette semaine le lancement d'un service d'archivage de données baptisé Glacier qui se caractérise par un très faible coût de stockage et d'ingestion de données. Reste que les coûts de sorties de données sont élevés et que lorsque l'on prend en compte la facture télécom, le service n'apparait plus aussi économique que cela. LeMagIT fait le point sur le service
Amazon a annoncé cette semaine le lancement d’Amazon Glacier un service de stockage à très faible coût dont l’objectif est de permettre l’archivage ou la sauvegarde de données à moyen et long Amazon présente Glacier comme une alternative économique aux solutions d’archivage traditionnelles en mettant l’accent sur sa facturation à l’usage qui évite toute forme d’investissement initial.
Des coûts de rétention et d'ingestion très faibles
Ce faisant, Amazon met l’accent sur le seul coût de rétention des données de Glacier, qui est de 0,011 $ par Go pour un hébergement en Europe. Mais il oublie de mettre en avant les autres coûts du service. L’extraction d’un fichier ou la requête dans une archive Glacier est facturée 0,055 $ par millier de requêtes (Amazon précisant qu’il est possible à ce tarif de retrouver jusqu’à 5% du contenu total chaque mois. Au delà, il faut ajouter des frais de 0,011$ par Go extrait. Il faut aussi prévoir des frais de 0,033$ par Go pour tout objet effacé avant une période de 90 jours.
Pas fou, Amazon encourage au remplissage des archives glacier en ne facturant pas les transferts de données entrant. Par contre, les transferts sortants sont payants. Le premier Go par mois est gratuit, mais il faut ensuite compter avec des frais de transfert de 0,12$ par Go pour les 10 premiers To avec ensuite un tarif dégressif jusqu’à 350 To (0,05 $ par Go).
Une entreprise de taille moyenne qui déciderait de stocker 36 To dans Glacier sur une période de 3 ans et de retrouver environ 5000 objets par mois d’une taille moyenne de 1 Mo avant de retirer l’ensemble de son archive d’Amazon se verrait ainsi facturer près de 4750 $ pour la période dont 4320$ pour le seul retrait des données.
Une grande entreprise qui de son côté stockerait 1,08 Po dans Glacier sur une période de 3 ans et retrouverait en moyenne 150 000 objets de 1 Mo par mois, avant encore une fois de retirer ses données sur une période de trois mois se verrait facturer 66825 $ dont 54000$ d’extraction.
Ne pas sous-estimer les coûts télécoms et les coûts d'extraction de données
Glacier est donc un service très économique de rétention de données avec le bémol qu’il est préférable de ne pas en extraire ses archives sous peine de coûts de sortie plutôt salés. Bien sûr, les prix calculés n’incluent pas le coût télécom côté entreprise. Car on l’oublie parfois à la vue de tels tarifs, il faut quand même disposer de la ligne télécom adaptée pour tranférer les quantités de données évoquées. Et une simple ligne SDSL à 10 Gbit/s n’est qu’a peine suffisante pour la PME de notre premier cas. Pour mémoire une ligne SDSL 10 Mbit/s permet de transférer 4,5 Go par heure, soit environ 3,2 To/mois (en supposant une saturation à 100% du lien). Une telle ligne revient à environ 950€ HT par mois (soit pour la PME évoquée dans le premier cas une facture télécom pour Glacier qui dépasse de beaucoup celle du service en cloud (environ 34200 € pour la période de 3 ans). Dans le cas du grand compte évoqué plus haut, il faudrait une ligne avec 30 fois ce débit.
L’apparent faible coût de Glacier doit donc être regardé avec une pincée de sel. Certes le coût de rétention est faible. Mais les coûts de retrait sont tels qu’ils sont conçus pour inciter les entreprises à ne pas quitter le service sous peine d’une forte pénalité. De plus une fois que l’on factorise le coût télécom, l’ensemble du service n’apparaît plus si économique par rapport à une solution physique d’archive NAS traditionnelle. Notons pour les utilisateurs d'Amazon S3 qu'Amazon proposera bientôt un système de bascule automatique des données S3 dans Glacier sur la base de politiques définies par l'administrateur. Une forme de tiering de données pour les clients Amazon