Stockage en cloud : quels sont les services NAS d’AWS, Azure et GCP ?

Cet article fait le point sur les différents services de stockage de fichiers proposés par les grands hébergeurs de cloud public.

Cet article est extrait d'un de nos magazines. Téléchargez gratuitement ce numéro de : STORAGE: Storage 27 : Comment les datacenters en colocation s’articulent avec le cloud hybride

Même si le mode objet est considéré comme le système de prédilection pour le stockage des données en cloud public, le mode fichier reste indispensable à la plupart des applications et reste d’ailleurs celui qui stocke le plus gros volume de données aujourd’hui. Dans cet article, nous nous intéresserons au stockage de fichiers fourni dans les trois grands clouds publics : AWS, Microsoft Azure et Google Cloud Platform (GCP).

AWS, Azure et GCP proposent des services de stockage NAS classiques (partage de fichiers), qu’ils mettent en valeur en les déclinant pour des usages plus précis.

Azure se distingue en fournissant un système de cache qui accélère l’accès aux fichiers entre les applications situées sur le même nom de domaine. Azure décline cette offre en plusieurs niveaux de service.

AWS

AWS, Azure et GCP proposent des services de stockage NAS classiques (partage de fichiers), qu’ils mettent en valeur en les déclinant pour des usages plus précis.

Les deux principales offres de stockage de fichiers d’AWS sont EFS (Elastic File Storage) qui partage ses contenus en NFSv4 et est donc plus efficace pour les applications Linux, ainsi que FSx, qui partage ses contenus en SMB et est donc plutôt dédié aux applications Windows. On choisira surtout l’un ou l’autre si les applications prennent en compte les droits d’accès aux fichiers, leur éventuel verrouillage et une écriture particulière pour la structure hiérarchique de répertoires.

Les cas d’utilisation sont les analyses du Big Data, la gestion des serveurs et contenus Web, le développement et le test d’applications, les traitements multimédias, la sauvegarde des bases de données et le stockage des conteneurs.

EFS est un système de stockage de fichiers NFS pour les applications Linux qui s’exécutent aussi bien sur des instances de traitement AWS (machines virtuelles ou containers) que depuis des serveurs sur site. Capable de prendre en charge plusieurs pétaoctets de données, EFS ajuste sa capacité à la demande. L’offre se décline en deux niveaux de service : standard et accès peu fréquent (IA, pour Infrequent Access). Les fichiers sont automatiquement déplacés d’une classe à l’autre en fonction de leur consultation.

AWS fait état d’un accès parallèle de manière à atteindre des « niveaux élevés de débit » (10 Go/s sont annoncés) et de performance en entrée/sortie (500 000 IOPS). Le coût de stockage peut être de 0,08 $ par Go par mois, à raison d’une répartition à 80/20 des charges entre les classes Standard et IA.

Amazon FSx for Windows File Server permet d’accéder à un stockage de fichiers via le protocole SMB natif de Windows. Le stockage de fichiers FSx est toutefois accessible à partir d’instances de calcul et d’équipements sur site Windows, Linux et macOS.

Basé sur Windows Server, FSx offre des fonctionnalités comme les listes de contrôle d’accès (ACL), les quotas d’utilisateurs, la restauration des fichiers par l’utilisateur final et l’intégration d’Active Directory (AD). Des options de stockage SSD (Flash) et HDD (disque dur) sont possibles.

Les performances annoncées comprennent une latence inférieure à la milliseconde, des dizaines de Go/s de débit et des millions d’opérations en entrée/sortie par seconde (IOPS). Le système propose le chiffrement des données au repos et se revendique conforme aux normes ISO, PCI-DSS, SOC et HIPAA.

Il existe par ailleurs un Amazon FSx for Lustre. Celui-ci cible les cas d’utilisation impliquant une quantité énorme de données, comme le machine learning et le calcul haute performance (HPC). Il peut s’interfacer avec AWS S3 (service de stockage en mode objet d’AWS) pour y déverser ses données une fois qu’elles ne sont plus en cours de traitement et réduire ainsi les coûts. Ces données restent toutefois présentées sous forme de fichiers dans FSx for Lustre. Les données stockées par FSx for Lustre sont accessibles à partir d’instances EC2 et d’emplacements sur site.

Microsoft Azure

Azure propose des services maison de stockage de fichiers dans le cloud, ou basés sur les technologies de NetApp, ainsi que différents niveaux de services de mise en cache.

Azure Files partage des fichiers qui sont administrés dans le cloud, via le protocole SMB (Server Message Block) ou REST (REpresentational State Transfer) et accessibles des machines en cloud ou sur site Windows, macOS et Linux. En tant que service Microsoft, Azure Files s’interface nativement avec Active Directory. Deux niveaux de performances/coût sont possibles : standard et premium.

Azure NetApp Files, de son côté, se destine aux applications hautes performances, telles que SAP HANA, les bases de données, les clusters de supercalcul (HPC) et les applications web d’entreprise. Ici, les fichiers sont accessibles par le biais des protocoles SMB et NFS, et il existe trois niveaux de performances/coût : standard, premium et ultra.

Microsoft Azure permet également la mise en cache afin d’accélérer l’accès aux fichiers pour les traitements à hautes performances. Il existe plusieurs options.

La première, Azure HPC Cache, est un service de stockage auquel on se connecte en NFS qui permet en réalité de présenter aux applications en cloud le contenu d’un NAS sur site ou, à l’inverse, qui permet à un site d’accéder plus rapidement aux fichiers stockés en cloud, typiquement ceux qui sont gérés par le service de stockage en mode objet d’Azure, Blob.

Microsoft ayant racheté Avere en 2018, Azure offre aussi plusieurs services de cache basés sur cette technologie. Avere vFXT for Azure est facturé en tant que « service de cache haute performance » et constitue une version virtuelle de l’appliance FXT Edge Filer. L’idée est d’utiliser vFXT en tant que cache d’accès aux fichiers dans le cloud depuis des applications qui ne sont pas conçues pour le cloud. Cet outil est optimisé pour les lectures intensives et propose aux applications un espace de noms agrégé. Ce service va de pair avec l’installation sur site d’une appliance (matérielle ou virtuelle) FXT Edge Filer.

FXT Edge Filer s’interface avec tous systèmes de stockage NAS, mais aussi avec les services de stockage objet Blob Azure et Amazon S3. Il peut évoluer jusqu’à 24 nœuds pour atteindre les millions d’IOPS et les centaines de Go/s de débit annoncés. FXT se décline en deux modèles qui se distinguent principalement par leur quantité de RAM et leur capacité de stockage.

Google Cloud Platform

L’option Cloud Filestore de GCP offre deux niveaux de performance pour le stockage de fichiers NFS, avec une capacité de 64 To par volume partagé. Le service Premium offre un débit et un nombre d’opérations bien supérieurs au service Standard : 1,2 Go/s contre 100 Mo/s pour le débit et 60 000 IOPS contre 5 000. La disponibilité annoncée est de 99,9 % pour les deux offres.

Google se montre un peu plus modeste qu’AWS et Azure sur le plan des cas d’utilisation. GCP cible le rendu multimédia, les charges de travail applicatives, la gestion de contenu web et les répertoires de travail.

Si le stockage de fichiers basique de GCP ne suffit pas, celui-ci propose aussi les services NetApp Cloud Volumes, pour gérer les charges de travail des applications Linux et Windows connectées via les protocoles NFS et SMB.

NetApp Cloud Volumes sur GCP se décline en trois niveaux de performance/prix : Standard, Premium et Extreme à raison de 0,10, 0,20 et 0,30 $ par Go par mois, une capacité allant de 4 000 à 32 000 IOPS et un débit de 16 Mo/s à 128 Mo/s par To.

Pour approfondir sur Stockage en Cloud