À quoi servent vraiment les NAS en cloud ?
Cet article fait le point sur le stockage en NAS, son fonctionnement, son intérêt et les possibilités d’accéder en cloud à du stockage pour les fichiers.
La solution de partage de fichiers en réseau, ou NAS, est l’un des secteurs du marché du stockage de données qui connaît la croissance la plus rapide. Pour les entreprises et autres grandes entreprises, le serveur NAS constitue un moyen efficace de stocker des volumes de plus en plus importants de données non structurées, qu’il s’agisse de contenus multimédias, de documents ou de données sources pour entraîner une intelligence artificielle.
Pour les plus petites entreprises, les NAS constituent un étage supplémentaire par rapport au stockage interne dans les serveurs, avec une disposition familière des fichiers et des dossiers, ainsi que des outils de gestion largement similaires. Ils fonctionnent également sur les mêmes réseaux Ethernet standard que les PC et les serveurs existants. Sur le marché des micro-entreprises, une appliance NAS peut même remplacer un serveur, en raison de sa simplicité et de son faible coût.
Les systèmes NAS ont toutefois leurs limites : les temps d’accès sont plus lents que le stockage en connexion directe et ils seront souvent plus lents qu’une baie de stockage en mode bloc (SAN), notamment parce qu’ils utilisent Ethernet plutôt que des liaisons plus rapides, tels que Fibre Channel, ou NVMe-oF.
Mais le principal inconvénient des NAS traditionnels est qu’ils sont plus difficiles à faire évoluer. Une fois qu’un boîtier NAS est plein, les services informatiques doivent mettre à niveau les disques ou acheter un tout nouveau NAS. Cela entraîne des coûts élevés ou, s’ils conservent l’ancien NAS, des silos de stockage.
Cette situation a incité les fournisseurs à créer des systèmes NAS scale-out, où les utilisateurs peuvent construire un cluster de nœuds NAS pour former un seul pool de stockage, et à déporter les fonctionnalités d’un NAS dans le cloud.
Qu’est-ce que le NAS ?
Le NAS est un système de stockage avec accès aux fichiers qui peut être mis à la disposition de n’importe quel appareil sur un réseau. Dans sa forme la plus simple, un boîtier NAS est un appareil autonome et intégré doté d’un processeur, d’une connectique réseau, d’une mémoire et d’un certain nombre d’emplacements pour les disques durs ou les SSD. Il possède son propre système d’exploitation et n’a pas besoin d’être connecté à un serveur ou à un contrôleur de stockage pour fonctionner. La plupart des tâches administratives peuvent être effectuées via un navigateur web.
Le cœur du NAS est son système de fichiers. Le système de fichiers permet au NAS d’apparaître comme un volume partagé pour tout utilisateur de PC ou serveur sur le réseau. En général, les systèmes NAS prennent en charge les protocoles NFS (Network File System) et SMB (Server Message Block), pour une compatibilité maximale des applications et des systèmes d’exploitation.
Un NAS est optimisé pour les données non structurées (fichiers et documents), tandis que les systèmes de stockage à connexion directe (DAS) et les baies SAN sont optimisés pour l’accès en mode bloc, ce qui est par exemple préférable pour les bases de données.
En fait, c’est l’intégration du système de fichiers qui définit le NAS. Lorsqu’on utilise un SAN, le système de fichiers réside ailleurs, par exemple sur des serveurs ou des PC, et les données sont conservées sur le SAN dans des blocs auxquels on accède à partir de ces systèmes de fichiers externes.
Le pourquoi et le comment des NAS
Les périphériques NAS sont petits au départ, mais ils peuvent devenir très volumineux. Les petits boîtiers NAS sont populaires pour les bureaux à domicile et les micro-entreprises. À l’autre bout de l’échelle, les fournisseurs de solutions d’entreprise proposent des unités NAS aux capacités impressionnantes. Le fournisseur chinois Huawei, par exemple, a récemment lancé son OceanStor Dorado V6, qui comprend 32 contrôleurs, 6 400 disques et près de 300 Po de capacité.
Les premiers systèmes NAS d’entreprise étaient des filers, conçus pour gérer le volume croissant de données non structurées qui arrivaient dans les entreprises à mesure qu’elles adoptaient des processus numériques.
Les filers de fournisseurs tels que NetApp et EMC (aujourd’hui propriété de Dell) ont absorbé un grand nombre de fichiers dans des domaines allant de l’imagerie médicale au stockage de médias et de documents. Sans les filers, ces documents auraient submergé le stockage interne des serveurs.
Mais le paysage actuel est bien plus complexe. De plus en plus d’applications utilisent des données non structurées et les performances du matériel NAS ont augmenté grâce à des versions plus rapides d’Ethernet et au passage vers les SSD.
Les systèmes NAS évolutifs, avec plusieurs nœuds fonctionnant comme un seul très grand volume (virtuel) ou un seul espace de noms, ont également surmonté certaines des limites des NAS autonomes traditionnels. Il est désormais possible d’ajouter rapidement du stockage à un système NAS sans que les applications ou les utilisateurs s’en rendent compte. Les équipes informatiques peuvent ajouter des nœuds et du stockage en fonction des besoins. Un espace de noms global permet également aux entreprises de distribuer le stockage sur différents sites, y compris dans le cloud public.
Deux autres versions de la technologie NAS méritent également d’être prises en compte. Tout d’abord, pour les entreprises, une infrastructure hyperconvergée (parfois appelée HCI) regroupe le calcul, le stockage et la mise en réseau. Dans certains cas d’utilisation, l’infrastructure hyperconvergée peut remplacer les systèmes NAS et SAN. À l’autre extrémité du spectre, des utilitaires libres tels que FreeNAS peuvent transformer des serveurs redondants, ou même des PC de bureau, en boîtiers NAS bon marché pour les petites entreprises ou les particuliers.
Les filers et les premiers systèmes NAS étaient axés sur la capacité et non sur les performances. Aujourd’hui, les NAS ont toujours leur raison d’être pour les très grandes capacités. Peu d’autres systèmes peuvent offrir un coût aussi bas par gigaoctet de données. Mais les cas d’utilisation classiques, axés sur la capacité, tels que les sauvegardes, l’archivage – y compris pour des raisons de conformité – et le traitement de documents de valeur relativement faible ont été rejoints par des applications plus exigeantes, telles que le stockage de données d’entraînement AI/ML et d’ensembles de données d’analyse avancée.
Cette tendance a également poussé le NAS vers la convergence avec le stockage en mode objet.
Qu’est-ce qu’un NAS en cloud et comment y accéder ?
Un NAS en cloud utilise le stockage en cloud public pour fournir un accès aux fichiers, généralement via SMB ou NFS. OnTap de NetApp, qui inclut NFS, est également largement pris en charge.
La connexion d’un appareil utilisateur, ou plus probablement d’un serveur, à un NAS en cloud devrait être aussi simple que la connexion à un matériel NAS local. Les différences se situent principalement au niveau de la capacité, du coût, des performances et du niveau d’intelligence offert par les systèmes en cloud.
Le NAS en cloud n’a pas de limites de capacité réelles, bien que les fournisseurs puissent fixer une limite supérieure à des fins de gestion. Google Cloud Platform, par exemple, limite un espace de noms unique à 50 Po.
La principale limite de performance du NAS en cloud est la connexion WAN au fournisseur de services. Si les applications ont besoin de vitesses élevées et d’une faible latence, les entreprises devront investir dans des liaisons par fibre optique à haut débit. Sinon, elles pourraient déplacer les applications dans le cloud, si le fournisseur prend en charge la puissance de calcul. Mais les systèmes sur site sont – pour l’instant – plus rapides et beaucoup moins coûteux.
Lorsqu’il s’agit de comparer les coûts, les entreprises doivent tenir compte du fait que le matériel NAS sur site nécessite un investissement initial. En outre, les entreprises doivent souvent acheter plus que ce dont elles ont besoin et sur-provisionner pour minimiser les coûts et les perturbations liés aux mises à niveau physiques.
Ce n’est pas un problème avec le cloud, puisqu’il est facturé à l’utilisation, mais les DSI voudront le contrôler. Le stockage à long terme dans le cloud peut s’avérer coûteux si les utilisateurs classent et oublient les documents.
Cas d’utilisation des NAS en cloud
C’est pourquoi les grands fournisseurs de cloud et les fournisseurs tels que NetApp et IBM vendent des produits destinés spécifiquement aux marchés de la sauvegarde et de l’archivage. Ces produits ont des structures de coûts plus favorables que les volumes NAS ordinaires.
Les fournisseurs proposent également différents niveaux de NAS en cloud, en fonction des performances. Les charges de travail moins importantes ou les données moins fréquemment utilisées peuvent être transférées vers des volumes moins chers. Mais dans tous les cas, les acheteurs doivent être conscients des coûts de bande passante et de sortie pour accéder aux données ou les télécharger.
Cependant, dans certains cas d’utilisation, le NAS en cloud est la meilleure solution. C’est notamment le cas lorsqu’une entreprise a besoin d’augmenter rapidement sa capacité de stockage sans avoir à réécrire ses applications ou à les porter sur le cloud ; ou lorsque le coût est moins important, par exemple pour un projet à court terme ; ou encore pour fournir un stockage, une collaboration et une sauvegarde à distance à de petits bureaux ou à des travailleurs distants.