Stockage : Huawei dévoile ses dernières baies haute performance
Les baies OceanStor Dorado disposent à présent de cartes DPU pour accélérer les accès, jusqu’à 100 millions d’IOPS. La puissance de calcul libérée est utilisée pour exécuter des fonctions inédites, comme un pot de miel contre les ransomwares.
Le fabricant chinois a profité d’un événement dédié à ses clients parisiens en fin de semaine dernière pour dévoiler au public sa toute nouvelle génération de baies de stockage OceanStor Dorado. Elles apportent des contrôleurs plus puissants qui, dans un cluster, permettent de délivrer jusqu’à 100 millions d’IOPS (nombre d’accès par seconde), contre seulement 21 millions d’IOPS sur la génération précédente. Elles disposent aussi d’un nouveau système d’exploitation, SmartLink 3.0, qui parallélise mieux les accès.
Le secret de cette croissance de performances tient à la présence de cartes réseau accélérées, des « SmartNIC » à base de DPU, qui décodent à la volée les requêtes en lecture/écriture. Directement gérées par le système SmartLink, désormais en version 3.0, ces cartes soulagent le processeur, lui aussi plus puissant, pour qu’il ait plus de temps de calcul disponible dans ses tâches de gestion du stockage.
De fait, les dernières baies OceanStor Dorado ne sont pas seulement plus rapides. Leur nouveau système se sert de la puissance de calcul disponible dans les processeurs pour exécuter des fonctions de sécurité inédites. Principalement, SmartLink 3.0 maintient en opération des pièges qui servent à détecter immédiatement les cyberattaques, il surveille les comportements anormaux, avec des approches différentes selon le mode de stockage, et il crée des copies de secours invisibles qu’il peut remettre en production en un clin d’œil.
« Les OceanStor Dorado sont notre best-seller en matière de baies de stockage. Nous avons lancé cette famille de produits en 2019. Elle est suffisamment modulaire pour que nous puissions proposer à nos clients de mettre matériellement à jour leurs baies avec les contrôleurs ou les modules Flash les modèles de dernière génération », argumente Gong Tao, le directeur produit de Huawei spécialisé dans les gammes de stockage.
Ces baies, conçues pour la vitesse, fonctionnent aussi bien en mode NAS pour le partage de fichiers sur le réseau, qu’en mode SAN pour les accès blocs des bases de données et des machines virtuelles, ou qu’en mode objet S3 pour les applications dites cloud-native. Selon les modes d’utilisation, les SmartNIC proposent des ports FC en 32 Gbit/s ou Converged Ethernet en 100 Gbit/s. Ces derniers peuvent fonctionner en NVMe/RoCE ou en iSCSI pour le mode bloc, comme en NFS/RDMA, NFS ou SMB pour le mode fichier.
Des contrôleurs et des SSD spéciaux
Huawei propose quatre configurations. En haut de gamme, les modèles 18000 et 8000 se présentent dans un boîtier 4U qui peut contenir quatre contrôleurs. Le modèle 18000 les a tous. Le modèle 8000 n’en a que deux, mais dispose de deux slots libres pour être converti en 18 000. En milieu de gamme les modèles 5000 et 6000 se présentent dans un boîtier 2U qui contient respectivement un ou deux contrôleurs, ainsi que 25 SSD.
Gong TaoDirecteur produit, spécialisé dans les gammes de stockage, Huawei
Tous ces modèles sont extensibles avec des tiroirs de 36 SSD au format 2U qui se connectent en NVMe/RoCE via des ports Ethernet 100 Gbit/s. Le nombre de tiroirs dépend du nombre de cartes réseau RoCE par contrôleur.
Première spécificité de Huawei, les processeurs utilisés dans ces appareils ne sont pas des x86, mais des processeurs ARM maison, les Kunpeng. Ce sont également des cœurs Kunpeng qui sont utilisés dans les puces DPU des cartes réseau SmartNIC. Huawei utiliserait ici des cœurs de dernière génération, 50 % plus performants que leurs prédécesseurs.
La seconde spécificité est que Huawei n’utilise pas des SSD standard, mais des modules Flash maison, qu’il appelle des PALM, à la manière des modules Flash propriétaires DFM que Pure Storage utilise dans ses baies. Les PALM sont plus fins, mais plus longs que des SSD standard, d’où le fait de pouvoir en disposer 36 en façade au lieu de 24 dans un tiroir rack.
« La capacité de nos modules Flash est de 61 To par unité et une version en 128 To devrait arriver dès l’année prochaine. Les PALM embarquent eux aussi des cœurs de processeurs Kunpeng, ce qui leur permet de compresser et de chiffrer eux-mêmes, à la volée, les données entrantes pour économiser la capacité de stockage », précise Gong Tao.
Des clusters de stockage gérés par 16 contrôleurs
Il est possible de construire des clusters comprenant un maximum de 16 contrôleurs, afin d’atteindre les fameux 100 000 IOPS, ou 32 contrôleurs si on les dispose en paires redondantes pour la haute disponibilité.
La grande nouveauté de cette nouvelle génération est que, au-delà de deux boîtiers contrôleurs (soit huit contrôleurs pour les modèles 18000/8 000 et quatre pour les 6000/5 000), il est possible de relier tous les nœuds de contrôle à tous les tiroirs de disques en utilisant un switch NVMe/RoCE entre eux.
Gong TaoDirecteur produit, spécialisé dans les gammes de stockage, Huawei
« Il y a en fait plusieurs niveaux de fonctionnement en cluster. Tous les contrôleurs d’un nœud peuvent accéder au même disque PALM en même temps et tous les nœuds contrôleurs peuvent accéder en même temps au même tiroir de disques PALM. Dans ces scénarios, la vitesse de transfert est répartie en parts égales sur tous les liens qui pointent vers le même module PALM, ou vers le même tiroir de disques », explique Gong Tao.
Selon ses dires, les données en lecture ou en écriture transitent entre les contrôleurs et les tiroirs de disques en passant uniquement par les cartes DPU et les contrôleurs réseau, jamais par les CPU, lesquels servent juste ici à calculer le placement le plus optimal des fichiers, des blocs ou des objets.
« Mais bien évidemment, notre idée est de maximiser les débits en répartissant au mieux les données. C’est ce que fait notre nouveau système de gestion du cluster SmartMatrix 4.0. Il gère les redondances au niveau des tiroirs avec du RAID et au niveau du cluster avec de l’Erasure Coding. Vous pouvez perdre en même temps trois modules Flash sans que cela n’impacte ni la sécurité de vos données ni les performances », ajoute-t-il.
En outre, SmartMatrix supporte de synchroniser un cluster local avec un cluster distant. Équivalente à la fonction MetroCluster de NetApp, cette fonction s’appelle ici HyperMetro. « Si la distance est inférieure à 100 km entre deux sites, on peut avoir une écriture synchrone des données de part et d’autre. Au-delà, il s’agit d’une réplication a posteriori, asynchrone », précise notre interlocuteur.
Il note que, dans le cas d’une réplication asynchrone, la baie distante n’a pas besoin d’être aussi rapide que celle d’origine. « Il faut juste qu’il s’agisse d’une baie OceanStor, car la synchronisation nécessite des systèmes d’exploitation compatibles », dit encore Gong Tao.
Des fonctions système de haut niveau
Enfin, concernant les fonctions de haut niveau, Gong Tao indique que la protection continue, appelée HyperCDP, peut engendrer des snapshots incrémentaux du contenu du cluster toutes les 3 secondes. Ces snapshots, non seulement invisibles des accès utilisateurs, mais aussi immuables pour l’administrateur, sont restaurables en production en seulement 1 seconde. En l’occurrence, les données sauvegardées ne sont pas répliquées vers des volumes visibles du cluster, mais le système hôte des baies génère des pointeurs visibles vers les snapshots, et les présente de fait comme des volumes traditionnels.
Gong TaoDirecteur produit, spécialisé dans les gammes de stockage, Huawei
Il est possible, en option, d’ajouter une surveillance continue de l’infection des données par un ransomware. Cette fonctionnalité, appelée OceanCyber, est une option, car, dans un souci de privilégier les performances, elle est incarnée par une ou plusieurs cartes accélératrices à insérer dans les slots PCIe d’une baie. « Une baie OceanStor Dorado 18000 ou 8000 dispose de 28 ports PCIe, que vous pouvez utiliser pour les cartes DPU vers les serveurs, pour les cartes Ethernet vers les tiroirs de disques ou pour des cartes OceanCyber », détaille Gong Tao.
La console d’administration, quant à elle, s’accompagne d’un chatbot d’IA capable de dresser des rapports complets depuis un simple prompt. Huawei prétend que ce chatbot permet d’obtenir en un prompt ce qu’une interface graphique aurait affiché après sept manipulations. L’IA ici embarquée possède une base de connaissance régulièrement mise à jour et qui est censée inclure tous les types d’accès frauduleux.
« Parmi les accès frauduleux que reconnaît notre IA, nos dénombrons 2 000 types de tentatives de lire des contenus interdits en passant par des prompts et 500 cas d’utilisation problématiques d’un LLM. C’est-à-dire que notre solution ne se sert pas seulement de l’IA pour l’administration, elle sert aussi les cas d’usage de notre solution avec d’autres IA », conclut Gong Tao.