Le point sur l'offre 100% Flash de Pure Storage
Dans le cadre d'un tour d'horizon de l'offre 100% Flash des principaux acteurs du monde du stockage, LeMagIT vous propose un point sur les solutions de stockage Flash de Pure Storage.
Pionnier du stockage 100 % Flash, dont il s’est fait l’un des principaux promoteurs, Pure Storage s’est imposé en cinq ans comme l’un des leaders du secteur. Si elle maintient son rythme actuel de croissance, la start-up devrait boucler son année avec des revenus de près de 800 M$, un chiffre d’affaires réalisé uniquement avec ses baies 100 % Flash FlashArray //m.
Cette nouvelle famille de systèmes modulaires a fait ses débuts en 2015 et a succédé aux précédentes baies des séries FA 300 et 400. Pure Storage a tout d’abord présenté les modèles les plus haut de gamme, les //m50 et //m70 et un modèle de milieu de gamme, le FlashArray //m20. La famille s’est récemment enrichie avec le lancement du //m10, plus abordable et destiné aux PME et aux sites distants.
Les baies FlashArray //m s’appuient sur la même architecture bi-contrôleurs que les baies historiques de la série FA. Mais leur architecture est bien plus évolutive. Ainsi, le fond de panier qui fournit la connectique pour les disques SSD délivre à la fois une double connectique traditionnelle au format SAS 12 Gb/s (celle qui est utilisée pour l’heure) et une double connectique port PCIe/NVMe. Le design des contrôleurs est ainsi déjà prêt pour accueillir de futurs disques ou modules Flash NVMe.
Parmi ses autres originalités, la FlashArray //m dispose, selon les modèles de deux à quatre modules NVRAM de 8 Go chacun. Ces modules sont utilisés par les contrôleurs pour acquitter aussi rapidement que possible les transactions et ils stockent aussi le contenu des tampons mémoire de la baie en cas de panne. Ils jouent aussi un rôle important en matière de pérennité de la Flash. Les contrôleurs des baies FlashArray //m dédupliquent en effet et compressent en mémoire les données avant de les écrire sur SSD pour préserver la durée de vie des cellules et ainsi allonger la durée de vie des unités Flash.
Concrètement, la gamme FlashArray//m se compose d’une version économique, dite//m10, et d’une version de milieu de gamme, dite//m20 Ces deux systèmes de stockage se présentent sous la forme d’un châssis 3U comprenant deux contrôleurs et 20 emplacements pour modules Flash à deux slots (soit 40 SSD). La baie//m10 a une capacité brute maximale de 10 To (pour 25 To de capacité utile), tandis que la baie m20 a une capacité brute totale de 40 To, soit une capacité utile d’environ 120 To.
Les performances respectives des deux systèmes sont de 100 000 et 150 000 IOPS (blocs de 32 K). Pure propose aussi deux modèles haut de gamme, les //m50 et //m70. Ces deux baies sont bâties autour du même châssis que les //m10 et //m20, mais elles peuvent respectivement accueillir deux ou quatre tiroirs de disques additionnels de 2 U de hauteur, pour des capacités maximales de 88 et 136 To bruts (soit 250 et 450 To effectifs) et des performances de 220 000 et 300 000 IOPS.
Par rapport à la génération antérieure, Pure Storage revendique ainsi une densité 2,6 fois plus élevée et une consommation électrique réduite par un facteur de 2,4.
Les systèmes Pure Storage sont motorisés par le même OS Purity, un OS que Pure n’a cessé d’enrichir au cours des dernières années et qui propose aujourd’hui la plupart des fonctions avancées des baies de stockage historiques (snapshots, clones, réplication, support des API VAAI et VVOLs, etc.) Toutes ces fonctions sont intégrées par défaut dans la licence de l’OS.
La commercialisation des FlashArray //m est supportée par plusieurs programmes commerciaux et engagements. Avec Evergreen, Pure Storage promet que le prix de la maintenance n’augmentera pas après trois ans. Avec Forever Flash, il garantit à ses clients qu’ils bénéficieront gratuitement de contrôleurs dernier cri tous les trois ans, s’ils souscrivent à une option de maintenance premium. Enfin, l’option dite « UpgradeFlex », permet de bénéficier de rabais sur le prix des contrôleurs en fonction de la capacité supplémentaire de stockage que l’on acquière.
Les prix débutent à moins de 50 000 $ pour une baie FlashArray //m10. Il faut compter environ 450 000 $ pour une baie //m20 avec 10 To de Flash, un prix auquel s’ajoute celui de la maintenance.
FlashBlade : une seconde famille de baies Flash pour le Big Data
Pour compléter son offre de baies SAN FlashArray, Pure Storage a présenté au printemps son système FlashBlade, un système de stockage Flash en mode scale-out qui sera accessible via des protocoles NAS comme SMB et CIFS et via des protocoles de stockage objet comme S3.
Le marché visé par la firme avec FlashBlade est celui du stockage de fichiers massifs, du stockage de logs, du stockage d’images et de vidéos et de l’analytique, des marchés où la performance est de plus en plus nécessaire, mais où le coût au gigaoctet doit rester raisonnable. Pure Storage estime qu’avec FlashBlade, il pourra proposer des prix au gigaoctet inférieurs à 1 $ par Go stocké. De quoi satisfaire les besoins d’une part significative du marché du stockage « secondaire » utilisé pour les données non structurées.
La baie se présente sous la forme d’un châssis dense de 4 U de haut, capable d’accueillir jusqu’à 15 lames. Chacune d’entre elles est un serveur x86 doté d’un processeur octo-cœur Intel Xeon de génération Broadwell — un SOC Xeon-D — et de 64 ou 128 Go de mémoire (le maximum supporté par le SOC d’Intel à l’heure actuelle). Chaque lame embarque aussi un module de NVRAM pour le cache et accueille un module de Flash PCIe propriétaire d’une capacité de 8 To ou de 52,8 To. Ces modules sont pour l’instant constitués de puces Flash MLC (Pure Storage ne ferme pas la porte à l’usage de Flash 3D pour l’avenir) et sont pilotés par un CPU ARM et un ou plusieurs FPGA (selon la capacité). Pour faire court, le CPU Intel se charge de la gestion des I/O, des services de données et de la gestion des métadonnées, tandis que les modules propriétaire se chargent de la gestion de la Flash et du chiffrement des données. Modules Flash et carte mère communiquent par le biais d’un protocole propriétaire au-dessus du bus PCIe pour des performances optimales et une latence minimale.
Chaque lame est connectée via un plan intermédiaire (midplane) à un back-end qui embarque un switch Ethernet massif ainsi qu’un contrôleur qui pilote le châssis, supervise le fonctionnement des lames et embarque les outils d’administration et de configuration du système. On compte deux interfaces 10Gigabit Ethernet par lame (fournies par le SOC Intel), tandis que le châssis expose 8 ports à 40 Gigabit Ethernet en face arrière. Techniquement, le FlashBlade a toutes les caractéristiques d’un cluster-in-a-box ce qui promet un déploiement simple mais aussi des économies substantielles en matière de câblage.
Les communications entre les lames sont optimisées via la mise en œuvre de certains éléments de la pile SDN d’Intel et notamment la librairie DPDK. Cette dernière permet de doper de façon significative la performance réseau tout en optimisant l’usage du CPU, car une partie de la pile réseau tourne non plus dans le noyau Linux mais en mode « user space ». Selon Pure Storage, son usage permet de ramener la latence de communication entre les lames à moins de 100 microsecondes.
Le constructeur supporte pour l’instant la constitution de cluster réunissant 2 châssis et entend à terme supporter un maximum de 10 châssis.
Côté logiciel, chaque lame fait tourner le nouvel OS flash maison, baptisé Elasticity. Cet OS implémente une large partie des services de données déjà proposées sur les baies Flash Array comme la compression, la déduplication, les snapshots ou la réplication (ces deux derniers sont encore en développement) mais il a surtout pour mission de gérer la base de données transactionnelle massivement distribuée qui permet de gérer les données stockées sur la baie.
Dans la version actuelle du système (accessible en mode dit Directed Availability auprès du constructeur), seuls le mode objet (propriétaire) et le mode NFS sont accessibles. L’objectif de Pure est au final de supporter également CIFS, S3 et HDFS (Hadoop File System), ce qui devrait permettre de répondre aussi bien aux besoins logiciels historiques qu’à ceux des nouvelles applications web.
Un châssis avec 15 lames offre une capacité brute maximale de 792 To et une capacité utile après compression et déduplication de 1,5 Po, ce qui fait du FlashBlade le plus dense de tous les systèmes Flash du marché. Surtout, à moins de 1 $ par Go et avec un débit annoncé de l’ordre de 15 Go/s, la baie pourrait être un concurrent redoutable pour les NAS scale-out du marché qu’il s’agisse de ceux de NetApp ou d’Isilon, ou de systèmes de stockage objet disposant d’un accès en mode NFS. Pure Storage estime ainsi pouvoir dépasser le million d’IOPS NFS par seconde avec un système pleinement configuré.