La baie 100% Flash DSSD D5 d’EMC affiche des performances hors normes
Lancée officiellement hier, la baie 100% Flash DSSD D5 d’EMC détonne dans le paysage du stockage par ses performances hors du commun. Le résultat de choix technologiques radicaux.
Après avoir levé le voile en mai dernier sur la technologie de DSSD, une société qu’il a racheté en mai 2014, EMC vient officiellement d’annoncer la disponibilité de la baie de stockage DSSD D5, un système de stockage 100% Flash capable de délivrer près de 10 millions d’IOPS avec une latence inférieure à 100 microsecondes dans un format de 5U.
Fondé par une équipe d’ingénieurs venus de Sun Microsystems - dont Bill Moore, l’un des créateurs de ZFS - DSSD a été financé par Andy Bechtholsheim, le cofondateur de Sun (il avait le badge d’employé n° 1 et a conçu la première « Sparc station ») et d’Arista Networks. La firme a conçu son système pour une performance optimale et vise notamment les marchés du calcul à haute performance, du trading à haute vélocité, de l’analytique en temps réel mais aussi des niches plus spécifiques comme la détection de fraude en temps réel ou le traitement de transactions bancaires.
100 Go/s de bande passante et une latence de l’ordre de 100 microsecondes
La baie bi-contrôleur DSSD D5 peut accueillir en frontal 18 ou 36 modules flash propriétaires de 2 ou 4 To connectés à la baie via le bus PCIe et supportant le protocole NVMe (pour une capacité totale brute allant de 36 To à 144 To).
En face arrière, la baie dispose de 96 ports PCI-express Gen3 à 4 lignes connectés à la « fabric » PCIe interne de la baie (en fait un commutateur PCIe massif).
Selon DSSD, cette architecture permet de connecter jusqu’à 48 serveurs à la baie via deux connexions redondantes pour chaque serveur (chaque serveur doit disposer d’une carte PCIe Gen 3 à 8 lignes fournie par DSSD et comportant deux ports séparés).
Le fait d’utiliser une connexion native PCIe permet des performances et une latence sans commune mesure avec celle des baies SAN traditionnelles. D’ailleurs la baie se comporte plus comme une baie en attachement direct que comme une baie SAN. Selon EMC, elle est capable de livrer un débit agrégé de près de 100 Go/s, une performance permise par la mise en œuvre combinée d’une fabric PCIe/RDMA à grande échelle et par l’usage d’un grand nombre de modules Flash NVMe accessibles en parallèle.
Des performances hors normes, mais des services de stockage minimalistes
Il est à noter que si tous les éléments de la baie sont redondants, la baie ne dispose d’aucun service de stockage avancé comme les snapshots, la réplication, la compression ou la déduplication. Tout juste dispose-t-elle d’un mécanisme baptisé « Cubic Raid » pour assurer la protection des données contre une panne éventuelle d’un ou plusieurs modules Flash.
Cet état de fait est le produit d’un choix conscient : la baie DSSD D5 a été optimisée pour la performance pure. Elle fait figure de dragster, dans un monde où la plupart des utilisateurs optent pour une confortable berline. Comme l’explique Sébastien Verger, le CTO d’EMC France, « avec DSSD, nous ouvrons une nouvelle catégorie de stockage, en répondant à des besoins qui n’étaient pas couverts jusqu’alors ». Les premiers clients comme le département de l’énergie US, qui a sélectionné la baie pour l’un de ses plus grands clusters analytiques sont d’ailleurs enthousiastes.
Gary Grider, en charge de la division HPC des laboratoires du département de l’énergie à Los Alamos (l’équivalent US du CEA) explique ainsi : « nous testons la technologie DSSD D5 depuis plusieurs mois avec des workloads multiples : systèmes de fichiers, bases de données NoSQL, et API directe DSSD. La connectivité PCIe partagée, la faible latence et la bande passante atteinte sont impressionnantes pour un système si compact ».
Une baie sans équivalent sur le marché
Pour l’instant, la baie D5 est sans équivalent (le plus proche concurrent est sans doute pour l’instant la baie NVMe de MangStor, qui a toutefois des performances très inférieures). Les fondateurs de DSSD ont en effet choisi de mettre en œuvre un ensemble de technologies de pointe, afin de ne rien sacrifier en matière de performance. La mise en œuvre d’une architecture PCIe switchée à grande échelle couplée à l’usage de modules Flash NVMe propriétaires explique en grande partie les performances extraordinaires annoncées par EMC.
Mais le plus intéressant pour l’avenir est sans doute le fait que la capacité Flash de la baie peut être adressée selon deux modes : un mode bloc traditionnel et un mode mémoire via une API spécifique. Cette approche rappelle les premières initiatives de Fusion-IO. Certains utilisateurs verront d’ailleurs la baie DSSD comme une alternative à l’installation de cartes PCIe Flash dans de multiples serveurs et utiliseront la baie comme une gigantesque carte Flash PCIe mutualisable entre plusieurs serveurs.
DSSD travaille avec plusieurs éditeurs pour optimiser l’usage de sa baie avec certaines applications. La firme a ainsi collaboré avec Cloudera pour permettre de stocker des données Hadoop sur la baie D5 sans mettre en œuvre les mécanismes de réplication propre à HDFS (ce qui permet d’économiser en stockage en s’appuyant sur les mécanismes de protection internes de la baie). Selon Cloudera, la baie D5 a permis à la firme de bâtir le cluster HBASE le plus rapide jamais construit par la firme.
DSSD travaillerait aussi avec d’autres éditeurs. Une collaboration serait ainsi en cours avec SAP pour optimiser le fonctionnement d’HANA avec la baie D5.