HPC : Summit et ses 200 Pflops devraient redonner le leadership du supercalcul aux USA
Les laboratoires nationaux d'Oak Ridge (ORNL) ont dévoilé la semaine dernière le cluster Summit, un supercalculateur mixant Power9 et accélérateurs Nvidia Volta. Avec ses 200 Pflops de puissance, la machine devrait permettre aux Américains de reprendre la tête du classement mondial aux Chinois pour la première fois depuis 2012.
Vendredi 8 juin, le ministère américain de l’énergie a officiellement dévoilé Summit, son supercalculateur de dernière génération capable de délivrer une performance de 200 Pflops.
En développement depuis quatre ans, Summit est en phase finale de déploiement. Lorsque le cluster sera complet, il comptera un total de 4608 nœuds AC922 d’IBM capables de délivrer un total de 200 Pflops et jusqu’à 3,3 exaops pour les opérations de calcul en demi-précision (opérations de machine learning en 16 bits).
Logiquement, le système devrait prendre la tête du prochain classement Top500 qui sera dévoilé lors d’ISC 2018 - le salon international du calcul hautes performances qui se tiendra en Allemagne du 24 au 28 juin prochain.
Sauf surprise, il succédera au calculateur chinois Sunway TaihuLight, qui occupe actuellement le premier rang mondial avec une puissance de 125,43 Pflops.
On n’a plus vu un supercalculateur américain au premier rang mondial du classement Top500 depuis 2012, une année où Sequoia, puis Titan s’étaient tour à tour succédés au sommet du classement mondial du supercalcul.
Un supercalculateur qui mixe Power9 et accélérateurs Nvidia
Au cœur de Summit, le serveur AC922 est le premier nœud Power9 dévoilé par IBM en décembre 2017. Ce modèle bi-socket au format rack 2U est conçu pour fonctionner sous Linux. Il peut accueillir un maximum de 6 accélérateurs GPU NVidia V100 reliés entre eux et aux processeurs Power9 par le bus d’interconnexion à très haut débit NvLink de Nvidia. Dans le cluster Summit, les nœuds sont par défaut configurés avec le maximum d’accélérateurs NVidia et sont reliés entre eux via une double « fabric » Infiniband EDR à 100 Gbit/s.
Selon le département de l’énergie, Summit sera utilisé pour des travaux de recherche dans le domaine de la physique et de l’énergie, mais aussi pour la recherche de nouveaux matériaux ou pour la recherche en IA.
Le système est la dernière étape avant la conception et la mise en service d’un cluster exaflopique américain, prévue pour 2021.
Ironiquement, le Summit a déjà permis aux chercheurs américains d’établir un record exascale en réalisant une série de simulations génomiques mixant calculs en simple et en demi-précision. Selon l’ORNL, une équipe menée par Dan Jacobson et Wayne Joubert a fait tourner un algorithme de comparaison génomique à un débit de 1,88 exaops en tirant parti des quelque 27 648 « Tensor Cores » des accélérateurs Nvidia du cluster.
Selon l’ORNL, le code optimisé pour les « Tensor Cores » développé par les chercheurs du laboratoire s’est exécuté 25 fois plus rapidement que l’ancien code CoMet utilisé sur Titan, le précédent cluster du laboratoire.
Pour mémoire, le supercalculateur européen le plus performant du moment est le cluster suisse Piz Daint avec une puissance en crête de 23,3 Pflops. Le plus rapide des clusters de l’UE est le cluster Marconi, du CINECA à Bologne avec 15,3 PFlos. Les plus performants des supercalculateurs français sont Pangea de Total — avec 5,2 Pflops (RMax) et 6,7 Pflops (en crête) — et le cluster Tera1000 du CEA — avec une puissance RMAx de 4,9 Pflops et une puissance en crête de 9,3 Pflops.