Au CEA, les économies d’énergie comptent aussi
La Direction des applications militaires du CEA est restée fidèle aux processeurs x86 pour son nouveau supercalculateur, en l’occurrence des AMD. Ce qui ne l’empêche pas d’être économe en énergie.
Forcément, quand un supercalculateur est installé à la DAM (Direction des applications militaires) du CEA, les performances ont intérêt à être capables d’assurer la simulation de la dissuasion nucléaire française. Dès lors, les moyens financiers sont disponibles. Mais la nouveauté est que les calculateurs du CEA doivent être aussi responsables en termes de consommation énergétique.
« La première partition de EXA1 vient remplacer TERA-1000-1, un supercalculateur qui date de 2016 et qui va être réformé courant 2022, une fois que nous aurons entièrement validé toute notre chaîne de production sur la nouvelle machine », explique Jacques-Charles Lafoucrière, responsable de programme calcul hautes performances (HPC) au CEA. La machine a été conçue avec Atos. Elle est installée sur un réseau classifié et n’est utilisable que par des centres DAM, entièrement dédiés à des activités de Défense pour la dissuasion (simulation de charge nucléaire, de matériaux, physique).
De l’eau juste tiède
Jean-Pierre PanzieraChief Technology Director, HPC, Atos
L’EXA1 est présenté comme le système HPC le plus économe en énergie d’Europe. « L’une de ses particularités est d’être refroidi par de l’eau tiède, qui entre à moins de 20 °C et peut grimper jusqu’à 40 °C. Cela permet d’éviter d’avoir un système de refroidissement et donc des surcoûts », commente Jean-Pierre Panziera, Chief Technology Director, HPC, Atos.
C’est la troisième génération de système refroidi par eau. L’EXA1 consomme 5 MW et le refroidissement à eau permet d’économiser 40 % de consommation électrique. À côté du caractère écologique, les économies en termes de coûts ne sont pas négligeables puisque 1 MW revient en moyenne à un million d’euros chaque année. Le système mis au point se veut désormais plus universel et est capable de refroidir des systèmes à base de processeurs Intel, AMD, ARM et même les unités d’alimentation électrique.
Pas de GPU pour l’instant
L’EXA1 est opérationnel et son entrée en production est imminente. Le passage de l’ancienne machine au nouveau calculateur ne devrait pas poser trop de problèmes, l’architecture étant la même. En effet, l’EXA1 ne comporte toujours que des processeurs x86 généralistes, pas de cartes accélératrices à base de processeurs graphiques. Les machines à base de GPU sont certes plus économes en énergie pour atteindre une puissance donnée, mais elles sont considérées comme moins facilement programmables. Le CEA estime ne pas avoir encore besoin, pour l’instant, de calculateurs avec des GPU, même s’il pense qu’il finira par en acquérir dans quelques années.
La mise en production nécessite toutefois une période de validation des applications au préalable, parce que la version du système d’exploitation Red Hat est plus récente.
Question puissance, la machine est 14e dans le classement mondial des 500 supercalculateurs les plus performants, avec un score de 23,2 pétaflops. La première partition d’EXA1 est composée de 6 480 nœuds. Ils sont installés dans 203 étagères racks qui comprennent chacune 32 nœuds. Chaque nœud intègre 2 processeurs AMD Epyc à cœurs Zen 3. Et chaque processeur comporte 64 cœurs, individuellement capables d’exécuter deux flux d’instructions simultanément, soit un total pour le super calculateur de 414 720 cœurs physiques qui reviennent à 829 440 cœurs effectifs.
Selon les études menées, AMD propose pour l’instant des CPU plus puissants que ceux d’Intel. Mais la gamme de machines Atos reste agnostique et supporte d’être équipée à l’avenir par des processeurs Intel, si ceux-ci repassent en tête des performances.
Un calculateur utilisable comme un PC
À cela s’ajoute une série de logiciels open source, soit développés par le CEA, soit par Atos, soit conjointement, qui permettent de transformer cette grappe de 6 000 serveurs en un seul super calculateur utilisable de façon très simple : « certains utilisateurs exploitent ce calculateur comme s’ils travaillaient sur un PC. Ce ne sont pas des informaticiens et ils l’utilisent comme un outil industriel », décrit Jean-Pierre Panziera. Au total, ce sont plusieurs milliers d’utilisateurs qui vont se servir d’EXA1.
Aujourd’hui, le super calculateur n’est pas vu comme une machine monobloc. En réalité, il est composé de plusieurs partitions (ou modules), selon la terminologie du CEA. Ces partitions sont fédérées autour d’un réseau spécifique haute performance, le Bull Sequana eXascale Interconnect (BXI V2), une alternative à Infiniband. Chaque partition future, y compris celles qui seraient accélérées par des GPU, viendra simplement s’accrocher à ce réseau pour être utilisable par les codes que développent les chercheurs.