luchschen_shutter - Fotolia
NVidia met ses GPU au service des supercalculateurs ARM
L’arrivée d’une version de Cuda compatible avec les serveurs ARM incite HPE, Lenovo, Atos et Fujitsu à annoncer des configurations HPC avec un rapport puissance / énergie 33 % meilleur.
Il sera désormais possible de construire des supercalculateurs vectoriels avec une consommation modérée d’énergie. Telle est la promesse que fait cette semaine NVidia en adaptant les bibliothèques de programmation de ses GPU aux serveurs basés sur des processeurs ARM, réputés bien moins énergivores que les classiques x86.
Selon NVidia, l’ensemble des bibliothèques Cuda qui accélèrent sur serveurs x86 plus de 600 applications-types en HPC et tous les frameworks de Machine Learning seraient téléchargeables en version ARM d’ici à la fin de l’année. Le kit comprendra le compilateur PGI avec une prise en charge d’OpenACC, le module grâce auquel les portions de code vectorielles sont automatiquement affectées aux GPU lors de l’exécution.
Le support des processeurs ARM par NVidia n’est pas une première. Le fabricant décline ses bibliothèques Cuda pour cette architecture depuis 2013. Sauf qu’il s’agissait jusqu’alors de seulement accélérer l’affichage des applications très graphiques sur les équipements mobiles. Désormais, Cuda permettra aux ARM 64 bits d’utiliser les capacités vectorielles des GPU NVidia pour exécuter des fonctions de calcul intensif.
Notons par ailleurs qu’ARM avait lui-même mis au point des capacités vectorielles pour ses processeurs. Néanmoins, ces extensions SVE (Scalable Vector Extensions) ne semblent pas avoir servi aux machines du Top500, le palmarès des ordinateurs les plus puissants de la planète et parmi lesquels les configurations à base de GPU NVidia tiennent le haut du pavé.
Des machines avec plus de processeurs pour une consommation similaire
Atos et Fujitsu auraient immédiatement manifesté leur volonté de construire de nouveaux supercalculateurs mixant processeurs ARM 64 bits et GPU NVidia. HPE, qui dispose déjà de serveurs ARM - avec processeurs Marvell ThunderX2 - dans sa machine HPC Apollo 70, a annoncé l’arrivée prochaine d’une configuration dotée de GPU NVidia à son catalogue. Lenovo a fait de même concernant sa future gamme de serveurs basés sur le processeur ARM eMAG d’Ampere.
A titre comparatif, pour une consommation électrique similaire, un nœud Apollo 70 à base d’ARM aurait des performances 33 % supérieures à celle d’un serveur x86, sans GPU. La clé de l’architecture ARM est sa compacité, puisqu’il est possible de mettre huit processeurs 32 cœurs dans un format 2U, alors que les fabricants ne savent généralement y installer que deux x86.
La compatibilité avec les accélérateurs de NVidia devrait permettre aux machines ARM de décliner ces avantages dans le domaine du calcul intensif, notamment pour les moteurs de Machine Learning.