L'accélérateur GPU Nvidia Tesla K80 encore basé sur Kepler
Pour sa dernière carte accélératrice GPU, NVidia a jumelé deux puces GPU à architecture Kepler. Il faudra donc attendre 2015 pour voir une Tesla motorisée par l'architecture Maxwell.
Dans le monde du HPC, l’architecture Kepler de Nvidia fait de la résistance. Alors que l’on aurait pu s’attendre à voir le constructeur sortir prochainement un accélérateur GPU haut de gamme à base de processeur Maxwell, pour contrer les dernières cartes accélératrices FirePro S9150 d’AMD (après tout, les premières cartes graphiques basées sur l’architecture Maxwell ont fait leur apparition en février), Nvidia vient d’annoncer la carte GPU Tesla K80, un nouvel accélérateur haut de gamme motorisé par deux puces GPU à architecture Kepler. La carte Tesla K80 a sans doute pour mission de combler un trou et d’affronter les cartes GPU d’AMD en attendant l’arrivée, sans doute au premier semestre 2015, d’une carte Tesla à base de puce à architecture Maxwell.
Mais le défi le plus important pour Nvidia sera sans doute de produire en temps et en heure une carte Tesla à base d’architecture Pascal, la génération suivant Maxwell. Nvidia a en effet été retenu aux cotés d’IBM pour fournir les deux clusters hybrides commandés par le département de l’énergie pour 2017. Ces systèmes à base de processeurs Power seront épaulés par des Pascal, interconnectés aux puces IBM via le bus NVLink de Nvidia.
Une carte motorisée par deux nouvelles puces GPU
La carte Tesla K80 vient compléter en haut de gamme l’actuelle Tesla K40 à base de processeur GK110 en embarquant deux puces GK210, des processeurs graphiques dérivés de l’actuelle GK110. Alors que le processeur de la Tesla K40 embarquait 2880 cœurs Cuda épaulés par 12 Go de mémoire GDDR5 (avec une bande passante mémoire de 288 Go/s), les deux puces GK210 de la Tesla 80 embarquent chacune des cœurs Cuda (soit 4992 pour la carte) et 12 Go de RAM (avec 240 Go/s de bande passante par GPU). Autre différence, les caches de la dernière puce GK210 sont deux fois plus gros que ceux de la puce GK110. Chacun des 13 streaming processors ou SMX (chacun comprend 192 cœurs Cuda) dispose de 128 Ko de cache pour les shaders et de 512 Ko de cache de registres.
Optimisé pour la performance/Watt
En réduisant légèrement la fréquence du GK210 par rapport au GK110, Nvidia a optimisé la puce pour délivrer le meilleur rapport performance/watt (la fréquence mémoire a elle aussi été réduite de près de 15% passant à 5 GHz). La carte Tesla K80 avec ses deux processeurs a ainsi un TDP de 300W alors que la K40 mono-puce a un TDP de 235W. Les performances sont quant à elles en hausse significative, puisque la K80 est donnée pour 1,87 Tflops en calcul en virgule flottante double précision, contre 1,43 Tflops pour la K40 (chiffres en fréquence de base).
Il est à noter qu’avec GPU Boost (l’aptitude de la carte à doper sa fréquence d’horloge jusqu’à atteindre la limite de son enveloppe thermique maximale), les résultats sont encore meilleurs, puisque les performances en virgule flottante double précision passent respectivement à 2,91 Gflops et 1,66 Gflops.
A titre de comparaison, la FirePro S9150 d’AMD affiche une performance maximale de 2,53 Tflops en double précision pour une consommation de 235W