Avec "Pascal", NVidia refond sa roadmap d'accélérateurs GPU

Dévoilée à la GTC, la famille de GPU "Pascal" de Nvidia devrait faire ses débuts en 2016. Elle embarquera des innovations comme la mémoire unifiée ou le packaging 3D.

Nvidia a profité de sa GPU Technology Conference (GTC) qui se tenait cette semaine à San Jose pour refondre sa roadmap en dévoilant une nouvelle puce prévue pour 2016, une puce GPU dont le nom de code est Pascal (un nom inspiré de Blaise Pascal). Pascal a pour but de conforter la position de leader de Nvidia sur le marché des accélérateurs dans le monde HPC. Un marché où les puces de la firme sont largement dominantes face aux accélérateurs Xeon Phi d’Intel qui, selon Nvidia, n’auraient que moins de 5% du marché.

GTC 2014, Roadmap GPU NVidia

Jen-Hsun Huang, CEO de NVidia, présente la nouvelle roadmap GPU de la firme

L’annonce de Pascal est une vraie surprise au regard des roadmaps présentées l’an passé lors de la GTC 2013. Nvidia avait alors indiqué son intention de lancer en 2014 ses GPU Maxwell puis d’enchaîner ensuite sur une nouvelle génération baptisée Volta. Pascal s’insère désormais entre ces deux familles, avec comme conséquence prévue un décalage dans le temps du lancement de Volta. Selon Nvidia, Pascal emprunte à la fois des technologies prévues pour Maxwell (comme la mémoire unifiée, finalement retirée de Pascal) et d’autres fonctions à l’origine prévues pour Volta (comme le packaging 3D de la mémoire, qui devrait non seulement doper la capacité mémoire d'un facteur de 2,5x, mais aussi les performances).

Annonce Nvidia Pascal GPU

Jen-Hsun Huang dévoile Pascal, sa prochaine génération de GPU

L’annonce de Pascal, se traduit par un aveu implicite : les puces Maxwell, dont la version grand public est apparue en début d’année dans des cartes graphiques grand public (les GTX 750), n’incluront pas la gestion de la mémoire unifiée dans leur déclinaison pour les cartes Tesla (les accélérateurs GPU de la marque dédié au monde du HPC). Maxwell devrait toutefois apporter de meilleures performances (environ 1,5 fois supérieur à l'actuel Kepler, selon la roadmap de Nvidia)  et réduire aussi la consommation. Mais, les développeurs CUDA interessés par la mémoire unifiée devront attendre 2016 pour le support de l'accélération matérielle de cette fonction et se satisfaire d'ici là des fonctions logicielles de gestion de mémoire unifiée apportées par la version 6 de CUDA. Il est à noter que Volta, à l'origine positionné comme le successeur de Kepler, est repoussé à plus tard, mais l’une de ses fonctions majeures, l’utilisation de la mémoire 3D est avancée à Pascal.

NVLink, un nouveau bus d'interconnexion pour CPU et GPU, avec, pour premier partenaire, IBM et sa fondation OpenPower

Une autre nouveauté attendue pour Pascal est l’arrivée d’une nouvelle technologie d’interconnexion rapide, baptisée NVLink. NVLink est un bus d’interconnexion point à point inter GPU et CPU-GPU qui est annoncé comme bien plus rapide que le bus PCI-express (5 à 12 fois le débit, selon Jen Hsun Huang, le CEO de Nvidia). Chaque GPU devrait disposer de plusieurs blocs NVLink chacun capable de délivrer 20 Go/s de bande passante. NVLink permettra à plusieurs GPU Nvidia de communiquer à très haut débit entre eux, et permettra aussi aux CPU équipés de NVLink de communiquer plus rapidement avec les GPU.

Nvidia a annoncé un accord avec IBM pour l’inclusion de NVLink dans de futurs CPU Power. Cette intégration ne se fera pas dans le prochain Power 8, attendu pour le 3e trimestre 2014, mais pourrait en revanche affecter son successeur (appelons le Power 8+). NVLink devrait aussi être disponible sous licence pour les entreprises membres de l’OpenPower Foundation qui choisiraient de créer leurs propres designs de CPU Power. Summit Gupta, le patron de la division HPC « Tesla » de Nvidia, a aussi confirmé au MagIT que la firme est en discussion avec plusieurs fabricants de CPU ARM 64 bit serveur, en se refusant toutefois à fournir des noms. Selon lui, plus d’une vingtaine de fabricants travaillent actuellement à la fabrication de puces ARM 64bit pour le marché des serveurs.

Nvidia Pascal GPU Module

Le prototype de module Mezzanine Pascal dévoilé par Nvidia

Intel en revanche ne fait pas parti à ce jour des partenaires de Nvidia et il est peu vraisemblable que le n°1 mondial des processeurs intègre un bus qu’il ne contrôle pas dans ses puces. Interrogé sur le sujet par LeMagIT, Gupta a clairement expliqué que dans le monde du HPC, ses GPU sont de plus en plus incontournables, et que pour certains clients, elles sont devenues plus importantes que les CPU. Nvidia mise sur le fait que cette tendance va se poursuivre et que d’ici à 2016 ou 2017,  l’écosystème ARM 64 bit sera suffisamment compétitif en matière de performances pour offrir une alternative aux puces Xeon. Permettant ainsi à certains clients de faire l’impasse sur ces puces. Gupta souligne aussi que la plupart des clients HPC ont des codes développés en interne sur base de technologies open source qui sont largement agnostiques en matière de CPU.

Cela ne veut toutefois pas dire que Nvidia est prêt à couper les ponts avec les plates-formes x86. Pascal conservera son support du bus PCI-express. Ce qui, dans tous les cas, lui permettra de fonctionner avec des puces Xeon d’Intel et avec d’éventuels Opteron d’AMD, sans toutefois délivrer son plein potentiel. Notons enfin que la première implémentation de NVLink ne supportera pas la cohérence de cache, et ne devrait supporter cette fonction que lors du lancement de Volta, le successeur de Pascal. Une dernière nouveauté de Pascal est que Nvidia proposera la puce sous la forme d’une carte Mezzanine.

 

Pour approfondir sur HPC