CES : Nvidia dévoile le Tegra K1, une puce ARM avec support CUDA

A l'occasion du CES, NVidia a levé le voile sur son processeur Tegra K1 (ex- "logan") une puce ARM qui intègre 192 coeurs graphiques Kepler. Nvidia annonce des performances élevées dans un budget de 5 W.

NVidia a profité du CES qui se tient à Las Vegas pour dévoiler sa nouvelle puce ARM Tegra K1, une puce dont la particularité est d'intégrer 192 cœurs graphiques basés sur l’architecture Kepler du constructeur, déjà utilisée dans les cartes graphiques GeForce et dans les cartes Tesla pour le monde du calcul  numérique et de la simulation. Le Tegra K1 est la culmination de plusieurs années de développement visant à porter dans l'univers ARM le savoir faire de la firme en matière de graphique et de calcul. Ses applications devraient à la fois toucher le monde grand public, et le monde professionnel.

Le Tegra K1 de NVidia

Le CES étant largement consacré aux applications grand public, c'est bien entendu à ces dernières que Jen Hsun Huang, le CEO de Nvidia, a consacré la plupart de sa présentation. Il a notamment mis l'accent sur les capacités graphiques de la puce et sur leurs implications pour le monde Android et pour le monde du jeu vidéo. Car le Tegra K1 ne se contente pas du simple support d’OpenGL ES. Il apporte aux terminaux mobiles le support plein des API OpenGL 4.4 et DirectX 11, déjà utilisées dans le monde des PC. Selon Jen Hsun Huang, cela ouvre la voie à des applications de rendu photoréaliste sur les terminaux nomades (ce qui a bien sûr un impact pour les jeux) mais aussi pour les applications 3D.

Le K1 pourrait aussi jouer un rôle important dans l’évolution des clusters de calculs en dopant fortement les performances des architectures HPC à base de puces ARM. Le Tegra K1 est en effet la première puce mobile supportant l’API CUDA 6.0. Plus important encore, elle devrait être la première puce Nvidia intégrant le support du jeu d’instruction ARM 64bit .On peut ainsi imaginer utiliser le K1 pour des applications de mécanique des fluides, de simulation de particules…

Une appellation, deux puces

Le Tegra K1 sera décliné en deux versions, 32bit et 64bit.

En fait, comme l’a expliqué Jen Hsun Huang au cours de son Keynote au CES, l'appellation Tegra K1 désignera dans la pratique deux puces bien différentes. La première plutôt orientée grand public utilisera une partie CPU basée sur l’architecture 32bit ARM Cortex A-15 (avec une mémoire adressable limitée à 8Go). La seconde, plutôt conçue pour le monde professionnel embarquera deux cœurs Nvidia Denver, la nouvelle architecture CPU de la firme, basée sur l’architecture ARM V8 64bit. Nvidia est resté très discret sur la disponibilité des deux puces, mais la version 32 bit du K1 est en principe attendue pour le courant du premier semestre. La version 64 bit est en quelque sorte une surprise, car elle n’était pas attendue avant 2015 dans la prochaine génération de puces mobiles de Nvidia, nom de code « Parker » - Parker devrait à la fois apporter le support du 64 bit et la gestion unifiée de la mémoire, couplée à la prochaine génération d’architecture graphique de Nvidia, nom de code « Maxwell ». Selon toute vraisemblance, la version 64 bit du Tegra K1, même si elle a été montrée sous forme de prototype au CES, ne devrait pas apparaître sur le marché avant le second semestre 2014. Selon Nvidia, les versions 32 et 64 bit de la puce partageront le même socket processeur.

Un ratio performances/consommation impressionnant

Concrètement, la puce K1 en version 32 bit devrait consommer environ 5 W et afficher un score SpecInt2000 de 5 600 et une performance GPU d’environ 365 Gflops. À titre de comparaison, 5 600 SpecInt2000 est un score équivalent à celui obtenu par deux Xeon 5355 à 2,66GHz d’il y a six ans, des puces qui unitairement consommaient 120 W TDP. Si les chiffres de Nvidia sont confirmés de façon indépendante, cela veut dire qu’un K1 approcherait les performances en calcul entier d’un Xeon E5 2400 d’entrée de gamme, ou celle d’un Xeon E3 1220L ( une puce qui consomme environ 20 W). Côté graphique, 365 Gflops sont environ équivalents au dixième de la performance d’une carte Tesla K20, une carte qui a elle seule affiche une consommation TDP de 220 W. Ces chiffres devront être confirmés lors de la disponibilité des puces, mais ils sont clairement prometteurs.

Avec de telles performances, le Tegra K1 n'aura aucune difficulté à motoriser les tablettes les plus performantes et il pourrait aussi servir de moteur à une nouvelle génération de portables à base de puce ARM fonctionnant sous Android. Dans sa version 64 bit, la puce devrait aussi permettre aux centres de calcul pionniers dans l'utilisation de CPU ARM (comme le Barcelona Supercomputing Center) de poursuivre leurs travaux en supplantant notamment les actuelles architectures à base de cartes mères Kayla. Il reste toutefois quelques inconnues comme l'existence ou la nature du bus d'interconnexion qui permettrait éventuellement d'interconnecter plusieurs puces sur une même carte mère (à l'origine Nvidia avait travaillé sur des concepts d'architecture à base de crossbar). 

 

 

Pour approfondir sur ARM