Cet article fait partie de notre guide: Accélérateurs : les GPUs, DPUs et autres architectures serveur en 2023

Informatique embarquée : Nvidia livre sa feuille de route

Les Jetson, des cartes similaires aux Rapsberry Pi, intégreront bientôt l’architecture du précédent GPU Ampere. Une carte pour automobiles, Drive, arrivera d’ici à 2025 avec le nouveau GPU Hopper et le processeur Grace.

par

Yann Serra, LeMagIT

Publié le: 28 sept. 2022

Après les cartes graphiques grand public et les accélérateurs pour data centers, Nvidia part à la conquête des équipements embarqués. Le constructeur a dévoilé lors de son récent événement GTC 2022 une nouvelle famille IGX de mini cartes mères, et annoncé une mise à jour de ses gammes Jetson et Drive, deux catégories de produits plus ou moins passées sous les radars jusque-là, mais qu’il entend bien faire sortir de la confidentialité.

Les Jetson sont l’équivalent chez Nvidia des Raspberry Pi. Ce sont de minuscules cartes dont il existe trois modèles – AGX de 10 x 8,7 cm, NX et Nano toutes deux de 7 x 4,5 cm – et qui sont censées s’installer dans tous types de designs d’appoint pour collecter des données, en produire, ou encore piloter des engins robotisés via leur bus GPIO.

La nouveauté concerne une mise à jour de la carte Nano. Elle était la dernière à reposer sur l’ancienne électronique Xavier. Elle bénéficiera à présent de la même architecture Orin que ses deux grandes sœurs dont les mises à jour ont été annoncées six mois plus tôt. L’architecture Orin correspond essentiellement à une puce qui intègre un GPU de type Ampere (c’est-à-dire les mêmes cœurs que ceux de l’A100) et un processeur ARM Cortex A78AE. À l’heure actuelle, seule la carte Jetson Orin AGX est disponible. La NX arrivera en décembre et la Nano début 2023.

Les Drive sont des cartes destinées à être intégrées dans les automobiles, aussi bien pour seconder le conducteur (analyse des données issues de capteurs, pilotage plus ou moins autonome du véhicule) que pour le confort à bord (écrans, GPS, communications, « ambiance audio immersive », etc.).

La première génération de cartes Drive, également basée sur l’architecture Orin, n’intègre que cette année les chaînes de montage des véhicules de quelques constructeurs, aussi avant-gardistes que méconnus en Occident : le Chinois Hozon Auto, le Chinois IM-SAIC, le Chinois Li Auto, le Chinois XPENG Motors. On trouve tout de même dans la liste le Suédois Volvo, racheté en 2009 par le Chinois Zhejiang Geely, et le Britannique Lotus, racheté en 2017 par le Malaisien Proton. La prochaine génération présentée lors du GTC 2022 repose sur un design baptisé Thor et ne devrait pas être livrée aux usines des constructeurs automobiles avant 2025.

Les cartes IGX, enfin, correspondent à une nouvelle famille de cartes destinées aux équipementiers dans le monde industriel ou celui de la santé. Elle est censée incarner, éventuellement dans une appliance dédiée, la partie électronique de machines-outils ou de robots de chirurgie, pour leur apporter analyse visuelle et pilotage des bras articulés. La première génération reposera, là encore, sur l’architecture Orin.

Concevoir des designs d’appoint avec la gamme Jetson

La nouvelle carte Jetson Orin Nano aura exactement la même apparence de module SO-DIMM 260 broches que la carte Jetson Orin NX, mais elle présentera l’avantage de consommer moins d’énergie : de 5 à 15 watts, contre de 10 à 25 watts pour sa grande sœur.

Photo de la carte Jetson Orin Nano. — La carte Jetson Orin Nano.

Le format « module SO-DIMM », d’apparence similaire aux barrettes de mémoire SO-DIMM utilisées dans les ordinateurs portables, a été popularisé dès 2014 par la communauté Raspberry Pi pour façonner des designs minimalistes. Le principe est de pouvoir enficher toute la puissance de calcul sur des cartes dessinées par des équipementiers spécialisés dans un domaine. Les cartes de ces équipementiers comprennent, elles, tous les connecteurs vers les applications visées : communication (série, réseau), entrées analogiques ou numériques, sorties vidéo ou broches électriques pour piloter des moteurs.

Parmi les équipementiers cités par Nvidia, on trouve les noms de Canon (produits optiques), Thyssenkrupp Elevator (ascenseurs), John Deere (matériels et véhicules agricoles), Teradyne (appareils de mesure pour l’industrie). 2 000 startups seraient inscrites à son programme développeurs.

Le format SO-DIMM est si populaire parmi les équipementiers que la communauté Raspberry Pi a annoncé en avril dernier relancer la fabrication d’un Compute Module Pi 4S qui reprend ses dimensions et son slot edge (« connecteur bord de carte », en français) tellement caractéristiques. La communauté Raspberry Pi avait songé à abandonner ce design en 2020 à l’occasion du lancement de son Compute Module Pi 4, au format « Mezzanine » qui se clipse au-dessus d’une carte d’entrées-sorties à la manière d’un processeur qu’on enfonce dans le socle idoine sur une carte mère. Pour autant, peu d’équipementiers ont suivi ce design plus contraignant.

Cela dit, l’appellation « module SO-DIMM » est trompeuse. En aucun cas, le connecteur des Raspberry Pi Compute Module ni celui des Jetson Nano et NX n’est compatible avec les vrais slots de barrettes SO-DIMM dans les PC portables. D’ailleurs, la position du détrompeur, différente à chaque fois, empêche les modules des uns de s’insérer dans les slots des autres.

Si la Jetson Orin Nano consomme moins d’énergie que la Jetson Orin NX, c’est parce que son électronique sera plus modeste. Dans la puce de la Jetson Orin Nano se trouve un processeur ARM avec 6 cœurs Cortex A78AE (64 bits v8.2), 1,5 Mo de cache L2 et 4 Mo de cache L3 à 1,5 GHz, ainsi qu’un GPU Ampere à 625 MHz, avec soit 512 unités CUDA et 16 unités Tensor Cores, soit 1 024 unités CUDA et 32 unités Tensor Cores.

Deux versions de la carte existeront en effet : la moins puissante aura un bloc de 4 Go de RAM LPDDR5 monté sur un bus 64 bits (34 Go/s), la plus puissante en aura deux. Cette carte devrait coûtait dans les 200 € à sa sortie. La puissance de calcul de ces cartes sera respectivement de 20 et 40 TOPS, une unité de mesure propre à Nvidia.

La Jetson Orin NX existera elle aussi en deux versions, l’une avec deux blocs RAM de 4 Go (donc 8 Go sur un bus 128 bits) et l’autre avec quatre blocs RAM de 4 Go (soit 16 Go, mais toujours sur un bus 128 bits). La version d’entrée de gamme aura le même processeur que la Nano, mais avec une fréquence qui grimpe à 2 GHz. La version haut de gamme aura 8 cœurs et un cache L2 de 2 Mo ; il faut compter 256 Ko de cache L2 par cœur sur ce processeur.

Les deux versions auront un GPU Ampere avec 1 024 unités CUDA et 32 unités Tensor Cores, mais à la fréquence de 765 MHz pour la version 8 Go de RAM et de 918 MHz pour celle en 16 Go de RAM. Nvidia attribue à ces machines des indices de performance de 70 et 100 TOPS.

Jetson Orin AGX pour le développement et des designs moins intégrés

À côté de ces cartes au format SO-DIMM, la Jetson Orin AGX adopte un format mezzanine plus imposant, de 10 x 8,7 cm, qui se clipse au-dessus d’une carte d’entrée sortie via un socle de 699 broches et qui intègre son propre stockage sous la forme d’une mémoire Flash eMMC de 64 Go.

Photo de la carte Jetson Orin AGX. — La carte Jetson Orin AGX.

Les caractéristiques de ses deux versions sont à l’avenant. En entrée de gamme, la carte a 32 Go de RAM sur un bus 256 bits, un GPU à 930 MHz comprenant 1 792 unités Ampere CUDA, 56 unités Tensor Cores et un processeur similaire à celui de l’Orin NX, mais à la fréquence de 2,2 GHz. Son indice de performance est de 200 TOPS. En version haut de gamme (celle qui atteint 275 TOPS), le GPU grimpe à 2 048 unités CUDA, 64 unités Tensor Cores et une fréquence de 1,3 GHz. Le processeur ARM passe quant à lui à 12 cœurs, 3 Mo de cache L2 et 6 Mo de cache L3. La RAM atteint 64 Go, mais toujours sur un bus 256 bits.

Pour développer des applications sur ces cartes, Nvidia propose un kit de développement à environ 3 500 € qui comprend une carte Jetson Orin AGX haut de gamme enfichée sur une carte d’entrée-sortie avec tous les ports informatiques conventionnels, et montée dans un petit boîtier qui rappelle furieusement les kits prêts à l’emploi des Raspberry Pi ou des Intel NUC. La machine fonctionne sur un système Ubuntu.

Nvidia indique par exemple que ces cartes sont plus ou moins capables de numériser ou de produire des flux vidéo. La petite Nano supporte d’enregistrer un flux en 1080p à 30 images par seconde, tandis que la grande AGX peut en numériser 16 en même temps. La petite Nano peut diffuser entre un flux 4K à 60 FPS et 11 flux 1080p en 30 FPS, tandis que la grande AGX fait deux à trois fois mieux.

IGX, comme une carte Jetson Orin AGX déjà montée dans un serveur

Tout juste annoncée, mais pas vraiment détaillée, la première des cartes IGX – Orin IGX, sans le « Jetson » devant – semble finalement n’être qu’une carte Jetson Orin AGX déjà assemblée sur une carte d’entrée-sortie. Sur le plan des performances, on sait qu’elle sera strictement identique à la Jetson Orin AGX haut de gamme. Nvidia donne le même indice de puissance, soit 275 TOPS.

Photo de la solution IGX complète. — La solution IGX complète.

Selon les images et les informations présentées à la presse, il s’agira d’une carte contenant le processeur, le GPU et la RAM clipsée sur une carte mère classique pour un PC, avec des connecteurs Ethernet, USB et PCIe. Fait notable, cette carte mère embarquera un contrôleur réseau ConnectX-7. Ce contrôleur, que l’on retrouve dans les offres data centers de Nvidia est un SmartNIC ou, plus précisément, un DPU Bluefield de Nvidia (sans doute la version 2) qui accélère le réseau en décodant les trames TCP/IP et en triant les paquets de données à la place du processeur.

Ce design fait furieusement penser aux serveurs DGX que Nvidia propose pour les datacenters. Ils consistent à clipser huit cartes GPU A100 ou, désormais, H100, sur une carte mezzanine dotée d’autant de connecteurs SXM et elle-même connectée à une carte mère x86 traditionnelle. Dans le cas de l’IGX, il s’agirait de l’installer dans une appliance, à côté d’une machine ou d’un appareil qui sont déjà capables de communiquer en Ethernet, ou qui sont pilotables en USB.

La comparaison avec les serveurs DGX a d’autant plus de sens que Nvidia annonce qu’une série de fabricants de serveurs en marque blanche pour l’embarqué (Yuan, Advantech, ADLink, ProDrive, etc.) a déjà signé pour implémenter le design de l’IGX. Dans le cas des serveurs DGX, les clones s’appellent des machines HGX.

Thor, l’architecture avec GPU Hopper et CPU Grace qui succédera à Orin

L’architecture Orin de toutes ces cartes embarque dans la puce principale des circuits GPU Ampere. Ce sont les circuits que l’on trouve depuis 2020 dans les cartes GPU Nvidia A100 des data centers, ainsi que dans les cartes graphiques GeForce et RTX de la série 3000. Entretemps, Nvidia a mis au point deux autres designs : Hopper, qui arrive ces jours-ci dans de nouvelles cartes GPU H100 pour datacenters, et Ada Lovelace, que l’on retrouvera bientôt dans les cartes graphiques GeForce et RTX de la série 4000.

Hopper est plutôt spécialisé dans l’interprétation des images et des sons captés par les caméras et les micros, alors qu’Ada Lovelace accélère les rendus 3D. Mais tous deux comprennent des unités Tensor Cores pour accélérer les traitements d’apprentissage automatique.

Photo de la carte Drive Thor. — La carte Drive Thor.

La prochaine génération de cartes Drive, destinées à être embarquées dans les automobiles, reposera sur l’architecture Thor. Celle-ci succède à Orin en implémentant, a priori, un GPU Hopper. L’intérêt de ce GPU est qu’il dispose de circuits Transformation Engines (ou Transformer Engines, Nvidia passe d’un vocable à l’autre dans sa communication) qui accéléreront d’un facteur 9 les prises de décision automatiques du véhicule.

La puissance de traitement d’une carte Drive Thor serait de 2 000 TFLOPS, alors que celle de l’actuelle Drive Orin est de 254 TOPS, peu ou prou comme la carte Jetson Orin AGX.

Mais il y a mieux. Dans l’architecture Orin, le processeur ARM a des cœurs Cortex A78 qui correspondent juste au design standard d’ARM. Dans l’architecture Thor, la partie processeur sera incarnée par le CPU Grace que Nvidia met au point depuis ces derniers mois et qui devrait intégrer 72 cœurs. L’intérêt d’avoir autant de cœurs est qu’il permet à la carte Drive d’exécuter plusieurs environnements fonctionnels très différents dans le véhicule.

« La capacité de la carte Drive Thor à virtualiser plusieurs environnements informatiques est particulièrement intéressante. Cela signifie que nous allons pouvoir consolider sur une seule carte électronique à la fois le pilotage excessivement performant de la voiture, mais aussi tout ce qui a trait à l’expérience utilisateur des passagers. Et, ce, en consommant un minimum d’énergie », a déclaré Zhang Xiong, le vice-président du constructeur automobile chinois GAC Aion, lors de l’événement GTC 2022.

En pratique la puce qui prendra place sur la carte Drive Thor devrait être l’un des « Superchips » que Nvidia met actuellement au point pour les serveurs des datacenters. Un Superchip comprend soit un GPU H100 et un processeur Grace, soit deux processeurs Grace. Dans les deux cas, les deux circuits communiquent via un bus NVLink-C2C qui permet aux cœurs GPU et CPU de communiquer entre eux à la vitesse de 900 Go/s.

La carte Drive en elle-même revient à une carte Jetson AGX/IGX pourvue de tous les connecteurs nécessaires pour communiquer avec les éléments du véhicule. En toute logique, l’architecture Thor se déclinera en cartes Jetson d’ici à 2025.

Informatique embarquée : Nvidia livre sa feuille de route

Les Jetson, des cartes similaires aux Rapsberry Pi, intégreront bientôt l’architecture du précédent GPU Ampere. Une carte pour automobiles, Drive, arrivera d’ici à 2025 avec le nouveau GPU Hopper et le processeur Grace.

Concevoir des designs d’appoint avec la gamme Jetson

Jetson Orin AGX pour le développement et des designs moins intégrés

IGX, comme une carte Jetson Orin AGX déjà montée dans un serveur

Thor, l’architecture avec GPU Hopper et CPU Grace qui succédera à Orin

Pour approfondir sur Mini serveurs, Edge Computing

Le cloud OCI achète déjà 130 000 exemplaires du dernier GPU d’AMD

Puces pour l’IA : AMD dévoile son GPU MI350X

Untether AI, Brium et Enosemi : les rachats d’AMD pour rattraper Nvidia

Dell dévoile les premiers serveurs Blackwell pour l’entreprise