Processeurs : AMD répond au Xeon 6P avec l’Epyc 9005
Le nouveau processeur d’AMD pour serveurs se décline en une trentaine de modèles, dont un en 128 cœurs qui coûte deux fois moins cher que la puce d’Intel en 128 cœurs et un autre en 64 cœurs qui serait de puissance similaire.
Quelques jours seulement après le lancement du Xeon 6P « Granite Rapids » par Intel, AMD dévoile son concurrent, le processeur Epyc 9005, alias « Turin ». Pour le dire très rapidement, face à un Xeon 6980P de 128 cœurs, cadencé entre 2 et 3,2 GHz, qui consomme 500W et coûte près de 25 000 dollars l’unité, AMD propose un Epyc 9755 de 128 cœurs, cadencé entre 2,7 et 4,1 GHz qui consomme 500W, aussi, mais coûte près de 13 000 dollars.
On peut déjà tirer trois premiers constats. Donc, non, la nouvelle technologie de gravure « Intel 3 » (5 nm) ne rivalise pas encore avec la finesse de gravure en 4 nm des usines TSMC dont bénéficie AMD, puisque les Epyc 9005 supportent des fréquences bien plus élevées que le Xeon 6P à quantité de cœurs égale.
Non, réduire la finesse de gravure ne permet plus de maintenir la consommation énergétique à taille égale de circuits. Ces deux processeurs ont des circuits qui mesurent sensiblement la même chose que leurs prédécesseurs, mais ils consomment 1,4 fois plus qu’eux (350W).
Et, oui, nous nous dirigeons bien de nouveau vers une croissance de la demande pour les processeurs Epyc, car ils coûtent encore deux fois moins cher. Mais il est probable que la majorité des clients achèteront in fine des serveurs à base de Xeon, car ils seront, comme d’habitude, plus disponibles.
Jusqu’à 192 cœurs pour les modèles Zen 5c
Précisons qu’AMD annonce aussi un Epyc 9965 à 192 cœurs (gravés en 3 nm, eux), qui consomme aussi 500W et coûte près de 15 000 dollars. Mais celui-ci n’a pas les mêmes cœurs. On y trouve des cœurs Zen 5c plus économiques que les cœurs Zen 5 tout courts qui équipent la puce à 128 cœurs. La différence est dans la mémoire cache. Les cœurs Zen 5 sont réunis en grappes de 8 cœurs qui se partagent un cache L3 de 32 Mo, tandis que les cœurs Zen 5c sont réunis en grappes de 16 cœurs autour du même cache de 32 Mo.
In fine, l’Epyc 9755 en 128 cœurs Zen 5 bénéficie de 512 Mo de cache L3 (504 Mo sur le Xeon 6980P), tandis que l’Epyc 9965 en 192 cœurs Zen 5c n’a que 384 Mo de cache L3. Accessoirement, les cœurs Zen 5c fonctionnent aussi à des vitesses environ 20 % moins élevées. L’Epyc 9965 est ainsi cadencé entre 2,25 et 3,7 GHz.
La distinction entre les usages des Epyc 9005 à base de cœurs Zen 5 et ceux à base de cœurs Zen 5c n’est pas très claire. Les deux variantes sont capables d’exécuter chacune deux Threads par cœur et elles disposent chacune du jeu d’instruction AVX512 qui accélère les algorithmes complexes de l’IA.
Chez Intel, on trouve aussi deux variantes de processeurs Xeon 6 : les 6P ont des cœurs similaires aux Zen 5, tandis que les 6E ont des cœurs dépourvus d’accélérations pour l’IA et ne peuvent exécuter qu’un thread à la fois. La distinction est plus claire : les Xeon 6700E (144 cœurs) et 6900E (288 cœurs) sont destinés à l’exécution massivement parallèle d’applications web de base chez les hyperscalers, alors que toutes les variantes de Xeon 6P sont taillées pour les applications nécessitant de la performance. À commencer par celles que les entreprises exécutent dans leurs propres datacenters.
Une trentaine de modèles, dont le surpuissant 9575F à 64 cœurs
Dans le détail, AMD décline son nouvel Epyc en une trentaine de modèles, avec plus ou moins de circuits de 8 ou 16 cœurs, lesquels ont plus ou moins de cœurs fonctionnels.
Dans la famille des cœurs Zen 5, on trouve ainsi en entrée de gamme les 9135 et 9175 F qui proposent tous deux 16 cœurs, mais le premier vaut un peu plus de 1 200 $ quand le second vaut 3,5 fois plus cher (4 256 $).
Et pour cause : le 9135 a 2 circuits de 8 cœurs fonctionnels, cadencés entre 3,65 et 4,3 GHz, qui totalisent 64 Mo de cache et consomment 200 W. Le 9175F a 16 circuits, comme le haut de gamme 9755, mais un seul cœur est fonctionnel dans chacun d’eux. Cela lui permet d’afficher un cache L3 de 512 Mo, pour une consommation de 320 W. Le fait de n’avoir qu’un cœur fonctionnel par circuit de 8 permet aussi au 9175F de grimper dans les fréquences : elles vont de 4,2 à 5 GHz.
Précisons que le plus petit modèle est le 9015, avec 2 circuits comprenant chacun 4 cœurs fonctionnels, soit 8 cœurs et 64 Mo de cache L3, cadencés entre 3,6 et 4,1 GHz, pour une consommation de 125 W et un prix de 527 dollars.
Parmi toutes les variantes possibles de puces à base de cœurs Zen 5, AMD met plus particulièrement en avant l’Epyc 9575F, un modèle 64 cœurs, comprenant 8 circuits de 8 cœurs fonctionnels qui totalisent 256 Mo de cache L3. Il a le mérite de grimper très haut en fréquence, de 3,3 à 5 GHz, ce qui en ferait le processeur le plus puissant pour exécuter les calculs qui nécessitent le plus de performances, dont l’IA. Il consomme 400 W et coûte 11 800 dollars.
On ne sait quel crédit il est encore possible d’accorder aux mesures de performances publiées par AMD et Intel, qui démontrent chacune que les processeurs de l’un sont meilleurs que ceux de l’autre. En revanche, quelques tests comparatifs indépendants ont été réalisés par notre confrère Tom’s Hardware, avec des outils Open source pour l’IA, le supercalcul, la compilation de code ou encore l’encodage de médias.
Selon ceux-ci, l’Epyc 9575F à 64 cœurs aurait des performances globalement équivalentes au tout dernier Xeon 6980P à 128 cœurs, le plus haut de gamme des nouveaux processeurs serveur d’Intel. Cela dit, ces mêmes tests suggèrent que l’Epyc 9755 en 128 cœurs n’améliorerait pas de beaucoup les performances de son petit frère en 64 cœurs.
Pour leur part, les modèles avec cœurs Zen 5c sont au nombre de cinq et se situent tous dans le haut de gamme. Outre l’Epyc 9965 évoqué plus haut et qui dispose de 12 circuits de 16 cœurs, on trouve :
- Epyc 9645 : 12 circuits de 8 cœurs fonctionnels, soit 96 cœurs et 384 Mo de cache L3, cadencés entre 2,3 et 3,7 GHz, pour une consommation de 320W et un prix de 11 000 dollars
- Epyc 9745 : 8 circuits de 16 cœurs fonctionnels, soit 128 cœurs et 256 Mo de cache L3, cadencés entre 2,4 et 3,7 GHz, pour une consommation de 400W et un prix de 12 140 dollars
- Epyc 9825 : 12 circuits de 12 cœurs fonctionnels, soit 144 cœurs et 384 Mo de cache L3, cadencés entre 2,2 et 3,7 GHz, pour une consommation de 390W et un prix de 13 000 dollars
- Epyc 9845 : 10 circuits de 16 cœurs fonctionnels, soit 160 cœurs et 320 Mo de cache L3, cadencés entre 2,1 et 3,7 GHz, pour une consommation de 390W et un prix de 13 560 dollars
Génération CXL 2,0
Toutes les variétés d’Epyc 9005 sont montées dans la même puce qui dispose, en son centre, d’un contrôleur PCIe 5.0 et d’un contrôleur mémoire offrant 6 canaux DDR5, soit une capacité de 6 To par socket (12 To de RAM par serveur biprocesseur). On notera qu’un Epyc 9005 accède à 128 voies PCIe 5.0, mais deux Epyc 9005 montés ensemble dans le même serveur ne peuvent accéder qu’à un total de 160 voies, chacun utilisant dès lors 48 voies PCIe pour communiquer avec l’autre.
Le socket des Epyc 9005 est au format SP5, déjà utilisé par les Epyc 9004 de la génération précédente.
Comparativement, les derniers Xeon 6P ont accès à 136 voies PCIe 5.0 quand ils sont seuls dans le serveur et 96 voies quand ils partagent la carte mère avec d’autres. Pour mémoire, un GPU consomme 16 liens PCIe et un SSD NVMe en consomme actuellement 2, ou 4 s’il agit d’une nouvelle génération en NVMe 2.0.
Un point commun des derniers Xeon 6P et Epyc 9005 est que leurs bus PCie 5.0 sont utilisables en CXL 2.0. Sorte de réseau ultrarapide, le CXL 2.0 permet de placer les cartes d’extension, les SSD NVMe et même la RAM du serveur sur une machine distante. Cette fonctionnalité pourrait être déterminante pour bâtir des clusters d’IA à la modularité inédite. Les anciens Xeon 5 et Epyc 9004 ne prenaient en charge que le protocole CXL 1.1, lequel ne fonctionne bien qu’avec des SSD NVMe distants.