Serveurs : AMD veut se relancer avec ses Opteron Shanghai

Après plusieurs trimestres difficiles, AMD lance avec près d'un trimestre d'avance sa nouvelle génération de puces Opteron quadri-coeurs. Les nouveaux Shanghai affichent des performances en net progrès tout en réduisant la consommation par rapport aux Opteron de la génération Barcelona. En environnements virtualisés, ils affichent des performances dépassant de loin celles des meilleurs Xeon.

AMD a annoncé aujourd'hui le lancement de sa nouvelle génération de puces quadri-coeurs Opteron, la famille Shanghai, gravée en 45nm. Les Opterons Shanghai  ont pour mission de faire oublier la débâcle du lancement des Opteron Barcelona et de regagner une partie du terrain perdu par AMD sur le marché des serveurs x86 d'entreprise.

Performances en forte augmentation...

A l'origine attendus pour le premier trimestre 2009, les Opteron « Shanghai » arrivent avec près d'un trimestre d'avance sur les prévisions initiales d'AMD et à un niveau de performance qui leur permet de rivaliser avec les puces actuelles d'Intel en calcul entier et de les dépasser de façon marquée en calcul en virgule flottante. La nouvelle gamme arrive ainsi avec des fréquences de 2,3 à 2,7 GHz (contre 2 à 2,5 GHz pour Barcelona) tout en conservant une consommation identique aux modèles antérieurs. Selon AMD, les nouveaux Opteron affichent des performances environ 20% supérieures à celle d'un Barcelona à fréquence équivalente, ce qui se traduit par un gain évalué à 35% entre le plus rapide des Barcelona et le plus rapide des Shanghai. Le tout avec une consommation moyenne en baisse de 10% à plein régime et en recul de 35% à faible charge.

Pour réussir ce tour de force, AMD ne s'est pas contenté d'effectuer une réduction de design de Barcelona en 45nm. La firme a notamment triplé la taille du cache (avec un cache de niveau 3 partagé de 6 Mo) et amélioré sa gestion. Elle a aussi ajouté de nouvelles fonctions d'accélération de la virtualisation, de nouvelles fonctions de gestion d'énergie,  ainsi que le support du nouveau bus HyperTransport 3.0 (qui ne sera toutefois exploitable qu'à partir du premier trimestre avec l'arrivée d'un nouveau chipset AMD).

new shanghai

... et consommation en recul

AMD a particulièrement travaillé la gestion du cache dans Shanghai et notamment la gestion du prefetch (l'aptitude du processeur à transférer des données de la mémoire dans le cache de façon intelligente pour éviter que le processeur ne se retrouve à attendre des données et gaspille des cycles d'horloge à ne rien faire). Ces travaux d'optimisation, ainsi que le triplement du cache de niveau 3 participeraient à près de 10 à 15% des gains annoncés par AMD. Une nouvelle fonction associée à la gestion des caches contribue aussi de façon importante aux gains annoncés par AMD en matière de consommation. Baptisée Smart Fetch, elle permet en fait de vider le contenu des caches de niveau 1 et niveau 2 associé à un coeur non utilisé pour le basculer dans le cache de niveau 3 afin d'éteindre complétement l'alimentation électrique du coeur. Le tout se fait automatiquement en quelques nanosecondes et permet selon AMD de réduire la consommation de près de 21% 

Des performances élevées en environnements virtualisés

Une autre amélioration apportée par Shanghai porte sur la gestion des environnements virtuels. Selon AMD le temps de bascule entre VM est considérablement réduit avec Shanghai grâce à une réduction de 25% du « World Switch Time » au sein du processeur. De même des améliorations ont été apportées dans la gestion des TLB (Transition Look-Aside Buffer), ce qui devrait aussi doper les performances en environnements virtualisés. Pour avoir uen idée des gains en situation réelle, Dell à passé les nouveaux processeurs au benchmark Vmmark de VMWare. Les résultats sont impressionnants : Un Dell R905 équipé de quatre puces quadri-coeurs « Shanghai » à 2,7 GHz obtient un score de 20,35@14tiles soit mieux qu'un serveur Dell R900 quadri-socket Xeon hexa-coeurs à 2,66 GHz, crédité lui de 18,49@14Tiles.

Non seulement le nouveau R905 affiche des performances en hausse de 33% par rapport au score réalisé par un R905 à base de puces Barcelona, mais il se permet aussi de battre un serveur Intel à 24 coeurs qui consomme sensiblement plus que lui. La meilleure nouvelle pour AMD est que sur sur le terrain des quadri et octo-socket, Intel n'aura aucune riposte crédible avant la fin 2010. D'ici là AMD aura encore amélioré ses performances au premier trimestre 2009 avec l'arrivée de modèles SE de Shanghai (consommant 105W au lieu de 75W) cadencés à 2,9 GHz.

Sur le terrain des serveurs bi-socket en revanche, Shanghai ne devrait offrir à AMD qu'un court répit sur les puces d'Intel. Ce dernier devrait en effet profiter du premier trimestre 2009 pour lancer ses nouveaux Xeon à architecture Nehalem et reprendre l'avantage sur le terrain des performances.

Hypertransport 3.0 et virtualisation des entrées sorties au début 2009

Notons toutefois qu'AMD conserve un dernier atout dans sa manche. Pour l'instant, tous les résultats de performances des Opteron Shanghai sont obtenus avec des chipsets qui ne supporte pas le nouveau bus point à point Hypertransport 3.0. Or AMD devrait lancer son premier chipset intégré pour serveur intégrant cette technologie, l'AMD SR5690, au premier trimestre 2009. Les serveurs Opteron Shanghai pourraient alors voir leurs performances revues à la hausses. Le SR5690 apportera une autre technologie très attendue, le support de la virtualisation des entrées/sorties au travers de l'ajout d'une unité dédiée à la de gestion des entrées sorties en environnement virtualisé (IOMMU).

Dès à présent AMD annonce la disponibilité de cinq modèles pour serveurs bi-socket et de quatre modèles pour serveurs à quatre socket et plus. Ces puces devraient rapidement remplacer les Opteron Barcelona au sein des gammes de Dell, Fujitsu-Siemens, HP, IBM et Sun. Les Opteron 2376, 2378, 2380, 2382 et 2384 sont respectivement cadencés à 2,3, 2,4, 2,5, 2,6 et 2,7 GHz et coûtent 377$, 523$, 698$, 873$ et 989$ par quantité de mille. Les Opteron 8378,8380,8382 et 8384 sont quant à eux vendus 1165$, 1514$, 1865$ et 2149$.  Des versions à bas voltage (HE) et à plus forte fréquence (SE) devraient arriver au premier trimestre avec vraisemblablement une fréquence maximum de 2,9 GHz pour les version SE.

roadmapopteron

Pour approfondir sur Processeurs et composants