Serveurs 4 voies : L'Opteron reprend le dessus sur les Xeon
Avec le lancement de sa nouvelle génération de puces quadri-coeurs Opteron "Shanghai", AMD a repris le dessus sur les puces multiprocesseurs d'Intel. Dans des serveurs quadri-socket, les nouveaux Opteron 8384 apportent un gain de performance de près de 35% par rapport aux plus véloces des Opteron Barcelona. De quoi dépasser les Xeon dans la plupart des benchmarks et de quoi battre les serveurs Intel dans tous les compartiments au rapport performance/prix et au rapport performance/watt.
En lançant ses nouveaux Opteron « Shanghai » le 13 novembre dernier, AMD a repris l'avantage sur Intel sur le marché des serveurs quadri-processeurs et au-delà. Alors que le fondeur texan doit encore livrer les versions les plus rapides de ses Opteron (et notamment le 8386 SE à 2,9 GHz), le plus véloce des Opteron Shanghai disponible sur le marché, le 8384 fait souvent mieux que le plus véloce des Xeon MP du moment, le X7460 à 2,66 GHz, une puce pourtant bien plus gourmande en énergie (plus de 130W contre 75 W) et qui dispose de 6 coeurs contre 4 pour les Opteron de la génération Shanghai.
Les résultats des premiers benchmarks réalisés par les grands constructeurs du marché avec leurs derniers serveurs quadri-socket, confirment largement les annonces d'AMD lors du lancement de Shanghai, à savoir des performances de 30 à 35% en hausse par rapport à celles des Opteron Barcelona, et encore, les machines actuelles ne tirent pas parti du bus Hypertransport 3.0 supporté par les nouveaux Opteron, mais qui ne sera activé qu'avec une nouvelle génération de Chipset, dont le futur SR5690, qui apportera aussi, entre autres améliorations le support, de l'ajout à chaud pour les carte PCI-express ainsi que la virtualisation d'entrées/sorties (IOMMU en langage AMD).
Calcul : AMD reste en retrait d'Intel sauf en flottant
Historiquement les Xeon ont toujours dominé les Opteron en calcul entier et AMD a toujours été compétitif en calcul en virgule flottante. L'avènement des Shanghai ne change rien à l'ordre des choses mais le dernier né d'AMD réduit considérablement l'écart avec les Xeon. Afin de maintenir des comparaisons valides nous avons retenu pour cette partie les résultats au test SPEC CPU 2006 de quatre serveurs quadri-processeur, signés Dell, IBM et Sun.
Ces résultats montrent que l'Opteron 8384 est environ 20% plus lent que le Xeon 7460 en calcul entier mais qu'il fait quasiment jeu égal en virgule flottante. Il prend même sensiblement le dessus en CFP 2006 Rate, un benchmark sensible à la bande passante mémoire, puisqu'à ce test, il se montre 36% plus rapide qu'un Xeon 7460. Il est à noter que l'Opteron 8384 affiche des résultats environ un tiers plus élevés que ceux du plus rapide des Opteron de la génération « Barcelona », le 8360SE
AMD champion du test SpecJbbb 2005 et de la virtualisation
Au test Spec Jbb 2005, qui mesure les aptitudes des serveurs à l'exécution d'applications Java, le dernier né d'AMD prend clairement l'avantage sur les serveurs à base de Xeon. Un serveur lame IBM BladeCenter LS42 équipé de quatres puces Opteron 8384 à 2,7 GHz réalise ainsi un score de 721843 bops, contre 531669 bops pour le plus rapide des serveurs quadri-socket Xeon, un Sun Fire X4450 équipé de quatre puces Xeon 7460. Avec une puce consommant nettement moins d'énergie que celle d'Intel et, surtout, avec 8 coeurs de moins dans la machine, le serveur d'IBM réussit l'exploit d'être 35% plus rapide que celui de Sun, tout en étant moins cher. La preuve que dans certains contexte applicatifs, Intel n'est pas forcément le meilleur choix.
Ce constat est d'autant plus vrai en environnement virtualisé. Les résultats obtenus par l'Opteron 8384 au test VMmark de VMware sont ainsi impressionnants : un Dell PowerEdge R905 équipé de quatre puces quadri-coeurs Opteron 8384 obtient un score de 20,35@14tiles tandis qu'une lame HP Proliant BL685c équipée de façon similaire atteint 19,96@14tiles. En face, les serveurs Xeon hexa-coeurs font grise mine : un serveur Dell PowerEdge R900 équipé de quatre Xeon X7460 à 2,66 Ghz n'est ainsi crédité que de 18,69@14Tiles tandis qu'un IBM System x3850 M2 avec son chipset maison obtient 19,10@14tiles, un score bien meilleur mais qui n'est obtenu qu'au prix d'un coût sensiblement supérieur.
Plus généralement, les serveurs Opteron 8384 sont sensiblement moins chers que ceux équipés de puces Intel. Chez Dell, un R905 configuré de façon similaire à un R900 coûte environ 2500 € moins cher (env. 15500€ contre env. 18000 €). Et c'est sans compter avec les économies que générera dans le temps la consommation très inférieure du R905 par rapport au R900.
TPC-C : Intel plus véloce, AMD champion du rapport performance/prix
Au benchmark transactionnel TPC-C, Intel conserve un léger avantage en matière de performances, mais perd désormais la bataille performances/prix. L'arrivée prochaine du 8386 SE pourrait qui plus est lui faire perdre sa couronne. Un HP Proliant DL 585 G5 équipé de puces Opteron 8384 obtient ainsi un score de 579 814 TpmC à un coût par transaction de 0,96$, tandis que le concurrent immédiat chez le même constructeur, le HP Proliant DL580 G5 équipé de quatre puces Xeon X7460, obtient un score de 634 825 TpmC pour un coût par transaction de 1,1$. Ce coût plus élevé reflète le surcoût des serveurs à base de puces Intel par rapport à celui des machines à base de puces Opteron. Si l'on normalise les scores en divisant le nombre de transactions par le prix, le serveur HP à base de puces Opteron l'emporte sur son homologue Intel.
Si seules les performances comptent, un autre serveur à base de puces X7460 se montre bien plus impressionnant que celui d'HP, le System x3850 M2 d'IBM. Avec 684 058 TpmC, cette machine devance de loin les serveurs à base de puces Opteron. Mais ce résultat est obtenu au prix d'une dépense surréaliste. Ainsi le x3850 M2 configuré avec la même quantité de mémoire que le Proliant DL585 est environ 3 fois plus cher que son concurrent. Et c'est sans compter avec le prix du système de stockage utilisé par IBM pour le test. Résultat: le score hors norme du x3850 M2 se traduit par un coût au TpMC de 2,58$, digne du coût par transaction d'un serveur Unix haut de gamme chez IBM...
Terminons ce tour d'horizon des performances comparées des Xeon et des Opteron avec un aperçu des résultats au benchmark SAP SD de SAP. Un aperçu, car le dernier né des Opteron n'y apparaît qu'en configuration octo-sockets. A ce jour, aucun constructeur n'a encore testé de machine quadri-sockets à base d'Opteron 8384. Le benchmark apporte toutefois des résultats instructifs. En configuration octo-socket, un Opteron 8384 se montre ainsi environ 35% plus rapide qu'un Opteron 8360SE. Une projection sur ces bases indique qu'un serveur quadri-sockets DL585 G5 devrait approcher un score de 25600 SAPS et donc s'approcher du score réalisé par l'IBM System x3850 M2 d'IBM pourtant bien plus coûteux. Plus important pour AMD, la machine d'IBM devrait logiquement être dépassée en performance par le futur Opteron 8386SE attendu au premier trimestre.
Ces résultats sont d'autant plus importants pour le fondeur texan qu'Intel ne disposera d'aucune alternative aux Opteron Shanghai avant la fin de l'année 2009. AMD est donc certain de continuer à dominer le segment des serveurs quadri-socket sur l'année à venir. Dans une moindre mesure, l'arrivée des Opteron Shanghai permet à AMD de bénéficier d'un répit sur le marché des serveurs bi-socket, où son dernier-né n'est pas non plus ridicule. Mais les vrais ennuis pour AMD sur ce segment commenceront au second trimestre 2009 avec l'arrivée en volume des serveurs Intel équipés des nouveaux Xeon Nehalem. Des puces dont les performances devraient être impressionnantes et contre lesquels AMD n'aura aucune parade avant le dernier trimestre 2009 et le lancement de ses puces Opteron hexa-coeurs « Istambul ».