IBM dévoile le Power10
Livré d’ici à un an dans les serveurs, le processeur qui succède au Power9 embarque 15 cœurs physiques capables de se comporter chacun comme 8 cœurs virtuels, pour une fréquence à plus de 4 GHz.
IBM vient de lever le voile sur son très attendu processeur Power10, le premier de cette famille à bénéficier d’une gravure en 7 nanomètres, grâce à une production dans les usines de Samsung. Cette nouvelle génération de puces apporte par ailleurs la technologie Memory Inception, qui supporte d’utiliser 2 pétaoctets (2 Po) de RAM installés en cluster, notamment pour mieux servir les applications de SAP et celles de SAS Institute.
« Le principe de Memory Inception est de faire croire à un serveur que la mémoire des autres serveurs est la sienne. Cela laisse quantité d’options aux administrateurs pour attribuer de la mémoire, qu’elle soit enfichée localement ou à l’autre bout d’un câble », explique Brian Thompto, l’un des architectes des processeurs Power.
Selon, lui, Memory Inception est une fonction bien plus sophistiquée que l’accès déjà existant vers la mémoire d’un autre serveur via un réseau Infiniband. Il ne s’agit plus d’aller récupérer ou stocker des données à une adresse, mais véritablement de permettre à un programme de s’exécuter dans un espace mémoire plus vaste et, ce, avec des notions de cache pour accélérer les transferts.
« A mon avis, Memory Inception présente un véritable intérêt pour les applications conçues en mode cloud. Ces applications sont par nature élastiques, sauf qu’augmenter leurs traitements sur une quantité de mémoire qui ne s’étend pas finit par faire chuter leurs performances. Ici, l’application peut accéder à des pétaoctets de RAM sans jamais souffrir de ralentissements », commente Patrick Moorhead, président et analyste principal de Moor Insights & Strategy.
Pour contourner le problème habituel de latence qui résulte du câblage entre deux serveurs, IBM a utilisé un câblage à courte portée, qui n'ajoute qu'une microseconde aux accès mémoire. En amont, ce réseau entre processeur repose sur un contrôleur PowerAXON, le bus OpenCAPI et le mécanisme mémoire Open Memory Interface, tous issus des travaux réalisés dans le cadre du standard OpenPower.
« HPE avait déjà tenté d’utiliser des clusters de mémoire il y a quelques années avec le projet The Machine, mais il s’agissait surtout de décomposer la mémoire en sous-ensembles physiquement séparés et avec des pénalités de latence. Notre approche consiste à faire l’inverse : nous avons la capacité de prendre la main sur des composants externes pour agréger plusieurs systèmes qui partagent leur mémoire », ajoute Brian Thompto.
120 CPU virtuels par socket
D’une manière plus globale, chaque Power10 sera doté dans un premier temps de 15 cœurs. Il est notable que la puce est gravée avec 16 cœurs, mais IBM, prudent, part du principe que les défauts inhérents aux premières séries de processeurs posent le risque qu’un certain nombre de composants sortent d’usine avec un cœur défectueux.
Chaque cœur dispose de 2 Mo de cache L2 et tous partagent un cache L3 de 120 Mo par socket. L’ensemble totalise 18 milliards de transistors, interconnectés sur 18 couches pour un die d’à peine 602 mm2. La fréquence, encore inconnue, devrait dépasser les 4 GHz. Il est à noter qu’IBM prévoit de décliner son Power10 dans un package DCM, un module qui embarque deux processeurs dans un seul composant. Dans ce cas, la fréquence devrait être limitée à 3,5 GHz et quelque.
Chaque cœur est capable d’exécuter huit threads en parallèle, ce qui revient à 8 CPU virtuels par cœur, soit 120 CPU virtuels par processeur, soit 240 CPU virtuels pour un serveur classique en bi-socket. IBM indique que le Power10 sera founi sur des machines pouvant grimper jusqu’à 16 sockets. Les serveurs qui utilisent la version DCM auront un maximum de 4 sockets.
Chaque cœur du Power10 dispose que quatre circuits arithmétique Matrix Math Accelerator qui, comparativement au FPU des cœurs Power9, exécutent 10 à 20 fois plus rapidement les fonctions d'inférence utilisées dans les algorithmes d’intelligence artificielle. En pratique, ce circuit Matrix Math Accelerator permettra d'obtenir des informations analytiques plus approfondies.
« Il est certain que le débit brut du Power10 offrira des performances supérieures à celles du Power9 et que, sur un cluster, la vitesse atteinte devrait vous permettre d’en avoir pour votre argent. Cependant, l’accélération ne devrait se sentir que sur la partie d’un cloud privé où sont installées ces machines. Le Power10 ne va pas nécessairement augmenter les performances d’un cloud hybride », pondère Jim McGregor, analyste chez Tirias Research.
Un chiffrement sans pénalité pour mieux sécuriser les containers
Le nouveau processeur est par ailleurs doté d'un chiffrement de la mémoire à la volée. Le Power10 est à ce titre doté de quatre fois plus de moteurs de chiffrement AES que le Power9, de sorte que cette fonction de sécurité n’impacte pas les performances.
« D’ordinaire, le chiffrement de la mémoire pénalise toujours les performances. Ici, nous parlons de chiffrement transparent, effectué par des circuits matériels dédiés, qui ne ralentissent en aucun cas l’exécution des logiciels par les cœurs », argumente Satya Sharma, le directeur technologique d’IBM Cognitive Systems.
Selon lui, ce chiffrement matériel présenterait l’opportunité de mieux sécuriser les containers, le format d’instance virtuelle de prédilection dans les applications conçues pour le cloud.
Accessoirement, les serveurs Power10 ont dans leur firmware des fonctions d’isolation et de protection pour les containers. En cas de corruption d’un container, ces fonctions s’assurent que les autres containers exécutés sur la même machine virtuelle ne soient contaminés.
Pour l’heure, AMD est en tête dans la course des processeurs gravés en 7 nm, avec la seconde génération de ses puces Epyc mise sur le marché il y a environ un an. Intel a annoncé en juillet qu'il reportait la livraison de sa puce 7 nm de six mois, soit une mise sur le marché qui pourrait ne pas avoir lieu avant fin 2022, voire début 2023. Le Power10 devrait arriver dans les serveurs d’ici à un an, avec un an d'avance sur son grand rival Intel, donc.