Processeurs : Intel va corriger un mystérieux défaut de conception
Intel vient de reconnaître que ses derniers processeurs pour PC Core i9K étaient bel et bien responsables de plantages et proposera un correctif de leur microcode. Derrière cet événement, le fondeur joue la crédibilité de sa technologie.
Les processeurs haut de gamme Intel Core i9K de 13e et de 14e génération pour PC avaient donc bien un problème de conception. Après une année à essuyer un faisceau de plaintes de la part des utilisateurs, Intel vient de reconnaître sur son forum que le microcode de ces deux générations de processeurs conduisait à une surtension à certains endroits des circuits internes. Le microcode étant reprogrammable, Intel planche sur un correctif que les utilisateurs pourraient déployer sur leurs machines dès la mi-août.
Pour autant, l’officialisation de ce problème laisse au moins deux questions en suspens. La première concerne le risque de dégradation des performances que pourrait entraîner ce correctif.
En 2018, Intel avait déjà été contraint de mettre à jour le microcode de tous ses processeurs suite à la découverte de deux failles de cybersécurité qui les impactaient, baptisées Meltdown et Spectre. Selon un billet de Microsoft publié à l’époque, seuls les PC avec les processeurs et les Windows les plus récents pouvaient s’en tirer avec une dégradation des temps de calcul de seulement quelques millisecondes. Pour les autres, surtout les serveurs, les ralentissements étaient visibles à l’œil nu.
La seconde question est de savoir si la mise à jour du microcode corrige réellement un bug qu’Intel aurait laissé passer lors de la conception de son microprocesseur. Ou si elle consiste à empêcher le microcode d’utiliser des parties des circuits qui souffriraient d’un défaut de fabrication découvert a posteriori.
Dit autrement, le problème de plantage est-il circonscrit aux processeurs Core i9K ou existe-t-il un risque que les processeurs avec des circuits similaires souffrent du même mal, mais de manière moins visible ?
Un défaut physique ?
Nos confrères d’Anandtech ont ainsi repéré sur Reddit le message d’un ingénieur d’Intel qui admet un problème plus profond de fabrication identifié sur les cœurs gravés par ses chaînes Intel 7, en opération depuis 2022. Intel a répondu à nos confrères ne pas avoir la preuve que le problème de plantage soit systématiquement lié à ce problème de fabrication, ce qui laisse la porte ouverte à toutes les spéculations.
Les processeurs Core i9K ont la particularité de fonctionner à des fréquences extrêmes, entre 5 et 6 GHz, qui sont susceptibles de mettre en exergue des problèmes passant habituellement sous les radars. Pour le reste, leur architecture Raptor Lake est la même que celle de tous les processeurs Core de 13e et 14e génération, respectivement présents dans les PC depuis fin 2022 et fin 2023.
Rappelons que Raptor Lake consiste à assembler dans une même puce jusqu’à 8 cœurs Raptor Cove (performants, avec deux threads simultanés) et 16 cœurs Gracemont (moins énergivores, avec un thread à la fois).
Raptor Lake est aussi l’architecture des processeurs Xeon-E lancés en fin d’année dernière pour les serveurs d’entrée de gamme qui ont un maximum de 8 cœurs Raptor Cove par socket. Et, si l’on descend plus encore dans la technologie, les cœurs Raptor Cove de l’architecture Raptor Lake sont aussi ceux de l’architecture Emerald Rapids des Xeon Scalable de 5e génération, soit les processeurs pour serveurs qu’Intel commercialise depuis décembre 2023.
Mais s’il existe bien des signalements de plantage concernant différentes familles de processeurs à base de cœurs Raptor Core, lus au hasard des forums de support technique et non vérifiables, rien ne permet d’affirmer que l’ensemble de ces processeurs partagent les défauts des Core i9K.
Un enjeu industriel derrière un simple défaut corrigé par microcode
Toutes ces puces ont été fabriquées sur les mêmes chaînes de gravure Intel 7. Celles-ci sont censées apporter aux circuits d’Intel gravés en 10 nm les mêmes avantages énergétiques et de densité que les puces concurrentes qui avaient été auparavant gravées avec une finesse de 7 nm sur les chaînes du Taiwanais TSMC.
Ces chaînes de gravure Intel 7 avaient aussi servi à fabriquer, en 2022, les Xeon Scalable de 4e génération, commercialisés fin 2022. Or, on se souvient que, six mois après leur mise sur le marché, Intel avait subitement stoppé la distribution de ces Xeon après la découverte d’un défaut – dont la nature n’a jamais été précisée. La commercialisation n’avait pu reprendre qu’après la publication, déjà, d’un nouveau firmware contournant le problème.
Le sujet est sensible pour Intel. Le fondeur joue, dans la qualité de ses nouvelles usines, le retour en grâce de ses processeurs face à des concurrents – AMD, Nvidia, Ampere, Qualcomm et même Apple – qui grignotent inlassablement ses parts de marché, grâce à des processus de fabrication plus avancés. Les usines de TSMC, qui atteignent actuellement des finesses de gravure de 3, voire 2 nm, leur permettent de proposer des processeurs avec plus de cœurs, plus de mémoire cache et moins de consommation électrique.
Par exemple, le cabinet d’études Stocklytics estime que les puces d’Intel ne représentent plus aujourd’hui que 71,9 % des nouveaux processeurs vendus, toutes catégories d’ordinateurs confondues (du portable au serveur), contre 91 % de part de marché jusqu’en 2019.
Les chaînes de gravure Intel 7 viennent encore de servir pour fabriquer la première variante des nouveaux processeurs Xeon 6 qu’Intel commercialise dès cet été. Cette première variante est constituée de processeurs reposant sur l’architecture Sierra Forest. Celle-ci est capable d’interconnecter jusqu’à 288 cœurs Crestmont « économiques » (un thread par cœur) dans la même puce. Il s’agit en l’occurrence de deux circuits contenant chacun 144 cœurs, avec plus ou moins de cœurs actifs (de 64 à 144 par circuit).
Ces premiers Xeon 6 sont principalement destinés aux fournisseurs de cloud, qui souhaitent densifier au maximum la quantité de cœurs par étagère rack. Sur ce créneau, les fournisseurs de cloud manifestent de plus en plus d’intérêt pour les processeurs ARM.
D’ici à la fin de l’année, Intel commercialisera une seconde variante de Xeon 6, cette fois-ci pour les serveurs traditionnels vendus aux entreprises. Cette seconde variante reposera sur l’architecture Granite Rapids capable d’interconnecter jusqu’à 128 cœurs Redwood Cove « performants » (deux threads par cœur) dans la même puce. Intel assemblera divers modèles de puces à partir de circuits pouvant contenir chacun 16 (circuit LCC), 48 (circuit MCC) ou 44 cœurs actifs ou non.
La particularité de ces cœurs Redwood Cove sera qu’ils auront été gravés avec une finesse de 7 nm sur les nouvelles chaînes Intel 4. Ces chaînes sont en opération depuis 2023 et ont servi à fabriquer les premiers processeurs Core pour PC portables basés sur la nouvelle architecture Meteor Lake qu’Intel commercialise depuis le début de cette année. L’architecture Meteor Lake permet d’assembler dans la même puce différents circuits qui contiennent tous 6 cœurs Redwood Cove et 8 cœurs Crestmont, actifs ou non.