Processeurs : le Rhea sera disponible en 2025
SiPearl, le concepteur du processeur 100 % européen pour supercalculateurs, annonce que la production de sa puce sera lancée d’ici à quelques semaines. On la trouvera dans Jupiter, mais aussi dans des serveurs d’entreprise pour l’inférence.
Le processeur européen Rhea de SiPearl se dévoile un peu plus à l’occasion du salon du supercalcul qui se tient cette semaine à Hambourg. On sait désormais qu’il sera livré en 2025, qu’il aura 80 cœurs ARM Neoverse V1 gravés avec une finesse de 6 nm, 64 Go de mémoire HBM2e intégrés – plus un bus DDR5 pour accepter huit barrettes de RAM externes – et 104 canaux PCIe 5.0 répartis en six bus x16 et deux x4.
« L’une des principales forces du Rhéa en matière de performances est qu’il s’agit du seul processeur qui intègre de la mémoire HBM, c’est-à-dire une grande quantité de RAM qui fonctionne aussi vite que les cœurs et qui communique directement avec eux », argumente Philippe Notton, le PDG de SiPearl.
« Tous les autres processeurs – qu’ils soient pour serveurs comme pour supercalculateurs – intègrent soit une faible quantité de mémoire cache [cas des processeurs Intel Xeon, AMD Epyc et Ampere AmpereOne], soit une quantité honorable de RAM, mais qui est ralentie par le goulet d’étranglement d’un bus LPDDR [cas des processeurs Grace de Nvidia et Silicon Mx d’Apple, N.D.R.] », ajoute-t-il.
Un processeur qui accélère le supercalcul et l’inférence
En fait, les seules autres puces à intégrer de la mémoire HBM sont les GPU : les H100/H200 et B100/B200 de Nvidia, le MI300X d’AMD et le Gaudi3 d’Intel.
« Le Rhea n’a pas vocation à se substituer aux GPU dans ce qu’ils savent très bien faire : de l’entraînement de modèles d’IA. En revanche, des GPU sont utilisés à la place de processeurs dans certains cas uniquement parce que leur mémoire HBM leur donne un avantage. C’est typiquement le cas de l’inférence, dont les traitements ne nécessitent pas spécialement d’être exécutés par des GPU. »
« En plus d’être un processeur pour supercalculateurs, le Rhea sera donc aussi un processeur pour serveurs dédiés à l’inférence. Songez qu’il peut charger dans sa mémoire HBM l’intégralité d’un modèle de moins de 64 Go, c’est-à-dire traiter à la vitesse maximale l’essentiel des modèles actuels. Et, ce, pour un coût bien inférieur aux 40 000 dollars d’un GPU, ainsi que pour une consommation d’énergie bien inférieure », dit Philippe Notton, sans pour autant indiquer ni le prix du Rhea ni sa consommation d’énergie.
Dans un premier temps, le Rhea sera livré sur Jupiter, le premier supercalculateur en Europe capable d’exécuter un milliard de milliards d’instructions par seconde. Déployé l’année prochaine au centre de calcul de Jülich, en Allemagne, il sera fabriqué par Eviden sur la base de cartes mères spécialement mises au point pour le Rhea et accompagnées de cartes GPU H100 de Nvidia.
SiPearl et Eviden espèrent que ce type de matériel sera ensuite décliné à d’autres supercalculateurs. Au moins en Europe, car SiPearl est né au départ de la volonté de l’UE, via son initiative EuroHPC en 2018, de se doter d’un processeur souverain qui mettrait la puissance de calcul de l’Union à l’abri de tout risque de pénurie de processeurs américains, dans une situation de guerre économique.
Dans un second temps, SiPearl devra convaincre les fabricants de serveurs plus conventionnels – Dell, HPE, Lenovo, SuperMicro, etc. – de fabriquer des cartes mères qui permettraient d’exploiter le même processeur Rhea dans des datacenters, afin d’y exécuter les traitements d’inférence.
Philippe NottonPDG, SiPearl
« Nous ne sommes pas les seuls à dire que les GPU énergivores sont démesurés pour exécuter de l’inférence. L’avantage du Rhea par rapport aux processeurs classiques est qu’il sera plus performant, grâce à sa mémoire HBM et grâce aux deux unités de traitement vectoriel 256 bits dont est doté chacun des 80 cœurs », avance le PDG de SiPearl.
« Et son avantage par rapport aux nouvelles puces spécialisées dans l’inférence, qui sortent actuellement [Groq, notamment], est que le Rhea est un processeur ARM. Il dispose déjà de toutes les bibliothèques de développement pour bâtir simplement des applications d’IA. Les puces spécialisées devront attendre au moins cinq ans pour bénéficier d’un environnement de développement aussi riche. »
Pas de retard technologique
En parlant de délai, une commercialisation du Rhea en 2025 équivaut à trois ans de retard sur le planning initialement prévu.
« Nous avons été trop optimistes sur deux points », reconnaît Philippe Notton. « Le premier est sur celui des financements. Même si des promesses d’investissements ont été signées dès 2021 avec des acteurs publics et privés européens (l’EIC, l’EIB…), les fonds ne sont arrivés qu’en 2023. »
« Le second point est celui des ressources humaines. Nous ne nous attendions pas à une telle pénurie de talents dans le domaine des processeurs. Pénurie qui touche d’ailleurs tous les acteurs qui conçoivent des puces. Nous sommes partis chercher des compétences dans le monde entier pour trouver nos ingénieurs. Aujourd’hui, SiPearl compte 200 salariés, de 24 nationalités différentes. »
Pour autant, le retard de mise sur le marché ne devrait pas être synonyme d’un retard technologique. Même si ARM a déjà conçu le design des cœurs Neoverse V2, qui doivent être utilisés dans les processeurs Grace de Nvidia et futurs Graviton4 d’AWS ou Axion de Google, et qu’il planche désormais sur celui des cœurs Neoverse V3, les cœurs Neoverse V1 demeurent l’architecture de traitements haute performance la plus répandue à l’heure actuelle, notamment via les Graviton3 réservés aux seuls services en ligne d’AWS.
Philippe NottonPDG, SiPearl
Quant aux processeurs AmperOne, ils reposent sur des cœurs Neoverse N2, qui ne sont pas optimisés pour les calculs, mais pour exécuter un grand nombre de machines virtuelles en parallèle.
SiPearl promet que ces retards sont désormais surmontés et que la production du Rhea sera lancée d’ici à quelques semaines dans les usines taiwanaises de TSMC.
« TSMC assure la gravure des cœurs et Samsung celle de la mémoire HBM. Les deux jeux de circuits seront ensuite assemblés par des partenaires de TSMC, toujours en Asie. Dans un souci de souveraineté, nous regardons de près l’implantation de Silicon Box en Italie, qui nous permettrait d’assembler les futures générations de nos processeurs en Europe », conclut Philippe Notton.