Mainframes : avec le z16, IBM accélère l’IA par 30
Le premier modèle de la nouvelle génération z16 dispose de 256 cœurs capables d’analyser les combinaisons de données à la volée. L’intérêt est notamment de détecter les fraudes bancaires en temps réel.
IBM a lancé cette semaine sa nouvelle génération z16 de mainframes. Celle-ci se distingue principalement des précédentes par la présence de nouveaux processeurs, appelés Telum, qui seraient capables de détecter une fraude avant que son opération soit exécutée, évitant la complexité d’une correction a posteriori.
« IBM est la référence en ce qui concerne le traitement des transactions hautement sécurisées. Avec le z16 et sa capacité de tirer des conclusions en temps réel d’après un faisceau d’informations concordantes, nous permettons à nos clients d’accélérer leurs prises de décisions et ainsi améliorer l’expérience de leurs utilisateurs », a déclaré Ric Lewis, en charge de la branche Systems d’IBM, lors d’une conférence de presse dédiée.
Les algorithmes de Watson implémentés dans les circuits
Dit de manière plus pragmatique, les mainframes sont des machines utilisées par les banques pour traiter les transactions par carte bancaire, et il s’agit d’éliminer ici l’écueil de victimes obligées d’entamer des procédures de remboursement pénibles et les achats non payés en boutiques. En 2020, la fraude à la carte bancaire aurait coûté pas moins de 3,3 milliards de dollars aux victimes américaines.
On trouve également les mainframes dans les compagnies d’assurance et les compagnies aériennes, pour gérer les prêts des unes et les sièges des autres. Ici, le nouveau processeur Telium, qui accélérerait globalement les fonctions du moteur d’intelligence artificielle Watson d’IBM, servirait à fiabiliser en amont l’exécution des offres.
IBM avance que ce nouveau processeur Telum implémenterait dans ses circuits des algorithmes issus de ses recherches sur l’ordinateur quantique. Comme lui, Telum serait capable de trouver très rapidement la solution qui se combine le mieux à un problème, plutôt que d’évaluer une à une toutes les possibilités jusqu’à tomber sur la bonne.
Ces déclarations d’IBM sont toutefois à prendre avec des pincettes. Ni IBM ni personne d’autre n’a encore réussi à construire un ordinateur quantique assez fonctionnel. Il n’y a aucune raison qu’une puce de silicium soit capable d’exécuter « par magie » des algorithmes conçus pour une puce quantique.
Plus vraisemblablement, Telum intègre à côté de ses cœurs de traitements classiques une puce qui analyse à la volée les données en cours de traitement et devine dans leur combinaison les problèmes avant qu’ils ne surviennent, c’est-à-dire bien avant qu’on cherche à les résoudre. Cette analyse à la volée était déjà écrite dans les algorithmes de Watson, mais le fait de l’implémenter dans les circuits du processeur accélérerait son exécution d’un facteur 30.
4 cartes CPU pour un total de 256 cœurs et 40 To de RAM
Telum est un processeur gravé avec une finesse de 7 nmn dans les usines de Samsung. Il est le premier processeur d’IBM auquel ait collaboré l’IBM Research AI Hardware Center. Il embarque huit cœurs, chacun dotés de 256 Ko de cache L1 et 32 Mo de cache L2, soit 50 % de plus que sur la précédente génération z15. Sa fréquence d’horloge atteint 5 GHz. En plus des fonctions d’exécution traditionnelles, les cœurs de Telum intègrent donc un circuit spécialisé dans l’exécution des algorithmes d’IA. La puissance délivrée par ce circuit dans les huit cœurs totaliserait 6 TFLOPs.
Pour autant, il s’agit plutôt de dire ici que les algorithmes d’IA s’exécutent comme sur un supercalculateur à 6 TFLOPs ; les mainframes n’ont pas vocation à résoudre des milliers de milliards des fonctions mathématiques à virgules flottantes par seconde, ce que mesurent les TFLOPs.
IBM regroupe deux processeurs Telum par socket sur une carte mère qui contient quatre sockets. Chaque socket offre 64 canaux PCIe. Cette carte totalise donc 64 cœurs, 2 Go de cache L2 et 256 canaux PCIe. Elle contient par ailleurs 10 To de RAM. Le point important dans cette architecture est que chaque cœur peut accéder aux caches des autres, y compris s’ils sont sur un autre socket. IBM parle de cache L3 « virtuel », dans le sens où il n’y a pas de cache supplémentaire sur la carte mère, mais c’est tout comme puisqu’un cœur peut aller réserver son propre espace dans le cache d’un autre cœur.
Le premier modèle de z16 fait travailler ensemble quatre de ces cartes mères à quatre sockets de deux processeurs, soit une machine possédant 256 cœurs, 8 Go de cache et 40 To de RAM dans la configuration maximale. La puissance de calcul cumulée est d’environ 200 TFLOPs en ce qui concerne les algorithmes d’IA.
Haut débit et haute sécurité
Les cartes mères communiquent entre elles au travers de câbles SMP-9 qui contiennent 10 fibres optiques, plus une pour la redondance. Chaque fibre a un débit de 25 Gbit/s, soit 250 Gbit/s par câble. Il faut deux câbles SMP-9 redondants pour relier deux cartes mères. Dans cette configuration à quatre cartes mères, chaque cœur peut toujours aller utiliser le cache d’un autre cœur qui se trouve sur une autre carte mère. IBM parle cette fois-ci de « cache L4 virtuel ».
Comme ses prédécesseurs, le z16 communique avec ses modules externes – stockage, entrées-sorties diverses, ou encore réseau Ethernet vers des serveurs conventionnels – au travers de liens FICON (FIber CONnection), le réseau propriétaire d’IBM pour les mainframes. FICON a la particularité de pouvoir transporter les flux de données sur 10 km, voire 100 km avec des amplificateurs le long du trajet. Les switches FICOM intègrent de la mémoire, de sorte que si une panne survient, il n’est pas nécessaire de redemander au mainframe les paquets perdus ; ils sont dans la mémoire du switch.
Autre caractéristique saillante des z16, ces mainframes sont équipés d’une carte Crypto Express 8S (CEX8S) qui chiffre les données en mémoire dès le démarrage de la machine. Selon IBM, cette carte servirait à empêcher toute infiltration de malware et, par extension, toute extraction des données par un pirate. IBM suggère que, le jour où l’ordinateur quantique existera, il saura déchiffrer absolument toutes les données protégées par des clés, sauf celles hébergées sur un z16, puisqu’il sera impossible de les récupérer pour les déchiffrer ailleurs.