Accélérateurs : une fondation se mobilise contre Nvidia
Intel, ARM, Qualcom, Fujitsu se réunissent dans la fondation UXL, affiliée à la fondation Linux, pour militer contre les outils de développement de type CUDA qui produisent du code seulement pour les GPUS Nvidia.
La fondation Unified Acceleration (UXL), qui fait partie de la fondation Linux et qui est composée de concurrents de Nvidia, vient de déclarer que la domination de ce dernier en matière d’IA pose un problème sérieux dans le secteur du développement de logiciels.
Discrètement mise en place dès septembre 2023, cette fondation a pour objectif d’encourager l’utilisation de normes ouvertes et de logiciels libres afin de créer des applications compatibles avec le plus grand nombre d’architectures accélératrices. De fait, elle s’oppose à la tendance actuelle, essentiellement portée par Nvidia et son kit CUDA, qui consiste à développer des applications spécifiques à un type de GPU.
L’UXL compte parmi ses membres ARM, Intel, Qualcomm ou encore Fujitsu. Chacun d’eux revendique pouvoir proposer des puces accélératrices aussi performantes que les GPUs de Nvidia.
Attaquer l’hégémonie de Nvidia sous l’angle logiciel
Nvidia est devenue une figure clé du marché du matériel d’IA générative grâce à ses puces, qui alimentent un grand nombre d’outils et d’applications d’IA générative produits aujourd’hui. L’entreprise travaille en partenariat avec les plus grands fournisseurs de cloud : Google, Microsoft et AWS. Récemment, Meta, la société mère de Facebook, a indiqué son intention d’acheter 350 000 GPU Nvidia H100 d’ici la fin de l’année.
Le mérite de Nvidia, surtout, a été de consolider son succès avec CUDA, une plateforme et un modèle de programmation pour ses GPUs, qui a servi de kit à tout un écosystème afin de concrétiser des applications et les outils d’IA actuellement disponibles.
Olivier BlanchardAnalyste, Futurum Group
Pour être tout à fait exact, l’UXL refuse de se prononcer directement à propos de la position dominante de Nvidia sur le marché des puces accélératrices. Les membres de la fondation ne pointent qu’un aspect de cette situation : le code des applications d’IA actuelles est le plus souvent dépendant « d’une architecture particulière ». Et cette dépendance aurait pour effet délétère d’obliger les développeurs à fournir un effort supplémentaire afin d’adapter leurs codes à d’autres architectures. Utiliser des standards ouverts leur éviterait cet effort.
Ne plus utiliser CUDA permettrait aussi de rendre interchangeables les puces accélératrices de Nvidia avec n’importe quelles autres fabriquées par Intel, Qualcomm, Fujitsu ou ARM. Mais cela, l’UXL n’en parle pas.
L’UXL promeut ainsi l’utilisation du kit de développement ouvert OneAPI, développé, justement, par Intel. OneAPI prend en charge la création d’applications pour différents types de puces accélératrices : il peut s’agir de GPUs, comme de processeurs, de FPGA, ou de DPU. AMD, qui a déjà un GPU MI300 à proposer aux fabricants de serveurs, qui n’est pas membre de la fondation UXL, pourrait lui aussi en profiter.
« Un écosystème plus diversifié est probablement bon pour la concurrence. Il offre beaucoup plus de flexibilité, d’opportunités et d’options aux entreprises qui se lancent dans l’IA afin de construire leurs solutions », commente l’analyste Olivier Blanchard, du cabinet Futurum Group.
L’intérêt de l’Open source
Alvin NguyenAnalyste, Forrester Research
UXL n’est pas le premier groupe à défendre une approche Open source pour standardiser les développements sur des puces accélératrices. En 2008, le groupe Khronos a présenté OpenCL, un framework permettant d’écrire des programmes sur des plateformes hétérogènes comprenant des CPU, des GPU et des DSP. OpenCL n’a pas connu le même succès que CUDA, bien qu’il s’agisse d’un logiciel libre.
Selon Alvin Nguyen, analyste principal chez Forrester Research, le modèle Open source n’est pas à remettre en cause. « Il faut du temps à un projet Open source pour atteindre une base optimale d’utilisateurs. Mais force est de constater que c’est le modèle qui a le mieux fonctionné pour nombre de fournisseurs de technologies. C’est celui qui stimule le plus l’innovation », dit-il.
Surtout, il ajoute : « un paramètre important sur le marché de l’IA est qu’il n’y a pas assez de GPUs disponibles actuellement chez tel ou tel fournisseur pour combler toutes les demandes », suggérant qu’il serait souhaitable que les entreprises puissent se fournir librement, sans dépendance technique, chez untel ou untel selon les stocks disponibles.
Photo : Pat Gelsinger, PDG d'Intel, lors de la présentation du GPU Gaudi 2 en novembre 2023. ©Intel