Hardware IA (GPU, FPGA, etc.)

Opinion 02 févr. 2026
IA agentique : « Pour nous, le plus important est la notion de choix » (Martin Woodward, GitHub)

GitHub mesure déjà les effets de l’IA générative et agentique sur la génération de code, la production de pull requests et leur « merge ». Alors que l’IA accélère le développement et que les modèles évoluent aussi rapidement, Martin Woodward, vice-président des relations développeur chez GitHub, assure que la filiale de Microsoft ne cherche pas à imposer les outils agentiques à ses clients. Lire la suite
par
- Gaétan Raoul, LeMagIT
Actualités 02 févr. 2026
Automobile : les balbutiements de l’IA générative embarquée

Comme dans les autres secteurs, il y a fort à parier que l’IA générative soit d’abord déployée dans le cloud avant d’être installée, de manière ciblée en production, dans les voitures de monsieur et madame tout le monde. Du fait des contraintes techniques et économiques, les acteurs du secteur estiment qu’un mode hybride s’imposera de lui-même. Lire la suite
par
- Gaétan Raoul, LeMagIT

Ressources Partenaire

Pharmacie Familia sécurise ses sauvegardes et gagne en sérénité opérationnelle ... –Etude de cas
Cas d’usage : Migration infonuagique et modernisation des charges de travail –Livre Blanc
Dépanner les environnements Kubernetes grâce à l’observabilité –eBook

Télécharger Information Sécurité

Dans ce numéro:
- Comment calculer le ROI de la cybersécurité pour le PDG et le conseil d’administration
- Ready for IT : quel ROI pour la cybersécurité ?
- Mettre en œuvre une stratégie de sécurité basée sur les risques en 5 étapes
Télécharger cette édition

Actualités 29 janv. 2026
Model Vault : Cohere adapte ses modes de déploiement « privés » à l’IA agentique

Le fournisseur de LLM canadien a annoncé Model Vault, une plateforme SaaS dédiée sous la forme d’un cloud privé virtuel isolé pour l’inférence de modèles consacrés aux systèmes d’IA agentique et RAG. La solution est pensée comme un « compromis » entre les services SaaS et les déploiements self-managed en cloud ou sur site. Lire la suite
par
- Gaétan Raoul, LeMagIT
Actualités 27 janv. 2026
Puces IA : Microsoft Azure lance le Maia 200

Le nouvel accélérateur de Microsoft pour les services d’IA générative qu’il publie sur le cloud Azure est, sur le papier, plus puissant que les puces équivalentes chez AWS et GCP. Il dépasse même les performances du B200 de Nvidia en inférence. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 26 janv. 2026
4 tendances informatiques à surveiller en 2026 pour les utilisateurs finaux

L’IA, la sécurité axée sur l’identité, la fin du support de Windows 10 et le changement de nom de VMware en Omnissa sont en train de remodeler l’EUC, alors que les DSI prennent des décisions cruciales pour 2026 et au-delà. Lire la suite
par
- Helen Searle-Jones, Tritech Group
Guide 20 janv. 2026
Dossier stockage : quelles solutions pour l’IA ?

Pour exécuter des projets d’IA dans un datacenter, il ne suffit pas de doter les serveurs de GPU. Il faut aussi leur communiquer les bonnes données, dans le bon format, à la bonne vitesse. Ce dossier fait le point sur les approches des fournisseurs de stockage. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 19 janv. 2026
Sovereign Core : IBM propose un kit pour monter son cloud souverain

IBM concocte une offre logicielle qui doit permettre à ses clients de bâtir ou de faire bâtir des clouds « souverains ». Un autre nom pour des clouds privés propulsés par ses logiciels ouverts et propriétaires. Lire la suite
par
- Gaétan Raoul, LeMagIT
Actualités 15 janv. 2026
Puces IA : les GPU de Nvidia encore autorisés puis interdits en Chine

Alors que Nvidia s’apprêtait à pouvoir honorer une commande chinoise de 2 millions de GPU H200, Pékin vient d’interdire à nouveau leur importation. Entre stocks baladeurs de GPU puissants et politiques d’export incertaines, l’Europe prie pour être fournie. Lire la suite
par
- Yann Serra, LeMagIT
Conseil 13 janv. 2026
Les raisons d’utiliser l’IA sur site

La croissance rapide de l’intelligence artificielle est due en grande partie aux outils basés sur le cloud. Mais il existe de très bonnes raisons d’héberger les charges de travail d’une IA sur site. Lire la suite
par
- Stephen Pritchard
Actualités 09 janv. 2026
Dragon LLM, ce Français qui mise sur des SLM financiers frugaux

Longtemps spécialisée dans la traduction automatique de documents financiers, la société française Dragon LLM entend désormais entraîner des modèles de langage adaptés à des tâches spécifiques capables de s’exécuter en local ou sur des serveurs sans GPU. Quitte à développer sa propre architecture de SLM, basée sur l’approche hybride Mamba-Transformer. Lire la suite
par
- Gaétan Raoul, LeMagIT
Actualités 09 janv. 2026
Pénurie des puces mémoire : Samsung et SK Hynix triplent leurs bénéfices

La demande des hyperscalers est si forte pour des composants HBM, DRAM et NAND que les fabricants de matériels informatiques surenchérissent pour en acheter des stocks. Résultat : les fabricants de ces composants s’enrichissent. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 07 janv. 2026
Puces IA : Nvidia détaille sa prochaine génération Rubin au CES

Entre le GPU Rubin, le processeur Vera et les nouveaux contrôleurs réseau, ce ne sont pas moins de six nouvelles puces que Nvidia lancera sur le marché des centres de calcul d’ici à la rentrée prochaine. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 06 janv. 2026
Pénurie de composants : les achats des hyperscalers explosent

Selon les dernières études de Synergy Research et Omdia, les achats d’équipements informatiques par les hyperscalers vont continuer de croître au moins jusqu’en 2029, voire 2030, pénalisant d’autant l’offre disponible pour les installations privées. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 05 janv. 2026
Empreinte environnementale de l’IA : aller au-delà des estimations

Comment mesurer l’empreinte environnementale de l’IA ; que mesurer ? Si la question peut paraître triviale, elle demeure sujette à débat. Les experts du domaine réclament aux acteurs de l’écosystème (des fournisseurs de LLM aux équipementiers en passant par les hébergeurs cloud) des mesures réelles, afin de mieux évaluer les impacts globaux et locaux. Lire la suite
par
- Gaétan Raoul, LeMagIT
Actualités 23 déc. 2025
Mémoires : Micron sabre le champagne sur fond de pénurie annoncée

Le fabricant de composants mémoires DRAM, HBM et NAND affiche des résultats record grâce aux commandes colossales que lui passent les hyperscalers pour suréquiper leurs services d’IA. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 22 déc. 2025
LLM : Google cherche la clé qui ouvre la porte de l’entraînement en continu

Chez Google Research, une petite équipe de quatre personnes jettent les bases théoriques et pratiques de ce que pourrait être l’héritière de la fameuse architecture Transformer. Elle concentre ses travaux sur les très longues fenêtres de contexte (plus de 2 millions de tokens) et l’apprentissage véritablement en continu. Lire la suite
par
- Gaétan Raoul, LeMagIT
Guide 16 déc. 2025
Dossier AWS re:Invent 2025 : ce qu’il faut en retenir

Ce dossier regroupe les principales annonces en matière d’IaaS, d’IA et de données qu’AWS a faites lors de la dernière édition de son événement annuel. Des entreprises françaises y témoignent des raisons qui les ont incitées à choisir l’hyperscaler. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 12 déc. 2025
IA sur site : l’offre de Dell séduit sur fond d’explosion des prix

Depuis l’année dernière, Dell propose une stack pour déployer l’IA derrière les murs d’une organisation. Elle a convaincu 200 clients en France. Mais avec les grands chantiers des hyperscalers qui provoquent une tension sur les composants, ses prix vont augmenter. Fortement. Lire la suite
par
- Philippe Ducellier, Rédacteur en chef adjoint
Actualités 08 déc. 2025
DBaaS : AWS met l’accent sur la maîtrise des coûts

Pour conserver les clients qui exploitent ses services de bases de données, lors de salon re:Invent 2025, le géant du cloud a multiplié les optimisations et les offres commerciales. Lire la suite
par
- Gaétan Raoul, LeMagIT
Actualités 04 déc. 2025
Amazon Nova 2 : quatre LLM multimodaux pour rattraper Google Cloud

Lors de re:Invent 2025 à Las Vegas, AWS a présenté Amazon Nova 2, la deuxième itération de sa collection de grands modèles de langage, la troisième en deux ans. S’il ne cherche plus à casser les prix, le fournisseur tient à convaincre ses clients d’adopter des modèles légèrement en deçà de leurs concurrents, notamment Gemini 3 Pro, mais personnalisables. Lire la suite
par
- Gaétan Raoul, LeMagIT
Actualités 03 déc. 2025
Re:Invent 2025 : AWS dévoile ses nouvelles infrastructures pour l’IA

L’hyperscaler dote son cloud IaaS EC2 de nouvelles configurations basées sur son GPU Trainium3 et d’autres sur les derniers GPU de Nvidia. Deux technologies d’abord concurrentes, mais qui semblent vouées à se combiner. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 03 déc. 2025
Mistral 3 : Mistral AI veut faire jeu égal avec ses compétiteurs chinois

Le fournisseur de LLM lance Mistral 3, une collection de modèles open weight répartis en deux volets : un grand modèle prévu pour s’exécuter dans le cloud et trois petits LLM parés pour l’inférence locale. Mistral AI ne bat pas ses concurrents, mais garde son rang auprès de Qwen d’Alibaba, DeepSeek, Kimi et Google Gemma. Lire la suite
par
- Gaétan Raoul, LeMagIT
Guide 01 déc. 2025
Dossier réseau : quelle infrastructure pour l’IA ?

S’équiper de serveurs ultra-performants ne suffira pas à exécuter les projets d’IA. Il faut aussi qu’ils puissent communiquer très rapidement des données entre eux et vers les baies de disques. Ce dossier fait le point sur les offres de réseau pour l’IA. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 27 nov. 2025
Météo France : plus d'IA pour mieux prédire les événements extrêmes

Pour Météo France, l’IA promet d’optimiser les prévisions météorologiques. Toutefois, son adoption pose plusieurs défis en matière de compétences, d’accès aux ressources de calcul, de mix entre modèles physiques et d’IA. Lire la suite
par
- Gaétan Raoul, LeMagIT
Actualités 24 nov. 2025
DRAM, SSD : attention à la pénurie qui se prépare

Les hyperscalers et les fabricants de serveurs commandent trop de composants mémoire pour leurs infrastructures d’IA, plus que ce que le marché peut produire. Résultat : les prix explosent dès ce mois-ci et une pénurie pourrait s’installer jusqu’en 2027. Lire la suite
par
- Yann Serra, LeMagIT
Projet IT 21 nov. 2025
Adoption de l’IA générative : BPCE fait un (gros) point d’étape

BPCE a largement mis à disposition des assistants IA aux mains de ses collaborateurs. Alors qu’il récolte les premiers fruits de son programme, le groupe prépare prudemment l’intégration de ses premiers agents IA. Lire la suite
par
- Gaétan Raoul, LeMagIT
Actualités 20 nov. 2025
Inférence IA à haute vitesse : OVHcloud choisit SambaNova

OVHcloud s’associe à SambaNova dans un partenariat non exclusif. Cette startup de la Silicon Valley développe des puces reprogrammables câblées pour l’inférence rapide des modèles de langage. Et ce, tout en étant moins énergivores que les GPU Nvidia. Lire la suite
par
- Gaétan Raoul, LeMagIT
Actualités 14 nov. 2025
IA sur Kubernetes : les analystes épinglent la CNCF face à l’hégémonie de Nvidia

La CNCF positionne Kubernetes comme une infrastructure standard pour l’IA, mais les analystes s’interrogent sur le niveau de participation d’un acteur majeur de l’IA à son nouveau programme de conformité : Nvidia. Lire la suite
par
- Beth Pariseau, TechTarget
- Gaétan Raoul, LeMagIT
Actualités 14 nov. 2025
Processeurs : en pleine forme, AMD travaille ses ambitions

Selon ses derniers résultats, AMD vend plus de processeurs qu’Intel dans les serveurs, mais reste en deçà dans les PC. Sa PDG se fixe des objectifs pour ne pas se faire dépasser par les puces ARM et entend progresser sur les PC comme dans l’IA. Lire la suite
par
- Yann Serra, LeMagIT
Guide 28 oct. 2025
NetApp Insight 2025 : tout ce qu’il faut en retenir

Ce dossier regroupe toutes les annonces et les informations relatives au fabricant de baies de stockage NetApp qui ont été discutées lors de sa dernière conférence annuelle : sa stratégie globale, son approche de l’IA, son écosystème et ses nouveaux produits. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 23 oct. 2025
Les grandes tendances technologiques de 2026 selon Gartner

Les analystes de Gartner dévoilent les principales tendances technologiques que les DSI doivent connaître pour 2026, notamment le développement de l’IA, la cybersécurité et le rapatriement des données. D’autres éléments de la liste sont plus prospectifs. Lire la suite
par
- Jim O'Donnell, Journaliste ERP
- Gaétan Raoul, LeMagIT
Actualités 20 oct. 2025
NetApp et Intel présentent l’appliance d’IA d’appoint AIPod Mini

La petite machine se veut une solution immédiatement utilisable, rapide, sécurisée et économiquement avantageuse, pour exécuter sur site des IA qui tiennent compte des données privées des entreprises. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 17 oct. 2025
IA souveraine : T-Systems achète 10 000 GPU à NVIDIA pour un cloud européen

Les deux groupes ont annoncé la création d’une infrastructure européenne, hébergée en Allemagne, dédiée à l’intelligence artificielle. Sa mise en service est prévue pour 2026. Lire la suite
par
- Yann Serra, LeMagIT
- Philippe Ducellier, Rédacteur en chef adjoint
Actualités 16 oct. 2025
Oracle adapte son réseau pour gérer des HPC de plus de 130 000 GPU

Avec Acceleron, Oracle veut interconnecter les salles et les bâtiments bardés de rack GPU dans ses data centers, tout en économisant de l’espace et l’énergie consommée par le réseau, pour ajouter davantage de puces IA. Lire la suite
par
- Gaétan Raoul, LeMagIT
Actualités 16 oct. 2025
Intel relance ses GPU, mais juste pour l’inférence

Intel présente un design de cluster de calcul pour l’IA similaire aux DGX NVL72 de Nvidia, qui ne permet pas d’entraîner des AI, mais consomme moins d’énergie pour les utiliser. Il est basé sur sa puce Gaudi3. Lire la suite
par
- Yann Serra, LeMagIT
Guide 10 oct. 2025
IA : le guide des équipements serveur pour votre datacenter

Plateformes prêtes à l’emploi, clusters de serveurs, GPU… Ce guide présente les solutions d’infrastructure du moment pour exécuter les calculs de vos intelligences artificielles. Mais attention : un risque de pénurie les guette. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 07 oct. 2025
Datacenters IA : OpenAI va acheter pour 6 GW de GPU à AMD

L’éditeur de ChatGPT s’était précédemment engagé à acheter l’équivalent de 10 GW de puissance électrique en GPU au concurrent Nvidia. La dépense totale en puces d’IA est estimée à 500 milliards de dollars. Une somme qu’OpenAI n’a pas. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 06 oct. 2025
Granite 4.0 : IBM veut écraser la concurrence sur le terrain de l’inférence

Le géant de l’IT hybride les techniques, pour obtenir des SLM et des LLM plutôt performants et peu gourmands. Il oriente également leur entraînement vers l’IA agentique, quitte à perdre en transparence. Lire la suite
par
- Gaétan Raoul, LeMagIT
Actualités 02 oct. 2025
Taiwan refuse de partager la production de puces d’IA avec les USA

Alors que le gouvernement des USA se targue de négocier avec Taiwan le transfert sur son sol de la moitié de la production des puces de TSMC, la vice-première ministre taiwanaise rétorque qu’elle n’était pas au courant et qu’elle s’oppose même à une telle idée. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 23 sept. 2025
Nvidia : l’étrange investissement de 100 milliards à la faveur d’OpenAI

Cet investissement doit permettre à OpenAI de déployer des millions de GPU nécessaires au fonctionnement de son IA GPT. Ce déploiement se fera dans des datacenters avec lesquels Nvidia passe aussi des accords, au bénéfice de son action en bourse. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 22 sept. 2025
LLM-as-a-Service : Scaleway propose ses services d’inférence depuis Hugging Face

Jusqu’alors, Hugging Face avait connecté sa plateforme avec les services d’inférence de néocloud. Scaleway est le premier fournisseur français à se connecter à la bibliothèque de modèles d’IA open weight. Lire la suite
par
- Gaétan Raoul, LeMagIT
Actualités 22 sept. 2025
Infrastructure IA : Nvidia rachète Enfabrica

Le contrôleur CXL de la startup doit permettre à plusieurs GPU de partager une extension mémoire externe, accélérant l’entraînement des IA et rendant plus élastique l’inférence. Étonnamment, cette extension serait reliée par Ethernet. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 18 sept. 2025
Puces IA : la Chine ne veut plus de Nvidia

Dans la guerre économique qui l’oppose aux USA, la Chine a décidé de ne plus dépendre des GPU américains, d’autant que son champion Huawei a désormais des solutions pour développer ses IA. Nvidia accuse le coup. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 17 sept. 2025
Chez HPE, les ventes de serveurs progressent aussi

Comme Dell, HPE se félicite du succès de ses nouvelles machines configurées pour l’IA dans les datacenters. Une dynamique que tardent à suivre les solutions de stockage. Comme partout ailleurs. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 15 sept. 2025
Puces IA : SK Hynix lance la production des mémoires HBM4

Ce nouveau type de mémoire contribuera aux deux tiers des gains de performances qu’afficheront les prochains GPU. Pour SK Hynix, il s’agit surtout d’une avancée considérable face à Samsung, l’actuel leader des composants mémoires. Lire la suite
par
- Yann Serra, LeMagIT
12 sept. 2025

Avec Mistral AI, Nvidia s’affiche en fer de lance de l’IA souveraine

Lire la suite
Actualités 10 sept. 2025
Puces IA : Nvidia dévoile le Rubin CPX pour l’inférence

Le constructeur a dévoilé les caractéristiques probables du GPU qu’il lancera d’ici à la fin de l’année 2026 pour accélérer l’inférence. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 08 sept. 2025
Le Sénat américain propose d’interdire la vente de GPU en Europe

Une proposition de loi suggère que le barème TPP, qui empêche les GPU classiques d’entrer en Chine, s’applique à l’ensemble du monde. L’Europe serait dès lors condamnée à utiliser les services des hyperscalers américains pour travailler avec l’IA. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 27 août 2025
Nvidia commercialise son GPU Blackwell pour PME

Le GPU RTX Pro 6000 Blackwell Server Edition permet au tout venant des entreprises de bénéficier dans leur salle informatique, sur des serveurs d’appoint, de la puissance en IA des grands datacenters. Lire la suite
par
- Yann Serra, LeMagIT
- Shane Snider, Senior News Writer
Guide 25 août 2025
Dossier : comment les USA régulent le marché des puces pour l’IA

Ce dossier répertorie toutes les clés pour comprendre la stratégie étatsunienne en matière de semiconducteurs de pointe. Les USA veulent en réglementer le commerce et s’en servir pour conforter leur suprématie en intelligence artificielle. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 22 août 2025
Empreinte écologique de l'IA générative : Google tente d’éteindre le feu

Dans un billet technique, Google affirme que l’empreinte énergétique de son IA générative Gemini serait largement inférieure aux estimations publiques alarmistes. Google y détaille sa méthodologie de calcul et revendique des gains d’efficacité sur les douze derniers mois. Mais la transparence n’est pas encore là. Lire la suite
par
- Philippe Ducellier, Rédacteur en chef adjoint
Actualités 14 août 2025
Cosmos : Nvidia parie sur l’application de l’IA dans le monde physique

Avec ses modèles de monde Cosmos, le spécialiste fabless des GPU et de l’IA entend favoriser le développement de systèmes robotiques capables de planifier et d’exécuter des tâches de manière autonome. Lire la suite
par
- Esther Shittu, News Writer
- Gaétan Raoul, LeMagIT
Actualités 12 août 2025
AMD et Nvidia reverseront 15 % de leurs revenus engrangés en Chine à l’Administration américaine

Cette mesure sans précédent prise par l’Administration Trump pourrait entrer en conflit avec les dispositions de la Constitution américaine interdisant les taxes à l’exportation. Lire la suite
par
- Shane Snider, Senior News Writer
- La Rédaction
Actualités 08 août 2025
Donald Trump veut imposer 100 % de droits de douane sur les semiconducteurs

Le secteur des puces électroniques est bouleversé par les projets de l’Administration américaine d’imposer des droits de douane sur les semiconducteurs importés aux États-Unis. Lire la suite
par
- Cliff Saran, TechTarget - ComputerWeekly
Actualités 01 août 2025
OpenAI lance un Stargate norvégien sur fond de divorce avec Microsoft

D’ici à fin 2026, OpenAI fera héberger son IA GPT sur les 100 000 GPUs d’un datacenter au nord du continent, bâti par Nscale et Aker pour tout à fait autre chose. Mais pour OpenAI, il y a l’enjeu de maintenir une présence en Europe en dehors des datacenters d’Azure. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 29 juil. 2025
IA : Huawei dévoile son cluster de calcul rival de Nvidia

Le CloudMatrix 384 occupe 16 fois plus d’espace au sol et consomme 5 fois plus d’électricité que le DGX B200 NVL72 de Nvidia. Mais il est 70 % plus performant, permet d’entraîner des modèles 3,6 fois plus complexes et se contente d’un refroidissement par air. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 29 juil. 2025
L’inférence distribuée, l’avenir de Red Hat AI

Red Hat, filiale d’IBM, croit qu’elle a un rôle à jouer dans le déploiement de systèmes hybrides d’IA. Outre la commercialisation de vLLM, l’éditeur mise sur le projet d’inférence IA distribuée, llm-d. Lire la suite
par
- Gaétan Raoul, LeMagIT
Actualités 23 juil. 2025
L’Administration Trump lance un nouveau plan pour l’IA

Il n’est plus question de Stargate. Le nouveau plan d’action américain pour l’IA tout juste dévoilé par l’administration Trump vise à déréguler les chantiers de datacenters aux USA et à réglementer l’IA selon ses objectifs pour le reste du monde. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 23 juil. 2025
Bilan environnemental des LLM : ce que révèle l’étude de Mistral AI

Le fournisseur de LLM français entend offrir davantage de transparence à ses clients en commençant par l’analyse du cycle de vie de son plus gros LLM, Mistral Large 2. L’exercice met en lumière les défauts des estimations des concurrents… et de celles de Mistral AI. Lire la suite
par
- Gaétan Raoul, LeMagIT
Actualités 23 juil. 2025
Infrastructures IA : OpenAI signe des contrats qui jettent le flou sur Stargate

L’éditeur de ChatGPT, au cœur du projet Stargate pour la suprématie des USA en intelligence artificielle, semble faire le tour des hébergeurs américains pour son propre compte et lance des chantiers de datacenters étiquetés Stargate au Moyen-Orient. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 21 juil. 2025
On-premise, edge, multicloud : Clarifai veut unifier l’inférence des modèles d’IA

L’expert de la computer vision s’appuie sur sa plateforme afin de proposer un centre de contrôle des modèles d’IA générative et des agents IA. Son atout majeur ? La possibilité de déployer des charges de travail sur site, dans plusieurs clouds et en local depuis une seule interface Lire la suite
par
- Gaétan Raoul, LeMagIT
Actualités 16 juil. 2025
Semiconducteurs : de retour en Chine, Nvidia affiche son double jeu

Le fabricant de GPU a de nouveau le droit de vendre ses accélérateurs H20 pour entraîner les IA chinoises. D’un côté, Jensen Huang dit œuvrer au succès américain face à Huawei. De l’autre, il fait tout pour que Tencent, Alibaba et ByteDance rivalisent avec les IA occidentales. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 11 juil. 2025
Infrastructure IA : l’onde de choc CoreWeave

Autrefois mineur de cryptomonnaies, le fournisseur CoreWeave a pris la vague de l’IA générative. Une vague qui fait désormais déferler ses services « GPU on demand » jusque sur les côtes européennes. Lire la suite
par
- Gaétan Raoul, LeMagIT
Actualités 10 juil. 2025
Groq déploie son cloud et ses serveurs d’inférence IA en Europe

Groq installe ses serveurs d’inférence IA et sa plateforme logicielle dans un data center appartenant à Equinix à Helsinki, en Finlande. Le fournisseur espère ainsi convaincre les entreprises européennes d’adopter ses services. Lire la suite
par
- Gaétan Raoul, LeMagIT
Actualités 09 juil. 2025
Photons + neurones : un duo franco-québécois à la conquête de l’IA quantique

La pépite française spécialiste du calcul photonique, Quandela s’allie à l’Institut québécois d’intelligence artificielle (Mila) pour développer des solutions qui combineront IA et informatique quantique. Un moyen également pour Quandela de continuer son implantation internationale au Canada. Lire la suite
par
- Philippe Ducellier, Rédacteur en chef adjoint
Actualités 08 juil. 2025
IA : Phison utilise la capacité des SSD pour étendre la RAM des GPU

Avec ses logiciels aiDaptive+ et ses SSD PASCARI, Phison permet à de simples machines personnelles d’accéder à des fonctions de pointe jusqu’ici réservées aux datacenters, notamment le fine-tuning de grands modèles. Lire la suite
par
- Stéphane Larcher, LeMagIT
- Yann Serra, LeMagIT
Actualités 02 juil. 2025
IA locale : Microsoft veut confier le paramétrage de Windows 11 à un SLM

Le petit modèle de langage Mu (à peine 330 millions de paramètres) a été entraîné pour effectuer de petites tâches en local, sur un NPU. Par exemple, pour régler les options de Windows 11. Lire la suite
par
- Gaétan Raoul, LeMagIT
Actualités 25 juin 2025
IA privée et « souveraine » : Teradata lance AI Factory

Pour les entreprises préoccupées par le contrôle des coûts du cloud et la souveraineté des données, la nouvelle plateforme du fournisseur de longue date promet aux utilisateurs de construire des outils d’IA avancés au sein de leurs propres systèmes. Lire la suite
par
- Gaétan Raoul, LeMagIT
- Eric Avidon, TechTarget
Guide 20 juin 2025
Dossier infrastructure : l’essentiel de Dell Tech World 2025

Surfant sur la nécessité d’utiliser l’IA dans des datacenters privés, le constructeur a multiplié lors de sa dernière conférence mondiale les approches originales pour se passer des infrastructures des hyperscalers. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 17 juin 2025
IA : la CNCF entrevoit une alternative ouverte à CUDA de Nvidia

Les leaders de l’open source soulignent les avancées de projets tels que OpenTelemetry et discutent du rôle de la communauté open source, dans l’élaboration de l’avenir des charges de travail d’intelligence artificielle et dans la promotion de la collaboration mondiale dans un contexte de tensions géopolitiques. Lire la suite
par
- Aaron Tan, Informa TechTarget
- Gaétan Raoul, LeMagIT
17 juin 2025

Infrastructure IA : Nvidia adapte son réseau rapide Spectrum-X au stockage

Lire la suite
E-Zine 17 juin 2025

Storage 40 – Stockage accéléré : les dernières solutions pour épauler l’IA

Dans ce nouveau numéro, Storage explore les dernières solutions de stockage accéléré pour répondre aux exigences de l’IA. Le magazine met en lumière les innovations, les performances extrêmes et stratégies hybrides des acteurs majeurs comme Nvidia, Huawei, Pure Storage, Hammerspace ou Scality. Lire la suite
Actualités 16 juin 2025
Réseau pour grands calculs : UALink 1.0 se dévoile

Les hyperscalers et les entreprises veulent pouvoir router leurs traitements dans les clusters de GPU en passant par autre chose que le système NVLink propriétaire de Nvidia. UALink est la réponse d’un consortium de fournisseurs. Lire la suite
par
- Stéphane Larcher, LeMagIT
Actualités 16 juin 2025
IA agentique : Datadog jauge l’intérêt des clients

Lors de son événement DASH 2025, Datadog a sans surprise mis l’accent sur ses annonces dédiées à l’IA générative et agentique. Hormis ses assistants IA, beaucoup de fonctionnalités sont encore en préversion. De fait, ses clients sont tiraillés quant à leur stratégie IA, tandis que l’éditeur n’a pas fixé la tarification de ses agents IA. Lire la suite
par
- Gaétan Raoul, LeMagIT
Actualités 16 juin 2025
Le cloud OCI achète déjà 130 000 exemplaires du dernier GPU d’AMD

Oracle revendique que son cloud public sera le premier à proposer des services d’IA basés sur le MI355X. Ils seront deux fois moins chers que ceux motorisés par des GPU Nvidia. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 13 juin 2025
Puces pour l’IA : AMD dévoile son GPU MI350X

Le constructeur prétend lancer la meilleure alternative aux GPU Blackwell de Nvidia. Son GPU MI350X peut charger des LLM de plus grande taille qu’un B200, avec une précision de 6 bits inédite qui autorise de meilleurs compromis en inférence. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 12 juin 2025
Avec Mistral AI, Nvidia s’affiche en fer de lance de l’IA souveraine

En soutenant l’IA souveraine, Nvidia entend bien maintenir son quasi-monopole en Europe dans la fourniture d’infrastructures dédiées à l’IA, et plus largement à la simulation par ordinateur. Lire la suite
par
- Gaétan Raoul, LeMagIT
Actualités 10 juin 2025
« From Chip to Cloud » et vice-versa : la stratégie de Microsoft en matière d’IA locale

Pour Microsoft, l’IA générative et agentique est un coup de fouet à la vente d’ordinateurs en entreprise. Peu importe le form factor, le chipset qui le propulse, l’appareil confié aux collaborateurs doit être prêt pour l’IA. Car les modèles de langage et de machine learning ne sont pas voués à rester sur le cloud. Lire la suite
par
- Gaétan Raoul, LeMagIT
Actualités 10 juin 2025
Untether AI, Brium et Enosemi : les rachats d’AMD pour rattraper Nvidia

Si Enosemi ne doit servir qu’à perfectionner les réseaux d’entraînement de LLM en datacenters, les deux autres startups permettront à AMD de progresser significativement dans l’optimisation des IA pour les entreprises. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 06 juin 2025
Semiconducteurs : Les USA réduisent la voilure du CHIPS Act

L’administration Trump annonce revoir à la baisse les subventions déjà consenties dans le cadre de ce plan d’investissement de 52,7 milliards de dollars, voté sous Joe Biden pour relancer l’industrie des semiconducteurs sur le sol américain. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 03 juin 2025
Puces IA : EnCharge AI lance une alternative à Qualcomm

Dans la catégorie des accélérateurs pour PC, la puce EN100 de la startup américaine n’est pas intrinsèquement plus puissante que le Cloud AI 100 de Qualcomm, mais elle est beaucoup moins énergivore. Ce qui permet de pousser sa fréquence. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 23 mai 2025
Michael Dell milite pour l’essor des IA privées

Le patron de Dell estime que trop de fournisseurs informatiques travaillent à équiper les centres de calcul géants. Selon lui, les entreprises préfèrent déployer une IA personnalisée, d’appoint, entre leurs murs. Lire la suite
par
- Yann Serra, LeMagIT
- Tim McCarthy, Former News Writer
Actualités 21 mai 2025
PC : Dell dévoile une gamme pour l’IA de pointe sur le bureau

Les nouvelles stations portables Dell Pro Max AI devraient arriver d’ici à la fin de l’année avec la capacité d’utiliser gratuitement, sans passer par le cloud, des LLM de 30 à 109 milliards de paramètres, selon la configuration. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 20 mai 2025
Nvidia interconnecte les GPU des hyperscalers avec DGX Cloud Lepton

Nouvelle mouture du courtier Lepton AI racheté en avril dernier, le service en ligne permet à Nvidia de commercialiser des clusters de calcul virtuels qui n’ont pas de limite de capacité puisqu’ils piochent des ressources chez différents hyperscalers. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 20 mai 2025
Dell dévoile les premiers serveurs Blackwell pour l’entreprise

Allant bien au-delà de l’unique configuration présentée par Nvidia, Dell commercialise des serveurs équipés des derniers GPU B300, qui fonctionnent avec des processeurs x86 traditionnels et peuvent même être refroidis par simple ventilation. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 28 avr. 2025
L’impact énergétique de l’IA, une affaire de données

Lors de la conférence ChangeNow, James Martin (fondateur de BetterTech) et Axelle Lemaire (directrice développement durable chez Sopra Steria) ont réclamé à OpenAI de transmettre les données sur la consommation énergétique réelle de ses services. Un exercice difficile qui transparaît dans un rapport mené par l’agence internationale de l’énergie. Lire la suite
par
- Gaétan Raoul, LeMagIT
Actualités 23 avr. 2025
GPU : Huawei lance ses alternatives aux puces de Nvidia

En Chine, le constructeur va successivement lancer une puce moins puissante que le H100, mais livrée dans des machines plus performantes que les derniers clusters de Nvidia, puis un modèle Ascend 920 qui égale ses performances. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 22 avr. 2025
Cloud souverain : un service Kubernetes chez OUTSCALE

La filiale cloud de Dassault Systèmes renforce son offre souveraine avec « OKS », une offre Kubernetes managée, sur une infrastructure certifiée SecNumCloud. OUTSCALE vise les workloads critiques des entreprises et du secteur public, ainsi que les projets d’Intelligence artificielle. Lire la suite
par
- Philippe Ducellier, Rédacteur en chef adjoint
Actualités 15 avr. 2025
Un accès WAN, un nouveau TPU et de l’IA sur site chez GCP

Les offres d’infrastructure du cloud de Google s’enrichissent d’une appliance hyperconvergée équipée des derniers GPU de Nvidia, pour exécuter localement l’IA Gemini, des puces accélératrices Ironwood et de fibres dédiées. Lire la suite
par
- Yann Serra, LeMagIT
Opinion 11 avr. 2025
Pourquoi Apple Intelligence a besoin d’ouverture

Pour leurs premiers pas, les fonctions d’IA générative de macOS, iOS et iPadOS souffrent d’un éventail de cas d’usage limité. Sans compter l’extension exclusive à ChatGPT et l’absence d’accès à ces fonctions pour les développeurs. Lire la suite
par
- Valéry Rieß-Marchive, Rédacteur en chef
Opinion 10 avr. 2025
Cybersécurité : comment ESET utilise l’IA locale sur PC

Si les PC embarquant de l’intelligence artificielle sont porteurs de promesses, les cas d’utilisation concrets ne sont pas encore très nombreux. ESET se distingue là avec des applications plus concrètes. Lire la suite
par
- Gabe Knuth, Senior analyst
Actualités 07 avr. 2025
Llama 4 : Meta s’inspire de ses concurrents chinois

Le géant des réseaux sociaux met ses moyens importants à profit pour entraîner des LLM dotés d’une architecture Mixture of Experts. Largement inspiré de DeepSeek et Alibaba, le travail effectué n’empêche pas certains reproches concernant les performances des LLM et leur ouverture. Lire la suite
par
- Gaétan Raoul, LeMagIT
Opinion 07 avr. 2025
La sécurité pourrait être le cas d’utilisation dont les PC IA ont besoin

Les PC qui embarquent de l’intelligence artificielle ont eu du mal à trouver un cas d’utilisation parfait, mais le besoin de systèmes de sécurité plus solides sur les postes de travail pour aider. Lire la suite
par
- Gabe Knuth, Senior analyst
Actualités 30 mars 2025
Stockage : les solutions certifiées par Nvidia lors de la GTC 2025

DDN, Dell, HPE, Hitachi Vantara, NetApp, Pure Storage, Vast Data et Weka ont désormais chacun des solutions officiellement compatibles avec les clusters de calcul de nouvelle génération de Nvidia. Lire la suite
par
- Antony Adshead, Storage Editor
Actualités 27 mars 2025
Stations de travail : HP lance des modèles pour l’IA sur site

Le fabricant met à jour ses petites stations graphiques avec des modèles équipés d’une toute nouvelle puce d’AMD, le Ryzen AI Max, un SoC qui reprend les bonnes idées des Mac pour accélérer l’IA. Le public visé va désormais au-delà des professionnels de l’image. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 24 mars 2025
GTC2025 : « Nvidia recentre sa production sur les GPU haut de gamme »

Malgré un catalogue a priori aussi riche qu’auparavant, les nouveaux GPU Blackwell ne seront d’abord disponibles que sur un nombre très limité de modèles. Le très haut de gamme GB200 pour les hyperscalers et des cartes RTX pour le reste du monde. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 19 mars 2025
GTC2025 : Nvidia améliore déjà ses GPU Blackwell

Alors que les modèles B100 et B200 sortent à peine d’usine, le fabricant dévoile déjà un GPU B300 50 % plus rapide. Un système d’orchestration Dynamo, qui optimise leur fonctionnement, et des versions pour stations de travail sont aussi dévoilés. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 14 mars 2025
IA embarquée : Qualcomm rachète Edge Impulse

Qualcomm met la main sur Edge Impulse, l’éditeur californien d’une plateforme d’entraînement et de déploiement de modèles d’IA sur des équipements IoT. Un moyen d’étoffer son portfolio grandissant et de rendre tangible « l’Edge GenAI ». Lire la suite
par
- Gaétan Raoul, LeMagIT
Actualités 13 mars 2025
Command A : Cohere réduit lui aussi l’empreinte GPU de ses LLM

Le Canadien Cohere a présenté Command A, un modèle de 111 milliards de paramètres. Ce LLM conçu pour s’exécuter sur site tient sur deux GPU Nvidia H100 ou A100 et doit répondre aux besoins des entreprises. Lire la suite
par
- Gaétan Raoul, LeMagIT
Actualités 12 mars 2025
Gemma 3 : Google lance des modèles frugaux dédiés aux développeurs

Les modèles Gemma 3 sont multilingues, multimodaux, traitent plus de données tout en ne réclamant qu’un seul GPU pour s’exécuter. Ce faisant, les équipes de Google DeepMind ciblent les développeurs. Lire la suite
par
- Gaétan Raoul, LeMagIT
Actualités 12 mars 2025
À la rencontre d’Alps, le second plus puissant supercalculateur d’Europe

Dans cette interview, Thomas Schulthess, directeur du CSCS et professeur de physique informatique à l’ETH, explique le développement de l’un des supercalculateurs les plus rapides au monde, l’Alps, déployé sur le sol suisse. Lire la suite
par
- Pat Brans, Pat Brans Associates/Grenoble Ecole de Management
Actualités 06 mars 2025
IA : CoreWeave s’apprête à acquérir Weights & Biases

Dans la foulée de l’annonce de son dépôt de dossier d’introduction en bourse, le spécialiste des infrastructures GPU a annoncé sa volonté d’acquérir Weights & Biases, l’éditeur d’une plateforme de mise en production des modèles d’IA. Lire la suite
par
- Gaétan Raoul, LeMagIT