ARTICLES / IA

La grande ruée sur les GPU : à quoi servent ces puces, et pourquoi le monde se les arrache

← Tous les articles
IA 4 juin 2026 11 min de lecture par Les Techniciens du Net

La grande ruée sur les GPU : à quoi servent ces puces, et pourquoi le monde se les arrache

Les GPU sont devenues l'objet le plus convoité de la tech. À quoi elles servent, d'où vient la pénurie, et les chaînes de dépendance cachées — de Taïwan à l'hélium et au néon. Une lecture stratégique.

#ia#gpu#géopolitique#semi-conducteurs

Il y a un objet que les plus grandes entreprises du monde s’arrachent à coups de milliards, que des États tentent de stocker comme une réserve stratégique, et qui se retrouve parfois passé en contrebande à travers les frontières. Ce n’est ni un smartphone ni un vaccin : c’est une puce électronique, la GPU. Comprendre pourquoi elle est devenue si précieuse, c’est lire une carte de pouvoir — où chaque maillon de la chaîne est un point de levier.

À quoi sert une GPU, au juste ?

Une GPU (Graphics Processing Unit) est née pour une tâche : calculer des images, dans les jeux vidéo. Or afficher une scène en 3D, c’est faire des millions de petits calculs identiques en même temps. Là où un processeur classique (CPU) possède quelques cœurs très puissants qui traitent les tâches l’une après l’autre, une GPU aligne des milliers de cœurs plus simples qui travaillent en parallèle.

Cette architecture, pensée pour les pixels, s’est révélée parfaite pour l’intelligence artificielle. Entraîner un modèle d’IA, c’est essentiellement empiler d’immenses multiplications de matrices — exactement le genre de calcul massivement parallèle qu’une GPU dévore. La même puce qui faisait tourner un jeu fait aujourd’hui tourner ChatGPT.

L’image la plus juste : pendant la ruée vers l’or de l’IA, les GPU sont les pelles et les pioches. Et celui qui vend les pelles ne perd jamais.

L’engouement : une demande qui a explosé

À partir de 2023, l’essor des IA génératives a transformé une demande déjà forte en frénésie. Chaque grande entreprise du cloud — voir les grands fournisseurs du cloud — a voulu bâtir ses propres « usines à calcul ». Les délais de livraison se sont allongés à plusieurs mois, et un acteur a raflé la mise : Nvidia, qui conçoit les GPU les plus convoitées et truste l’écrasante majorité du marché de l’IA, en partie grâce à son logiciel maison (CUDA) que toute l’industrie a appris à utiliser.

Résultat : une poignée de modèles de puces sont devenus un goulot mondial. Pas parce qu’on manque d’idées — parce qu’on ne sait pas en fabriquer assez.

Le goulot d’étranglement : ce n’est pas qu’une question d’usine

Ici, une nuance stratégique que beaucoup ratent. Nvidia ne fabrique pas ses puces : elle les conçoit. La production est confiée à un sous-traitant, le fondeur. Et pour les puces de pointe, il n’y en a quasiment qu’un : TSMC, à Taïwan.

Mais le vrai blocage n’est même pas la gravure de la puce. Ce sont deux étapes moins connues :

  • L’assemblage avancé (packaging) : les GPU d’IA collent la puce de calcul à des piles de mémoire ultra-rapide sur un même support (une technologie appelée CoWoS chez TSMC). Cette capacité d’assemblage a longtemps été le verrou de la production.
  • La mémoire HBM (High Bandwidth Memory) : ces piles de mémoire ne sont fabriquées que par trois acteurs (SK Hynix, Samsung, Micron). Pas assez de HBM, pas de GPU.

Autrement dit, la pénurie ne vient pas d’un manque de sable ou de silicium. Elle vient d’une poignée d’étapes que très peu d’usines au monde savent réaliser.

Les points de passage obligés

Quand on raisonne en stratège, on cherche les chokepoints : ces endroits où tout doit passer, et qu’il suffit de bloquer pour tout arrêter. La chaîne des GPU en concentre deux, redoutables :

  • TSMC, à Taïwan. L’essentiel des puces les plus avancées du monde sort d’une seule île, au cœur d’une zone de tensions entre la Chine et les États-Unis. Une perturbation à Taïwan, et c’est toute l’industrie mondiale qui vacille.
  • ASML, aux Pays-Bas. Les machines de lithographie EUV, indispensables pour graver les puces les plus fines, ne sont fabriquées que par une seule entreprise au monde. Aucune usine de pointe ne peut exister sans elle.

Deux entreprises, deux pays : voilà à quoi tient une part immense de l’économie numérique mondiale.

L’hélium et le néon : les dépendances invisibles

C’est ici que l’histoire devient vertigineuse. Même en possédant les usines et les machines, on ne fabrique pas une puce sans certains gaz rares — et leur approvisionnement est, lui aussi, dangereusement concentré.

  • Le néon. Les lasers qui gravent les puces ont besoin de néon de très haute pureté. Or une grande part du néon de qualité semi-conducteur provenait historiquement d’Ukraine (un sous-produit de la sidérurgie). La guerre déclenchée en 2022 a brutalement perturbé cette source et fait flamber les prix — rappel glaçant qu’un conflit régional peut paralyser des usines à l’autre bout de la planète.
  • L’hélium. Indispensable à la fabrication des puces (atmosphère inerte, refroidissement, détection de fuites) et au fonctionnement des centres de données, l’hélium est une ressource non renouvelable, extraite avec le gaz naturel. Sa production mondiale repose sur une poignée de pays (États-Unis, Qatar, Algérie, Russie), et le secteur a déjà connu plusieurs pénuries sévères. Un gaz qu’on associe aux ballons de baudruche est, en réalité, un maillon critique de l’industrie la plus avancée du monde.

La leçon stratégique : la vulnérabilité n’est jamais là où on la cherche. Elle se niche dans le maillon le plus discret — souvent un consommable qu’on avait oublié de compter.

La guerre froide du calcul

Toutes ces dépendances sont devenues des armes. Depuis 2022, les États-Unis ont restreint l’exportation vers la Chine des GPU les plus puissantes et des machines pour les fabriquer, en entraînant dans leur sillage les Pays-Bas (ASML) et le Japon. L’objectif : freiner l’accès de Pékin au calcul de pointe.

La Chine a répliqué sur son terrain de force : en limitant l’exportation de métaux qu’elle domine (gallium, germanium, terres rares), essentiels à l’électronique. Chacun appuie sur le chokepoint de l’autre.

Au fond, une conviction s’est imposée dans les capitales : le calcul est devenu une ressource stratégique, au même titre que le pétrole au XXᵉ siècle. Qui contrôle les GPU contrôle la vitesse à laquelle un pays — ou une entreprise — peut développer son IA. D’où la course aux fabs locales (les plans d’investissement massifs aux États-Unis, en Europe, au Japon) et l’idée d’un « calcul souverain ».

Lire la carte en stratège

Que retenir, sans être ingénieur ?

  1. La rareté est organisée, pas naturelle. Le silicium est abondant ; ce qui manque, ce sont quelques capacités industrielles ultra-spécialisées. Cela peut se construire — mais cela prend des années et des fortunes.
  2. La résilience se joue sur les maillons faibles. Une puce dépend d’une île, d’une machine néerlandaise, d’un gaz ukrainien. La vraie question stratégique n’est pas « qui a la meilleure puce ? » mais « qui tient le robinet ? ».
  3. Le calcul est un actif géopolitique. Surveiller la diversification des usines, les contrôles à l’export et les tensions sur les matières premières en dit plus long sur l’avenir de l’IA que la prochaine démo spectaculaire.

En une phrase

La ruée sur les GPU n’est pas une bulle de geeks : c’est la bataille pour le carburant de l’IA. Et comme toute ressource stratégique, sa valeur ne tient pas qu’à la puce elle-même, mais à la longue chaîne fragile qui permet de la produire — jusqu’au gaz qu’on croyait réservé aux ballons d’anniversaire.