Jensen Huang a profité de la GTC 2026 à San José pour formaliser la vision économique qu’il pousse depuis plusieurs trimestres : dans l’ère de l’IA, l’unité centrale de valeur n’est plus le logiciel, ni même le GPU, mais le token. Selon le CEO de Nvidia, tout doit désormais se lire à travers cette brique numérique, qu’il s’agisse de consommation, de productivité, d’indicateurs de performance ou même de rémunération.
Au cœur de cette doctrine, le datacenter classique se transforme en « AI Factory », une usine à tokens. La production ne se mesure plus en calcul brut, mais en volume de tokens générés par des modèles et des agents d’IA. Dans cette logique, le token devient le proxy de la productivité numérique d’une entreprise, voire d’un pays. La métrique clé n’est plus seulement la puissance installée, mais le token par watt : chaque watt qui ne produit pas de tokens est vu comme du revenu perdu. Huang a même chiffré le potentiel du modèle : 100 milliards de dollars investis dans des supercentres d’IA de 1 GW pourraient, selon lui, générer jusqu’à 150 milliards de dollars de revenus annuels via la vente de tokens.
Cette bascule donne au token un statut comparable à celui du bit dans l’informatique classique. Déjà utilisé pour découper le texte et facturer des services comme ChatGPT ou Claude, il prend une dimension nouvelle avec l’essor des IA agentiques. Là où un prompt standard consomme un volume limité de tokens, un agent autonome fonctionnant en continu peut en dépenser jusqu’à un million de fois plus. Cette explosion de la demande fait du token une marchandise stratégique : plus une organisation en consomme, plus elle peut automatiser et personnaliser ses services.
Jensen Huang anticipe ainsi une mutation profonde du modèle logiciel. Les entreprises ne seront plus seulement locataires d’outils — SaaS, licences, abonnements — mais loueront des agents qui utiliseront ces outils et consommeront des tokens en leur nom. Pour les DSI, cela implique l’apparition d’une nouvelle ligne budgétaire, aux côtés des postes CPU/GPU et des licences SaaS : des enveloppes de tokens dédiées à chaque fonction métier ou à chaque famille d’agents. Huang estime que ce marché, qui intègre la valeur des agents et de leurs flux, pourrait largement dépasser le marché actuel du logiciel, évalué à plusieurs milliers de milliards de dollars.
La vision s’étend même aux ressources humaines. À la GTC 2026, Huang a évoqué l’idée de budgets de tokens individuels pour les ingénieurs, intégrés directement à leur package de rémunération. Son raisonnement est à la fois économique et managérial : un ingénieur disposant de ressources de calcul massives peut multiplier sa productivité par dix. Dans cette optique, consacrer 100 à 1 000 dollars par jour en coûts d’inférence pour un profil d’exception peut devenir un investissement rentable si les agents pilotés créent suffisamment de valeur. Le marché du travail semble déjà intégrer ce signal, certains candidats interrogeant désormais les employeurs sur les ressources de calcul disponibles, qui deviennent un critère d’attractivité à part entière.
Face aux investissements massifs requis par cette nouvelle infrastructure, Nvidia défend une équation simple : plus de compute produit plus de tokens, lesquels se monétisent via des modèles de facturation progressifs, avec un accès gratuit pour acquérir l’utilisateur puis une monétisation au volume. Pour Huang, le succès de l’écosystème reposera sur deux leviers que Nvidia entend verrouiller structurellement : le coût par token généré et le ratio tokens par watt.
En positionnant ses GPU comme les machines les plus efficaces pour produire des tokens moins chers et plus nombreux, Nvidia ne vend plus seulement du matériel. L’entreprise se place au centre d’une économie qu’elle contribue elle-même à définir, avec le token comme unité de mesure fondamentale — sans doute l’ambition la plus durable affichée à San José cette année.