Jensen Huang捍卫他对“token经济”的愿景

Jensen Huang défend sa vision de la « token économie »

Silicon.fr by Philippe Leroy 2026-03-20 17:03 Original
摘要
在GTC 2026上,Nvidia CEO黄仁勋系统阐述了“token经济”愿景:AI数据中心将转变为“AI工厂”,以生成token而非算力为核心产出,并提出“token/瓦特”将成为关键效率指标,1000亿美元级AI超级中心有望带来年收入1500亿美元。 他还指出,企业未来不只是租用软件,而是租用AI代理并为token设预算,甚至可把token额度纳入工程师薪酬;这将推动企业IT、招聘和成本管理重构,同时强化Nvidia在AI基础设施和推理成本竞争中的主导地位。

Jensen Huang a profité de la GTC 2026 à San José pour formaliser la vision économique qu’il pousse depuis plusieurs trimestres : dans l’ère de l’IA, l’unité centrale de valeur n’est plus le logiciel, ni même le GPU, mais le token. Selon le CEO de Nvidia, tout doit désormais se lire à travers cette brique numérique, qu’il s’agisse de consommation, de productivité, d’indicateurs de performance ou même de rémunération.

Au cœur de cette doctrine, le datacenter classique se transforme en « AI Factory », une usine à tokens. La production ne se mesure plus en calcul brut, mais en volume de tokens générés par des modèles et des agents d’IA. Dans cette logique, le token devient le proxy de la productivité numérique d’une entreprise, voire d’un pays. La métrique clé n’est plus seulement la puissance installée, mais le token par watt : chaque watt qui ne produit pas de tokens est vu comme du revenu perdu. Huang a même chiffré le potentiel du modèle : 100 milliards de dollars investis dans des supercentres d’IA de 1 GW pourraient, selon lui, générer jusqu’à 150 milliards de dollars de revenus annuels via la vente de tokens.

Cette bascule donne au token un statut comparable à celui du bit dans l’informatique classique. Déjà utilisé pour découper le texte et facturer des services comme ChatGPT ou Claude, il prend une dimension nouvelle avec l’essor des IA agentiques. Là où un prompt standard consomme un volume limité de tokens, un agent autonome fonctionnant en continu peut en dépenser jusqu’à un million de fois plus. Cette explosion de la demande fait du token une marchandise stratégique : plus une organisation en consomme, plus elle peut automatiser et personnaliser ses services.

Jensen Huang anticipe ainsi une mutation profonde du modèle logiciel. Les entreprises ne seront plus seulement locataires d’outils — SaaS, licences, abonnements — mais loueront des agents qui utiliseront ces outils et consommeront des tokens en leur nom. Pour les DSI, cela implique l’apparition d’une nouvelle ligne budgétaire, aux côtés des postes CPU/GPU et des licences SaaS : des enveloppes de tokens dédiées à chaque fonction métier ou à chaque famille d’agents. Huang estime que ce marché, qui intègre la valeur des agents et de leurs flux, pourrait largement dépasser le marché actuel du logiciel, évalué à plusieurs milliers de milliards de dollars.

La vision s’étend même aux ressources humaines. À la GTC 2026, Huang a évoqué l’idée de budgets de tokens individuels pour les ingénieurs, intégrés directement à leur package de rémunération. Son raisonnement est à la fois économique et managérial : un ingénieur disposant de ressources de calcul massives peut multiplier sa productivité par dix. Dans cette optique, consacrer 100 à 1 000 dollars par jour en coûts d’inférence pour un profil d’exception peut devenir un investissement rentable si les agents pilotés créent suffisamment de valeur. Le marché du travail semble déjà intégrer ce signal, certains candidats interrogeant désormais les employeurs sur les ressources de calcul disponibles, qui deviennent un critère d’attractivité à part entière.

Face aux investissements massifs requis par cette nouvelle infrastructure, Nvidia défend une équation simple : plus de compute produit plus de tokens, lesquels se monétisent via des modèles de facturation progressifs, avec un accès gratuit pour acquérir l’utilisateur puis une monétisation au volume. Pour Huang, le succès de l’écosystème reposera sur deux leviers que Nvidia entend verrouiller structurellement : le coût par token généré et le ratio tokens par watt.

En positionnant ses GPU comme les machines les plus efficaces pour produire des tokens moins chers et plus nombreux, Nvidia ne vend plus seulement du matériel. L’entreprise se place au centre d’une économie qu’elle contribue elle-même à définir, avec le token comme unité de mesure fondamentale — sans doute l’ambition la plus durable affichée à San José cette année.

Summary
At Nvidia’s GTC 2026 in San Jose, CEO Jensen Huang laid out a new “token economy” framework in which AI value is measured by tokens rather than software or GPUs, and datacenters become “AI factories” optimized for tokens per watt. He argued that agents will drive massive token demand, that companies will shift from renting tools to renting agents, and even that employee compensation could include token budgets to boost productivity. The vision positions Nvidia’s GPUs as the most efficient way to generate cheaper tokens at scale, tying the company’s hardware strategy directly to the economics of AI infrastructure and potentially a multitrillion-dollar software market.

From the stage of GTC 2026 in San Jose, Jensen Huang laid out Nvidia’s most coherent vision yet of the AI economy: the central unit of value is no longer software, or even the GPU, but the token.

Huang framed this as a broader shift in how organizations measure consumption, productivity, performance and even compensation. In his view, the traditional datacenter is giving way to the “AI Factory,” where output is no longer raw compute but the number of tokens generated by AI models and agents. Tokens become the proxy for digital productivity at the level of a company — and potentially a country.

That redefinition has major infrastructure implications. The key metric, Huang argued, is now tokens per watt, and any watt that does not produce tokens is effectively lost revenue. He put a concrete figure on the opportunity: $100 billion invested in AI supercenters reaching 1 GW could generate up to $150 billion in annual revenue through token sales.

The token, in this model, is the equivalent of the bit in classical computing: the fundamental unit of the generative AI era. Already used to break down text and bill services such as ChatGPT or Claude, it takes on a far larger role with agentic AI. A standard prompt consumes a limited number of tokens, but an autonomous agent running continuously can use up to one million times more. That makes tokens a strategic commodity: the more an enterprise consumes, the more it can automate and personalize its services.

Huang also described a structural change in software economics. Today, companies rent tools through SaaS, licenses and subscriptions. Tomorrow, he said, they will rent agents that use those tools and consume tokens on their behalf. For CIOs, that means a new budget line alongside CPU/GPU spending and SaaS licenses: token allocations dedicated to each business function or agent family. Huang suggested this market, including the value of agents and their flows, could far exceed today’s software market, which is worth several trillion dollars.

One of the more unexpected ideas from GTC 2026 concerned hiring. Huang envisions individual token budgets for engineers, built into compensation packages. The logic is both economic and managerial: an engineer with massive compute resources can become up to 10 times more productive. Allocating $100 to $1,000 per day in inference costs to a top performer can be a worthwhile investment if the agents they direct create value. The labor market is already reacting, with candidates reportedly asking employers about available compute resources, turning access to compute into a hiring criterion.

Nvidia’s answer to the coming “war on cost per token” is straightforward: more compute means more tokens, which can then be monetized through tiered pricing models — free access for user acquisition, followed by volume-based monetization. Huang said the ecosystem’s success will depend on two levers Nvidia intends to control structurally: the cost per token generated and the ratio of tokens per watt.

By positioning its GPUs as the most efficient machines for producing cheaper, more abundant tokens, Nvidia is no longer just selling hardware. It is placing itself at the center of an economy whose unit of measure it has helped define — perhaps the most durable ambition Huang articulated in San Jose this year.

Résumé
À la GTC 2026 de San José, Jensen Huang, CEO de Nvidia, a présenté sa vision d’une « token économie » où le token devient l’unité centrale de valeur de l’IA, remplaçant le logiciel et même le GPU comme référence de productivité. Il décrit les datacenters comme des « usines à tokens », avec des métriques clés comme le token par watt, et estime que 100 milliards de dollars investis dans des supercentres d’IA pourraient générer jusqu’à 150 milliards de dollars de revenus annuels. Cette logique bouleverse le modèle économique du secteur : les entreprises ne loueront plus seulement des outils SaaS, mais des agents IA consommant des budgets de tokens, y compris au niveau des rémunérations des ingénieurs. Nvidia se positionne ainsi au centre d’un marché potentiellement supérieur à celui du logiciel, en misant sur des GPU optimisés pour produire plus de tokens à moindre coût.

C’est depuis la scène de la GPU Technology Conference 2026 que Jensen Huang a livré sa vision la plus structurée à ce jour de l’économie de l’intelligence artificielle. Le CEO de Nvidia n’y a pas présenté un simple produit, mais une grille de lecture entièrement nouvelle : l’unité centrale de valeur n’est plus le logiciel, ni même le GPU, c’est le token.

Consommation, productivité, indicateurs de performance et packages de rémunération ; tout s’articule désormais, selon lui, autour de ce fragment numérique.

Le datacenter mué en « usine à tokens »

À la GTC 2026 de San José, Jensen Huang a formalisé un concept qu’il développe depuis plusieurs trimestres : celui de l’ « AI Factory ». Dans cette vision, le datacenter traditionnel s’efface. La production ne se mesure plus en calcul brut, mais en volume de tokens générés par des agents et des modèles d’IA. Le token devient le proxy de la productivité numérique d’une organisation, voire d’un pays.

Cette approche transforme profondément la gestion des infrastructures. La métrique clé devient le token par watt, tandis que chaque watt disponible qui ne produit pas de tokens est désormais comptabilisé comme un revenu perdu. Quant à l’échelle des ambitions, Jensen Huang l’a chiffrée : 100 milliards $ investis dans des supercentres d’IA atteignant 1 GW pourraient générer jusqu’à 150 milliards $ de revenus annuels via la vente de tokens.

Le token, « bit » de l’ère générative

Si le bit était l’unité fondamentale de l’informatique classique, le token est celle de l’IA générative. Déjà utilisé pour fragmenter le texte et facturer des modèles comme ChatGPT ou Claude, il prend une dimension radicalement nouvelle avec l’émergence des IA agentiques.

Contrairement à un prompt standard, qui consomme un volume limité de tokens, un agent autonome fonctionnant en continu peut en dépenser jusqu’ à un million de fois plus. Cette explosion mécanique de la demande propulse le token au rang de marchandise stratégique : plus une entreprise en consomme, plus elle automatise et personnalise ses services.

De la location d’outils à la location d’agents

L’économie logicielle s’apprête à vivre une mutation structurelle. Aujourd’hui, les entreprises sont des locataires d’outils – SaaS, licences, abonnements. Demain, elles loueront des agents qui utilisent ces outils et consomment des tokens en leur nom.

Pour les DSI, cela se traduit concrètement par l’apparition d’une nouvelle ligne budgétaire. Aux côtés des postes CPU/GPU et licences SaaS, il faudra désormais piloter des enveloppes de tokens dédiées à chaque fonction métier ou famille d’agents. Ce marché, intégrant la valeur des agents et de leurs flux, pourrait selon Huang largement dépasser le marché actuel du logiciel, estimé à plusieurs milliers de milliards de dollars.

Les « budgets de tokens » comme levier de recrutement

L’une des propositions les plus inattendues formulées à la GTC 2026 concerne les ressources humaines. Huang imagine des budgets de tokens individuels pour les ingénieurs, intégrés directement au package de rémunération.

L’argument est économique autant que managérial : un ingénieur disposant de ressources de calcul massives peut voir sa productivité multipliée par dix. Allouer 100 à 1 000 dollars de coûts d’inférence quotidiens à un profil d’exception devient alors un investissement rentable, dès lors que les agents qu’il pilote créent de la valeur. Le marché des talents semble déjà enregistrer ce signal : les candidats commenceraient à interroger les employeurs sur l’accès aux ressources de calcul disponibles, faisant de cet accès un critère d’attractivité à part entière.

La guerre du coût par token

Face aux investissements massifs en infrastructures, Nvidia répond par une équation de rentabilité simple : plus de compute génère plus de tokens, lesquels se convertissent en revenus via des modèles de facturation progressifs – accès gratuit pour l’acquisition utilisateur, puis monétisation au volume.

Selon Jensen Huang, e succès de l’écosystème reposera  sur deux leviers que Nvidia entend structurellement verrouiller : le coût par token généré d’une part, et le ratio tokens par watt de l’autre.

En positionnant ses GPU comme les machines les plus efficaces pour produire des tokens moins chers et plus nombreux, Nvidia ne vend plus seulement du matériel. Elle s’installe au cœur d’une économie dont elle a elle-même défini l’unité de mesure  et c’est peut-être là l’ambition la plus durable exprimée à San Jose cette année.

The post Jensen Huang défend sa vision de la « token économie » appeared first on Silicon.fr.

AI Insight
Core Point

Jensen Huang在GTC 2026提出“token经济”框架:AI价值单位从软件/GPU转向token,Nvidia借此把数据中心重定义为“AI工厂”,这将重塑算力投资、计费和企业预算。

Key Players

Nvidia — AI芯片与加速计算公司,美国圣克拉拉。

Jensen Huang — Nvidia CEO,美国。

ChatGPT — OpenAI的生成式AI产品,美国旧金山。

Claude — Anthropic的生成式AI产品,美国旧金山。

Industry Impact
  • ICT: High — 数据中心、云计算、SaaS计费与企业IT预算将围绕token重构
  • Computing/AI: High — 推动推理算力、agent和token计量成为核心商业指标
  • Terminals/Consumer Electronics: Low — 仅间接受益于AI终端算力需求
  • Energy: Medium — AI工厂以GW级电力和token/watt效率为关键约束
Tracking

Strongly track — 这可能成为AI基础设施商业化的新定价标准,并直接利好Nvidia及其生态。

Highlights
Upcoming Event
Related Companies
neutral
neutral
Nvidia
mature
positive
neutral
Categories
半导体 人工智能 软件 云计算
AI Processing
2026-03-26 17:04
openai / gpt-5.4-mini