Jalapeño 而非 Stargate:OpenAI 调整了优先事项

Jalapeño plutôt que Stargate : OpenAI a revu ses priorités

Silicon.fr by Clément Bohic 2026-06-26 09:57 Original
摘要
OpenAI缩减了Stargate项目规模,包括得州园区扩建取消、挪威和英国计划暂停,部分电力容量转由微软接管;同时,公司通过NVIDIA、AMD、亚马逊等签订数十吉瓦GPU协议,并与博通合作自研推理芯片Jalapeño,将重心转向灵活获取算力以应对IPO前的成本控制。

面对AI算力的巨大需求,OpenAI正重新调整战略优先级:Stargate合资项目固然仍在推进,但已不再是获取计算资源的唯一或主要路径。在筹备IPO的背景下,公司开始控制开支,缩减或暂停部分数据中心建设,转而通过多源芯片合作与租赁方式保障算力。

Stargate计划最初旨在4年内筹集5000亿美元构建AI基础设施,合作伙伴包括甲骨文、软银、阿联酋主权基金MGX,Arm、微软和英伟达为技术伙伴。其标志性工程——得克萨斯州阿比林的数据中心园区——早在2024年7月就已启动,由Crusoe主导,原计划建成10栋楼、1.2 GW算力。但至最新情况,实际投运容量不足300 MW,且原定扩至2.1 GW的后续方案在2026年初被OpenAI与甲骨文叫停。背后原因包括融资困难、电网接入延迟,以及对Stargate这一“图腾”的主动降温。微软随后接管了那900 MW的容量。

国际拓展同样收缩。2025年5月宣布的阿联酋项目(与G42合作,目标1 GW,其中200 MW计划2026年投运)以及7月公布的挪威项目(与Nscale合作,目标500 MW,最高25万GPU)均未按原计划落地:挪威项目上OpenAI未能就全容量达成协议,微软接手约3万颗GPU;2025年9月启动的英国Stargate项目更在次年春季被暂停,官方理由为能源价格和监管限制,此前OpenAI曾考虑采购最多3.1万颗GPU。

与此同时,一系列冠以Stargate品牌的新园区仍在美本土推进。得州另有Vantage Data Centers建设的1.4 GW项目(软银供芯)和SB Energy承建的1.2 GW项目;新墨西哥州的“木星项目”规划2 GW,Blue Owl承诺5年投入500亿美元,但因审批不透明遭遇诉讼;密歇根州“谷仓”项目1.4 GW(甲骨文购芯,2027年初运营)和Lighthouse项目900 MW(同由甲骨文供芯,2028年开工)亦在2025年10月揭晓。

真正显示战略重心转移的,是OpenAI在Stargate框架外布下的算力大局。SB Energy在俄亥俄州为其建造非Stargate数据中心,远期目标10 GW英伟达算力,首期800 MW预计2028年投用;OpenAI还计划租赁微软与Vantage刚建成的俄亥俄州Fairwater园区资源。而在芯片供应上,公司正极力实现多元化,以摆脱对单一路径的依赖。

2025年9月,OpenAI承诺再部署至少10 GW英伟达GPU,包括2026年二季度上线的1 GW Vera Rubin,英伟达则宣布拟向OpenAI投资最高1000亿美元。10月,又与AMD签订最高6 GW Instinct GPU的部署协议,首期1 GW MI450,并获得以优惠条件将持股比例提至10%的选择权。11月,与亚马逊签下7年380亿美元的协议,主要使用GB200/GB300;2026年初再追加1000亿美元(8年期),并承诺使用约2 GW亚马逊Trainium芯片。

更关键的是,OpenAI已携手博通走上自研之路,首款推理专用ASIC“Jalapeño”虽未大规模部署,却已承载部分GPT-5.3-Codex-Spark等负载。双方于2025年10月正式确立合作,目标是2029年前部署10 GW自研加速器,总裁Greg Brockman透露,联合研发已悄然进行18个月。此外,Stargate项目的数位高管也在年初跳槽至Meta,为这一转向添加了注脚。

Summary
OpenAI has shifted its compute strategy away from the troubled Stargate datacenter joint venture (with Oracle, SoftBank, and MGX) toward securing capacity through massive GPU and ASIC deals, including up to 10 GW with NVIDIA, 6 GW with AMD, multi-billion-dollar Amazon Trainium agreements, and the deployment of its own Broadcom-designed inference chip, Jalapeño, while many Stargate campus projects face delays, cutbacks, or Microsoft takeover.

For OpenAI, the top priority is securing compute capacity—whether or not it bears the Stargate label. The high-profile joint venture launched in early 2025 with a target of $500 billion in funding over four years is not being abandoned, but the company’s approach to meeting its infrastructure needs is pivoting away from a single-minded focus on building massive datacenters. As OpenAI prepares for an IPO and faces practical delays, it is embracing chip diversity, in‑house inference silicon, and multi‑vendor deals, while scaling back or stalling several ambitious Stargate construction projects.

Texas flagship scaled back

The original Stargate showcase is a campus in Abilene, Texas, where work began in July 2024 under Crusoe, aiming for 1.2 GW across ten buildings. Less than 300 MW are operational today, mostly since September 2025, after Oracle delivered the first GB200 racks in June. A proposed expansion to 2.1 GW was scrapped in early 2026. Financing hurdles, delays in grid connection, and a broader distancing from the Stargate totem—intensified by IPO‑driven spending discipline—led OpenAI and Oracle to abandon the extension. Microsoft ultimately took over those 900 MW.

International retreat

Overseas Stargate projects have also shrunk. A May 2025 plan with G42 for 1 GW in Abu Dhabi (200 MW operational by 2026) was announced, but no further expansion is confirmed. In Norway, a 500 MW initiative with Nscale, starting with 100,000 GPUs, failed to reach an agreement for the full capacity; Microsoft stepped in for about 30,000 GPUs. The Stargate UK project, launched in September 2025 with Nscale, was paused entirely in spring 2026, officially due to energy prices and restrictive regulation, despite OpenAI considering up to 31,000 GPUs.

US Stargate projects still on the board

Several domestic Stargate efforts continue. In Texas, two additional campuses are in the pipeline: a Vantage Data Centers development for 1.4 GW, with first delivery expected in H2 2026, and a SB Energy‑built site in Burlington aimed at 1.2 GW, phase one due October 2026. SoftBank supplies chips for both. In New Mexico, the Jupiter project targets 2 GW financed by Blue Owl ($50 billion over five years) and built by STACK Infrastructure, though it has faced legal challenges over permitting opacity. Two October 2025 announcements rounded out the wave: “The Barn” in Michigan, a 1.4 GW campus built by Related Digital with Oracle supplying chips, expecting operation in early 2027; and “Lighthouse,” a 900 MW Vantage project with Oracle chips, starting construction in 2028.

Compute outside Stargate

In Ohio, SB Energy is building a non‑Stargate datacenter for OpenAI targeting 10 GW on NVIDIA hardware, with a first 800 MW tranche online by 2028. OpenAI is also seeking to lease resources on Microsoft’s Fairwater campus in Mount Pleasant, Ohio, a Vantage‑built site recently completed.

From Stargate to Jalapeño: the chip diversification

The clearest sign of shifting priorities is OpenAI’s multi‑source chip strategy. In September 2025, it committed to at least 10 GW of additional NVIDIA GPUs, starting with 1 GW of Vera Rubin in H2 2026; NVIDIA reciprocated with intention to invest up to $100 billion in OpenAI. An October deal with AMD targets up to 6 GW of Instinct GPUs, beginning with 1 GW of MI450 in H2 2026, with AMD giving OpenAI the option to acquire up to 10% of its stock on preferential terms. In November, a $38 billion, seven‑year agreement with Amazon focused on GB200 and GB300 via EC2 UltraServers was followed in early 2026 by a $100 billion, eight‑year add‑on, including around 2 GW of Trainium chips on AWS infrastructure.

Most telling is OpenAI’s own silicon. Since October 2025, a partnership with Broadcom—already 18 months in the making, according to Greg Brockman—aims to deploy 10 GW of accelerators by 2029. The first fruit is an inference‑dedicated ASIC called Jalapeño. While not yet in mass deployment, it already handles workloads such as GPT‑5.3‑Codex‑Spark, underscoring a future where custom hardware curtails dependence on external GPU suppliers and expensive Stargate builds.

*Note: Several senior Stargate figures left for Meta earlier this year, further signaling the initiative’s diminished centrality.*

Résumé
OpenAI réoriente sa stratégie de calcul, reléguant les projets pharaoniques de datacenters Stargate (retards, réductions de capacité ou pauses au Texas, en Norvège et au Royaume-Uni) au profit de contrats massifs avec NVIDIA, AMD et Amazon, ainsi que du développement de sa propre puce Jalapeño avec Broadcom. Ce virage vise à sécuriser des capacités de calcul de façon plus flexible et à rationaliser les dépenses avant son introduction en Bourse.

Stargate ou pas, le plus important est de sécuriser de la capacité de calcul.

Cette inflexion est perceptible dans la stratégie d’OpenAI. La coentreprise, lancée en grande pompe début 2025 avec la bénédiction de Washington, n’est pas remise en cause. Mais la réponse aux besoins en compute passe moins systématiquement par des projets de construction de datacenters.

Contretemps et revirements pour la vitrine texane de Stargate

Stargate est censé fédérer 500 Md$ de financements sur 4 ans afin de créer une infrastructure d’IA pour OpenAI. Oracle, SoftBank et le fonds souverain émirati MGX s’y sont associés. Arm, Microsoft et NVIDIA sont partenaires technologiques.

La vitrine de l’initiative est un campus de datacenters à Abilene (Texas). Sur place, les travaux avaient démarré dès juillet 2024, sous la houlette de la société d’infrastructure Crusoe. Il était alors question d’atteindre, à terme, 1,2 GW de puissance informatique sur une dizaine de bâtiments.

Aux dernières nouvelles, moins de 300 MW sont opérationnels. L’essentiel l’est depuis septembre 2025 (Oracle avait livré les premiers racks GB200 au mois de juin). Il existait un projet d’extension à 2,1 GW. Mais début 2026, OpenAI et Oracle ont décidé de ne pas le poursuivre. En toile de fond, des difficultés de financement, du retard dans le raccordement du réseau électrique… et donc, plus globalement, une certaine prise de distance vis-à-vis du totem Stargate* ; a fortiori dans la perspective de l’IPO, qui pousse à rationaliser les dépenses. Microsoft a finalement « récupéré » cette tranche de 900 MW.

Réduction de voilure à l’international

En mai 2025, Stargate avait commencé à essaimer à l’international. OpenAI avait officialisé un projet aux Émirats arabes unis, avec la holding G42. Il s’agissait de déployer pour 1 GW à Abu Dhabi, dont 200 MW qui seraient opérationnels en 2026.

En juillet 2025, on nous avait annoncé une deuxième initiative hors des USA. En Norvège, en l’occurrence, avec l’entreprise britannique Nscale. Objectif : 500 MW. Avec 100 000 GPU pour commencer et potentiellement 250 000 à terme.

OpenAI n’a finalement pas trouvé d’accord pour exploiter l’ensemble de la capacité. Microsoft a pris le relais pour environ 30 000 GPU.

Le projet Stargate UK, lancé en septembre 2025 également avec Nscale, a carrément été mis en pause au printemps 2026. Officiellement, au nom des prix de l’énergie que d’une réglementation jugée trop restrictive. OpenAI avait dit envisager un contrat d’achat allant jusqu’à 31 000 GPU.

Du Michigan au Nouveau-Mexique, des campus Stargate… en puissance

Le Texas accueillie deux autres projets placés sous la bannière Stargate. L’un est situé à une vingtaine de kilomètres du flagship d’Abilene. Annoncé en août 2025, il est développé par Vantage Data Centers. Objectif : 1,4 GW de puissance IT sur 10 datacenters – le premier devant être livré au S2 2026. SoftBank fournira les puces. Même chose pour l’autre projet, localisé à Burligton. Sa filiale SB Energy assure la construction. La phase 1 doit se terminer en octobre 2026. Objectif : 1,2 GW.

En septembre 2025 fut annoncé un autre site Stargate, dit Project Jupiter. Localisé à Santa Teresa (Nouveau-Mexique), il est censé atteindre 2 GW. Blue Owl en est le principal financeur, avec un premier investissement de 50 Md$ sur 5 ans. STACK Infrastructure assure la construction. Le projet a fait l’objet de poursuites judiciaires pour l’opacité de la procédure d’autorisation.

Les deux dernières annonces de campus Stargate remontent à octobre 2025.

Un projet, baptisé The Barn, se trouve à Benton (Michigan). Related Digital assure la construction. Les premiers bâtiments devraient être opérationnels début 2027. Capacité visée : 1,4 GW, Oracle devant acquérir les puces.

L’autre projet, appelé Lighthouse, est confié à Vantage Data Centers. Avec, là aussi, Oracle pour fournir les puces. Sa construction doit démarrer en 2028. Capacité visée : 900 MW sur 4 datacenters.

Des gigawatts hors du périmètre Stargate

SB Energy construit actuellement, dans l’Ohio, un datacenter hors du périmètre Stargate. OpenAI y ciblerait 10 GW de capacité de calcul, sur du NVIDIA. Il faudrait attendre 2028 pour qu’une première tranche de 800 MW entre en fonction.

Toujours dans l’Ohio, OpenAI cherche aussi à louer des ressources sur le campus Fairwater de Mount Pleasant. Microsoft vient d’en achever la construction avec Vantage Data Centers, deux ans après avoir annoncé le projet.

Instinct, Trainium, Jalapeño… OpenAI voit au-delà de NVIDIA

En septembre 2025, OpenAI s’était engagé à déployer au moins 10 GW supplémentaires de GPU NVIDIA. À commencer, au S2 2026, par 1 GW de Vera Rubin. NVIDIA avait annoncé, en retour, son intention d’investir jusqu’à 100 Md$ dans OpenAI.

En octobre avait suivi un accord avec AMD pour déployer jusqu’à 6 GW de GPU Instinct. Première étape : 1 GW en MI450 au S2 2026. En retour, AMD lui a donné la possibilité de monter à 10 % de son capital, à des conditions préférentielles.

En novembre, OpenAI avait signé, avec Amazon, un accord à 38 Md$ sur 7 ans, axé essentiellement sur l’usage de GB200 et GB300 via les UltraServers EC2. Début 2026, il y avait ajouté 100 Md$, échelonnés sur 8 ans. Cela comprenait un engagement à exploiter environ 2 GW en puces Trainium, via l’infra AWS.

En parallèle, OpenAI a travaillé à concevoir ses propres puces, avec Broadcom. Premier fruit de cette collaboration : l’ASIC Jalapeño, dédié à l’inférence. Pas encore massivement déployé, il porte néanmoins déjà quelques workloads, notamment avec GPT-5.3-Codex-Spark.

OpenAI et Broadcom avaient officialisé leur partenariat en octobre 2025. Elle s’assortissait de l’ambition de déployer, à l’horizon 2029, 10 GW d’accélérateurs. Greg Brockman avait alors expliqué que la collaboration entre les deux entreprises durait depuis 18 mois.

* Plusieurs pontes de l’initiative Stargate sont d’ailleurs partis chez Meta en début d’année.

Illustration générée par IA

The post Jalapeño plutôt que Stargate : OpenAI a revu ses priorités appeared first on Silicon.fr.

AI Insight
Core Point

OpenAI shifts from massive Stargate datacenter builds to a diversified, cost‑conscious compute strategy using chips from multiple vendors and custom ASICs, driven by pre‑IPO rationalization and project setbacks.

Key Players
  • OpenAI — AI research and deployment company, US.
  • Oracle — Cloud infrastructure and datacenter operator, US.
  • SoftBank — Technology investment conglomerate, Japan.
  • MGX — Sovereign wealth fund, UAE.
  • Microsoft — Cloud and software provider, US.
  • NVIDIA — GPU and AI accelerator maker, US.
  • AMD — Chipmaker supplying Instinct GPUs, US.
  • Amazon (AWS) — Cloud provider offering Trainium chips, US.
  • Broadcom — Semiconductor company co‑developing custom ASICs, US.
Industry Impact
  • ICT: High — procurement model change impacts cloud providers and datacenter investments.
  • Computing/AI: High — multi‑vendor chip strategy and custom ASICs reshape the AI hardware market.
  • Energy: Medium — scaled‑back mega‑projects ease immediate power demand, but overall compute growth persists.
Tracking

[Strongly track] — Strategic pivot by a top AI firm ahead of IPO transforms AI compute supply chains and competitive dynamics.

Related Companies

No companies linked yet

Categories
半导体 人工智能 云计算
AI Processing
2026-06-26 15:40
deepseek / deepseek-v4-pro