全端閉環：OpenAI不想再做Nvidia的"大客戶"，溫柔的砍了輝達一刀

2026/06/25

•

2026年6月24日，一張照片從OpenAI舊金山總部傳出。

Broadcom CEO Hock Tan 將一枚晶圓遞到 Sam Altman 手中，兩人身後站著的是 OpenAI 總裁 Greg Brockman 和 Broadcom 半導體事業部總裁 Charlie Kawwas。Altman 的笑容不算誇張，但動作很輕——像是在接一件等了很久的東西。

這張照片講了三個故事。

表層：OpenAI 造出了自己的第一顆晶片。中層：從設計到交付只用了 9 個月——可能是半導體行業有史以來最快的高性能 ASIC 開發周期。深層：Altman 接過的不是一顆晶片，是 AI 基礎設施的權力交接。

這顆晶片叫 Jalapeño。OpenAI 官方把它叫作"Intelligence Processor"——智能處理器。它不是用來訓練模型的，而是專門用來跑推理：每一次 ChatGPT 回答、每一行 Codex 生成的程式碼、每一個 API 呼叫的背後，都是推理。

而推理，正在吃掉 AI 的全部預算。

為什麼是現在——推理經濟的拐點

先看一組數字。

GPT-5.3-Codex-Spark 單次推理的 token 消耗量已經遠超前代。AI Agent（OpenClaw、Hermes 等）的爆發讓 token 需求呈指數級增長。有機構測算，2026 年 AI 推理的計算需求已經達到訓練需求的 4 到 5 倍。

對 OpenAI 來說，推理成本不是"營運開支"，而是業務瓶頸。它每個季度向 Nvidia 支付的 GPU 採購費用，比絕大多數 AI 公司的年收入還高。

問題出在架構上。

GPU 是為訓練設計的。訓練是 brute-force 平行計算，需要把海量資料同時扔給成千上萬個核心。但推理完全不同——它每次處理一個請求，必須在幾百毫秒內完成，瓶頸不是計算速度，而是記憶體搬運。

每一次 ChatGPT 生成回答，模型都要從高頻寬記憶體裡載入巨大的權重矩陣，做幾十層 transformer 的前向傳播，同時維護一個 KV cache——記錄對話中所有已見過的 token——避免每次從零計算。在這個過程裡，GPU 上絕大多數平行計算單元處於閒置狀態。獨立分析顯示，GPU 在推理負載上的利用率只有 60-70%。大量電晶體在空轉，同時還在耗電。

這就是為什麼推理需要專屬晶片。不是"更好的 GPU"，而是"不浪費一個電晶體的 LLM 推理專用機"。

Jalapeño 就是幹這個的。OpenAI 硬體負責人 Richard Ho 的原話："我們圍繞最關鍵的 kernel、記憶體搬運、網路和 serving 模式最佳化了整個架構。"目標是在推理負載上讓實際利用率無限接近理論峰值。

Broadcom CEO Hock Tan 對 Bloomberg 透露：早期測試顯示，Jalapeño 的每 token 推理成本比當前 GPU 降低了約50%。他還對 Reuters 說，Jalapeño 的性能與 Nvidia Blackwell 和 Google TPU 持平。

OpenAI 自己的措辭更謹慎——“每瓦性能大幅超越當前最先進水平”，詳細的技術報告要等幾個月後公佈。

但有一個數字是確定的：9個月。從空白設計到 tape-out，只用了 9 個月。

全端閉環的三層飛輪

Jalapeño 不是一個硬體項目。它是 OpenAI 全端戰略的最後一塊拼圖。

理解 OpenAI 為什麼要造晶片，要看三層。

第一層：產品層。

ChatGPT、Codex、API——覆蓋 8 億周活躍使用者，全球最大的 AI 產品矩陣。每一次延遲波動、每一個推理成本波動，直接影響使用者體驗和公司收入。Altman 很清楚：如果把定價權完全交給晶片供應商，產品層的所有最佳化都會被硬體的成本天花板卡住。

第二層：模型層。

GPT-5.3 的架構特徵直接影響了 Jalapeño 的記憶體層次設計。OpenAI 知道自己模型裡那些 kernel 跑得最頻繁、那些記憶體訪問模式最關鍵、那些算子可以容忍低精度——這些洞察全寫進了晶片設計裡。

同一個跑在 ChatGPT 裡的模型，反過來加速了晶片的設計和最佳化過程。OpenAI 官方披露，在晶片設計的關鍵環節，工程師使用了自家模型來加速驗證和最佳化。GPT 不僅是在晶片上跑，還參與了晶片的誕生。“AI 設計 AI 晶片”——這在 2025 年還是暢想，2026 年 6 月已經是可公開的事實。

第三層：基礎設施層。

Jalapeño 是第一代。OpenAI 和 Broadcom 規劃了多代路線圖，2026 年底開始小規模部署，2027-2028 年產能爬坡。配套的 Broadcom Tomahawk 乙太網路解決方案取代了 NVLink——賭的是開放生態路線。背後是 2025 年 10 月宣佈的 10GW 算力基建承諾，覆蓋到 2029 年，部署在 Microsoft 和第三方資料中心。

這三層構成一個飛輪：更好的基礎設施 → 更低的推理成本 → 更強的模型訓練 → 更好的產品體驗 → 更多使用者 → 更多收入 → 下一代晶片投資。

這和 Nvidia 的商業模式有本質區別。Nvidia 賣 GPU，賺的是每顆晶片的 margin。OpenAI 自研晶片不賣，賺的是整個飛輪加速帶來的系統性優勢。它不是硬體公司，但它在用硬體重塑自己的競爭壁壘。

自研晶片版圖——五種商業邏輯，只有OpenAI的路不同

Jalapeño 的發佈不是孤例。全球最大的 AI 公司幾乎都在做同一件事——自研晶片。但同樣的動作，背後的商業邏輯完全不同。

Google TPU：最成熟的先行者

2006 年秘密設計，2015 年部署，到今天第八代。2026 年 TPU 8 系列做了一個關鍵決定：把產品線拆成 TPU 8t（訓練）和 TPU 8i（推理）——與 Jalapeño"純推理"方向不謀而合。

2026 年 6 月，Google首次向第三方資料中心直接出售 TPU 晶片。Google正在把自研晶片從"內部降本工具"升級為"對外創收產品"。

商業邏輯：用 TPU 鎖定 Google Cloud 的競爭力。不直接賣晶片賺錢，但"賣算力"賺錢。聯發科已經在設計 TPU v9 增強版。

亞馬遜 Trainium/Inferentia：最務實的降本工具

Annapurna Labs 2015 年開始自研。Inferentia 比 GPU 降低 70% 推理成本，Trainium3 是首個 3nm AI 推理晶片。2025 年 10 月，近 50 萬顆 Trainium2 晶片在印第安納州專門訓練 Anthropic 的 Claude 模型——全球最大的自研晶片 AI 訓練叢集。

商業邏輯：AWS 大客戶的推理帳單太高 → 自研晶片壓成本 → 維持雲業務利潤率。不賣晶片，只賣搭載晶片的雲服務。

微軟 Maia 200：為 OpenAI"私人定製"

2026 年 1 月發佈。台積電 3nm，超過 1400 億電晶體，216GB HBM3e。微軟自稱"所有超大規模資料中心中性能最高的自研晶片"——但 Maia 200 的 firmware、編譯器、調度器，全部圍繞 OpenAI 的 GPT 模型定製。

微妙之處在於：Broadcom 要求微軟承購約 40% 的 Jalapeño 初期產能。微軟同時在兩個方向下注——自己造 Maia，同時買 OpenAI 的 Jalapeño。

商業邏輯：同時持有 Nvidia + Maia + Jalapeño 三張牌，保持談判籌碼。

百度崑崙芯：最像"中國版 Nvidia"的故事

前身是百度智能晶片部，2021 年獨立，2026 年 5 月啟動 A+H 上市。估值 210 億元。

P800（第三代晶片）已在百度內部承載絕大多數 AI 推理任務。大摩預測百度自研晶片收入將從 2025 年的 13 億元暴漲到 2026 年的 83 億元。在中國移動 AI 伺服器集采中，崑崙芯在"類 CUDA 生態"標段拿下了 70% 份額。

商業邏輯：自用降本 → 對外創收。崑崙芯 CEO 的原話："接近並局部趕超輝達。"它更像一家獨立的晶片公司，在市場上與華為昇騰、寒武紀正面對抗。

阿里平頭哥：全球最龐大的全端閉環

2018 年成立，產品矩陣極寬：玄鐵（RISC-V CPU）、倚天（伺服器 CPU 雲上大規模應用）、含光（AI 推理）、真武 PPU（對標 Nvidia 旗艦，累計出貨 60 萬片，國內第二僅次於昇騰）。

平頭哥正在獨立 IPO，2026 年 5 月發佈的真武 M890 搭配了 128 卡超節點伺服器。但最重要的是，阿里建構了"通雲哥"——通義大模型 + 阿里雲 + 平頭哥晶片的 AI 黃金三角。這是全球範圍內唯一一個從大模型到雲到晶片全部自研的完整閉環，比 OpenAI 的"三件套"多了一張雲牌。

商業邏輯：全端自研 → 雲服務差異化 + 對外賣晶片 + RISC-V 開源生態話語權。

七家自研晶片對比

公司代表晶片核心邏輯對外銷售GoogleTPU 8t/8i（8代）雲服務差異化✅ 2026年起賣晶片亞馬遜Trainium/Inferentia降推理成本❌ 只賣雲服務微軟Maia 200（3nm）為OpenAI定製❌ 僅內部百度崑崙芯P800自用→對外創收✅ 獨立IPO阿里真武PPU/倚天/含光全端AI閉環✅ 部分對外MetaMTIA追趕中❌OpenAIJalapeño飛輪加速❌ 僅內部

OpenAI 的獨特性在於：它是七家裡唯一不靠賣雲服務賺錢的公司。

Google和亞馬遜的推理晶片降本，最終是為了保護雲業務的利潤。微軟的 Maia 降本，是為了減少支付給 Nvidia 的帳單。百度和阿里的晶片既可以自用也可以對外賣。

而 OpenAI 造晶片的目的只有一個：讓自己跑得比任何人都快、成本比任何人都低。不是用晶片賺錢，是用晶片加速飛輪。

Nvidia 的定價權正在被結構性削弱

Jalapeño 不會在短期內改變 Nvidia 的命運。Blackwell 的產能排到了明年，CUDA 生態有 400 萬註冊開發者和 15 年的工具鏈積累，訓練端仍然是 Nvidia 的天下。中小客戶不會被影響——不是每家公司都做得起 ASIC。

但結構性威脅已經形成。

全球最大的 AI 企業——Google、Amazon、Microsoft、Meta、OpenAI——全部擁有了自研推理晶片。Nvidia 已經失去了"唯一選擇"的地位。Hock Tan 說 Jalapeño 性能持平 Blackwell 和 TPU——即使打平，也已經足夠。不需要贏過 Nvidia，只需要給 Nvidia 的定價製造一個天花板。

定價權正在從"供應商定什麼價客戶就付什麼價"變成"最大客戶有了 B 計畫"。Nvidia 在談判桌上的位置變了。

對誰影響最大？

短期：Nvidia 推理晶片的定價增速會放緩。Google 已經率先行動——2026 年 6 月決定對外出售 TPU，既是創收，也是給整個市場的推理算力價格畫了一條新的參考線。
中期：ASIC 設計服務公司（Broadcom、Marvell）是最大贏家。定製晶片正在成為 AI 大廠的標配。野村證券預測，2026 年自研 ASIC 出貨量可能超越 Nvidia GPU。
長期：如果訓練端也開始出現定製化趨勢——據路透社報導，OpenAI 已在探索訓練晶片的可能性——Nvidia 的核心盤面將真正被動搖。

9個月——比晶片更可怕的訊號

最後聊一個被很多人忽略的數字：9 個月。

傳統高性能晶片的設計周期是 18-24 個月。Nvidia Blackwell 的開發周期約為 3-4 年。Google TPU 一代約 2 年。Broadcom + OpenAI 把這個周期壓縮到了一半以下。

部分原因當然是 Jalapeño 更專注（純推理 ASIC，不需要相容 CUDA、不需要跑圖形渲染）。但更核心的原因是：AI 參與了晶片設計。

OpenAI 官方披露，在 Jalapeño 的設計和驗證過程中，工程師使用了自家模型加速了部分環節。“同一個模型既跑在晶片上，又參與了晶片的誕生。”

如果 AI 輔助晶片設計成為常態，晶片迭代速度會從"摩爾定律"變成"AI 定律"。第一代 9 個月，第二代呢？

6 個月，還是 3 個月？

別忘了瓶頸在生產端

以上所有的敘事——自研晶片、全端閉環、定價權轉移——都忽略了一個不那麼性感的現實：做出來只是第一步，能量產才是真正的門檻。

TSMC 2026年的3nm和5nm產能早已被瓜分殆盡。Nvidia 是台積電的第二大客戶，蘋果是第一大，AMD、高通、聯發科、博通自己都有長期產能協議。OpenAI 在這個名單裡是一個剛拿到設計 tape-out 的新玩家。

Jalapeño 由 TSMC 製造，但產能從那裡來？Broadcom 作為設計服務夥伴能否幫 OpenAI 擠進 TSMC 的排產佇列？這些都是沒有在新聞稿裡回答的問題。

更嚴峻的是，OpenAI 不是唯一一個在追產能的自研晶片玩家。Google 的 TPU 8t/8i、亞馬遜的 Trainium3、微軟的 Maia 200——全在搶 TSMC 的 3nm 和 5nm 產能。當每一家超大規模客戶都在設計自己的晶片，晶圓代工的產能就成了新的稀缺資源。

Hock Tan 在交易中要求 Microsoft 承購約 40% 的 Jalapeño 初期產能，這一細節的潛台詞可能不只是"分擔風險"，而是：如果不提前鎖定需求，連 Broadcom 都無法保證 OpenAI 拿到足夠的晶圓。

這是"AI 自研晶片潮"最被低估的瓶頸——設計端正在民主化（有 Broadcom/Marvell 這樣的設計服務公司幫你做），但製造端的寡頭壟斷遠比設計端更頑固。TSMC 一家控制了全球 90% 以上的先進製程產能，而它的擴產速度遠遠跟不上 AI 需求的增速。

所以 Jalapeño 的 50% 成本優勢，能否從實驗室走進資料中心，不僅取決於晶片設計本身，還取決於 OpenAI 能不能在 TSMC 的排產表上搶到一個位置——以及願不願意為此支付溢價。

這個瓶頸可能會成為決定這輪自研晶片浪潮能走多遠的最大變數。

Nvidia 的市值當天沒有波動，CUDA 生態紋絲不動，Blackwell 的訂單仍在排隊。Jalapeño 不會在一夜之間改變什麼。

但它改寫了一件事。

OpenAI 和 Nvidia 的關係，已經從"獨家供應商"變成了"帶著自研晶片上桌的合作夥伴"。它不再是那個每個季度都要在 Nvidia 的定價表面前深吸一口氣的"大客戶"——它變成了一個在晶片設計層面可以和你平起平坐的參與者。

Altman 接過那枚晶圓時，他接過的不僅是一顆晶片——是定價權、是技術主權、是一個不需要再看任何人臉色定義未來 AI 基礎設施的能力。

AI 行業底層權力結構的一次遷移，從這一刻開始。 (艾智Edge)

科技