全端閉環:OpenAI不想再做Nvidia的"大客戶",溫柔的砍了輝達一刀

2026年6月24日,一張照片從OpenAI舊金山總部傳出。

Broadcom CEO Hock Tan 將一枚晶圓遞到 Sam Altman 手中,兩人身後站著的是 OpenAI 總裁 Greg Brockman 和 Broadcom 半導體事業部總裁 Charlie Kawwas。Altman 的笑容不算誇張,但動作很輕——像是在接一件等了很久的東西。

這張照片講了三個故事。

表層:OpenAI 造出了自己的第一顆晶片。中層:從設計到交付只用了 9 個月——可能是半導體行業有史以來最快的高性能 ASIC 開發周期。深層:Altman 接過的不是一顆晶片,是 AI 基礎設施的權力交接。

這顆晶片叫 Jalapeño。OpenAI 官方把它叫作"Intelligence Processor"——智能處理器。它不是用來訓練模型的,而是專門用來跑推理:每一次 ChatGPT 回答、每一行 Codex 生成的程式碼、每一個 API 呼叫的背後,都是推理。

而推理,正在吃掉 AI 的全部預算。

為什麼是現在——推理經濟的拐點

先看一組數字。

GPT-5.3-Codex-Spark 單次推理的 token 消耗量已經遠超前代。AI Agent(OpenClaw、Hermes 等)的爆發讓 token 需求呈指數級增長。有機構測算,2026 年 AI 推理的計算需求已經達到訓練需求的 4 到 5 倍。

對 OpenAI 來說,推理成本不是"營運開支",而是業務瓶頸。它每個季度向 Nvidia 支付的 GPU 採購費用,比絕大多數 AI 公司的年收入還高。

問題出在架構上。

GPU 是為訓練設計的。訓練是 brute-force 平行計算,需要把海量資料同時扔給成千上萬個核心。但推理完全不同——它每次處理一個請求,必須在幾百毫秒內完成,瓶頸不是計算速度,而是記憶體搬運

每一次 ChatGPT 生成回答,模型都要從高頻寬記憶體裡載入巨大的權重矩陣,做幾十層 transformer 的前向傳播,同時維護一個 KV cache——記錄對話中所有已見過的 token——避免每次從零計算。在這個過程裡,GPU 上絕大多數平行計算單元處於閒置狀態。獨立分析顯示,GPU 在推理負載上的利用率只有 60-70%。大量電晶體在空轉,同時還在耗電。

這就是為什麼推理需要專屬晶片。不是"更好的 GPU",而是"不浪費一個電晶體的 LLM 推理專用機"。

Jalapeño 就是幹這個的。OpenAI 硬體負責人 Richard Ho 的原話:"我們圍繞最關鍵的 kernel、記憶體搬運、網路和 serving 模式最佳化了整個架構。"目標是在推理負載上讓實際利用率無限接近理論峰值。

Broadcom CEO Hock Tan 對 Bloomberg 透露:早期測試顯示,Jalapeño 的每 token 推理成本比當前 GPU 降低了約50%。他還對 Reuters 說,Jalapeño 的性能與 Nvidia Blackwell 和 Google TPU 持平。

OpenAI 自己的措辭更謹慎——“每瓦性能大幅超越當前最先進水平”,詳細的技術報告要等幾個月後公佈。

但有一個數字是確定的:9個月。從空白設計到 tape-out,只用了 9 個月。

全端閉環的三層飛輪

Jalapeño 不是一個硬體項目。它是 OpenAI 全端戰略的最後一塊拼圖。

理解 OpenAI 為什麼要造晶片,要看三層。

第一層:產品層。

ChatGPT、Codex、API——覆蓋 8 億周活躍使用者,全球最大的 AI 產品矩陣。每一次延遲波動、每一個推理成本波動,直接影響使用者體驗和公司收入。Altman 很清楚:如果把定價權完全交給晶片供應商,產品層的所有最佳化都會被硬體的成本天花板卡住。

第二層:模型層。

GPT-5.3 的架構特徵直接影響了 Jalapeño 的記憶體層次設計。OpenAI 知道自己模型裡那些 kernel 跑得最頻繁、那些記憶體訪問模式最關鍵、那些算子可以容忍低精度——這些洞察全寫進了晶片設計裡。

同一個跑在 ChatGPT 裡的模型,反過來加速了晶片的設計和最佳化過程。OpenAI 官方披露,在晶片設計的關鍵環節,工程師使用了自家模型來加速驗證和最佳化。GPT 不僅是在晶片上跑,還參與了晶片的誕生。“AI 設計 AI 晶片”——這在 2025 年還是暢想,2026 年 6 月已經是可公開的事實。

第三層:基礎設施層。

Jalapeño 是第一代。OpenAI 和 Broadcom 規劃了多代路線圖,2026 年底開始小規模部署,2027-2028 年產能爬坡。配套的 Broadcom Tomahawk 乙太網路解決方案取代了 NVLink——賭的是開放生態路線。背後是 2025 年 10 月宣佈的 10GW 算力基建承諾,覆蓋到 2029 年,部署在 Microsoft 和第三方資料中心。

這三層構成一個飛輪:更好的基礎設施 → 更低的推理成本 → 更強的模型訓練 → 更好的產品體驗 → 更多使用者 → 更多收入 → 下一代晶片投資。

這和 Nvidia 的商業模式有本質區別。Nvidia 賣 GPU,賺的是每顆晶片的 margin。OpenAI 自研晶片不賣,賺的是整個飛輪加速帶來的系統性優勢。它不是硬體公司,但它在用硬體重塑自己的競爭壁壘。

自研晶片版圖——五種商業邏輯,只有OpenAI的路不同

Jalapeño 的發佈不是孤例。全球最大的 AI 公司幾乎都在做同一件事——自研晶片。但同樣的動作,背後的商業邏輯完全不同。

Google TPU:最成熟的先行者

2006 年秘密設計,2015 年部署,到今天第八代。2026 年 TPU 8 系列做了一個關鍵決定:把產品線拆成 TPU 8t(訓練)和 TPU 8i(推理)——與 Jalapeño"純推理"方向不謀而合。

2026 年 6 月,Google首次向第三方資料中心直接出售 TPU 晶片。Google正在把自研晶片從"內部降本工具"升級為"對外創收產品"。

商業邏輯:用 TPU 鎖定 Google Cloud 的競爭力。不直接賣晶片賺錢,但"賣算力"賺錢。聯發科已經在設計 TPU v9 增強版。

亞馬遜 Trainium/Inferentia:最務實的降本工具

Annapurna Labs 2015 年開始自研。Inferentia 比 GPU 降低 70% 推理成本,Trainium3 是首個 3nm AI 推理晶片。2025 年 10 月,近 50 萬顆 Trainium2 晶片在印第安納州專門訓練 Anthropic 的 Claude 模型——全球最大的自研晶片 AI 訓練叢集。

商業邏輯:AWS 大客戶的推理帳單太高 → 自研晶片壓成本 → 維持雲業務利潤率。不賣晶片,只賣搭載晶片的雲服務。

微軟 Maia 200:為 OpenAI"私人定製"

2026 年 1 月發佈。台積電 3nm,超過 1400 億電晶體,216GB HBM3e。微軟自稱"所有超大規模資料中心中性能最高的自研晶片"——但 Maia 200 的 firmware、編譯器、調度器,全部圍繞 OpenAI 的 GPT 模型定製。

微妙之處在於:Broadcom 要求微軟承購約 40% 的 Jalapeño 初期產能。微軟同時在兩個方向下注——自己造 Maia,同時買 OpenAI 的 Jalapeño。

商業邏輯:同時持有 Nvidia + Maia + Jalapeño 三張牌,保持談判籌碼。

百度崑崙芯:最像"中國版 Nvidia"的故事

前身是百度智能晶片部,2021 年獨立,2026 年 5 月啟動 A+H 上市。估值 210 億元。

P800(第三代晶片)已在百度內部承載絕大多數 AI 推理任務。大摩預測百度自研晶片收入將從 2025 年的 13 億元暴漲到 2026 年的 83 億元。在中國移動 AI 伺服器集采中,崑崙芯在"類 CUDA 生態"標段拿下了 70% 份額。

商業邏輯:自用降本 → 對外創收。崑崙芯 CEO 的原話:"接近並局部趕超輝達。"它更像一家獨立的晶片公司,在市場上與華為昇騰、寒武紀正面對抗。

阿里平頭哥:全球最龐大的全端閉環

2018 年成立,產品矩陣極寬:玄鐵(RISC-V CPU)、倚天(伺服器 CPU 雲上大規模應用)、含光(AI 推理)、真武 PPU(對標 Nvidia 旗艦,累計出貨 60 萬片,國內第二僅次於昇騰)。

平頭哥正在獨立 IPO,2026 年 5 月發佈的真武 M890 搭配了 128 卡超節點伺服器。但最重要的是,阿里建構了"通雲哥"——通義大模型 + 阿里雲 + 平頭哥晶片的 AI 黃金三角。這是全球範圍內唯一一個從大模型到雲到晶片全部自研的完整閉環,比 OpenAI 的"三件套"多了一張雲牌。

商業邏輯:全端自研 → 雲服務差異化 + 對外賣晶片 + RISC-V 開源生態話語權。

七家自研晶片對比

公司代表晶片核心邏輯對外銷售GoogleTPU 8t/8i(8代)雲服務差異化✅ 2026年起賣晶片亞馬遜Trainium/Inferentia降推理成本❌ 只賣雲服務微軟Maia 200(3nm)為OpenAI定製❌ 僅內部百度崑崙芯P800自用→對外創收✅ 獨立IPO阿里真武PPU/倚天/含光全端AI閉環✅ 部分對外MetaMTIA追趕中❌OpenAIJalapeño飛輪加速❌ 僅內部

OpenAI 的獨特性在於:它是七家裡唯一不靠賣雲服務賺錢的公司。

Google和亞馬遜的推理晶片降本,最終是為了保護雲業務的利潤。微軟的 Maia 降本,是為了減少支付給 Nvidia 的帳單。百度和阿里的晶片既可以自用也可以對外賣。

而 OpenAI 造晶片的目的只有一個:讓自己跑得比任何人都快、成本比任何人都低。不是用晶片賺錢,是用晶片加速飛輪。

Nvidia 的定價權正在被結構性削弱

Jalapeño 不會在短期內改變 Nvidia 的命運。Blackwell 的產能排到了明年,CUDA 生態有 400 萬註冊開發者和 15 年的工具鏈積累,訓練端仍然是 Nvidia 的天下。中小客戶不會被影響——不是每家公司都做得起 ASIC。

但結構性威脅已經形成。

全球最大的 AI 企業——Google、Amazon、Microsoft、Meta、OpenAI——全部擁有了自研推理晶片。Nvidia 已經失去了"唯一選擇"的地位。Hock Tan 說 Jalapeño 性能持平 Blackwell 和 TPU——即使打平,也已經足夠。不需要贏過 Nvidia,只需要給 Nvidia 的定價製造一個天花板。

定價權正在從"供應商定什麼價客戶就付什麼價"變成"最大客戶有了 B 計畫"。Nvidia 在談判桌上的位置變了。

對誰影響最大?

  • 短期:Nvidia 推理晶片的定價增速會放緩。Google 已經率先行動——2026 年 6 月決定對外出售 TPU,既是創收,也是給整個市場的推理算力價格畫了一條新的參考線。
  • 中期:ASIC 設計服務公司(Broadcom、Marvell)是最大贏家。定製晶片正在成為 AI 大廠的標配。野村證券預測,2026 年自研 ASIC 出貨量可能超越 Nvidia GPU。
  • 長期:如果訓練端也開始出現定製化趨勢——據路透社報導,OpenAI 已在探索訓練晶片的可能性——Nvidia 的核心盤面將真正被動搖。

9個月——比晶片更可怕的訊號

最後聊一個被很多人忽略的數字:9 個月。

傳統高性能晶片的設計周期是 18-24 個月。Nvidia Blackwell 的開發周期約為 3-4 年。Google TPU 一代約 2 年。Broadcom + OpenAI 把這個周期壓縮到了一半以下。

部分原因當然是 Jalapeño 更專注(純推理 ASIC,不需要相容 CUDA、不需要跑圖形渲染)。但更核心的原因是:AI 參與了晶片設計。

OpenAI 官方披露,在 Jalapeño 的設計和驗證過程中,工程師使用了自家模型加速了部分環節。“同一個模型既跑在晶片上,又參與了晶片的誕生。”

如果 AI 輔助晶片設計成為常態,晶片迭代速度會從"摩爾定律"變成"AI 定律"。第一代 9 個月,第二代呢?

6 個月,還是 3 個月?

別忘了瓶頸在生產端

以上所有的敘事——自研晶片、全端閉環、定價權轉移——都忽略了一個不那麼性感的現實:做出來只是第一步,能量產才是真正的門檻。

TSMC 2026年的3nm和5nm產能早已被瓜分殆盡。Nvidia 是台積電的第二大客戶,蘋果是第一大,AMD、高通、聯發科、博通自己都有長期產能協議。OpenAI 在這個名單裡是一個剛拿到設計 tape-out 的新玩家。

Jalapeño 由 TSMC 製造,但產能從那裡來?Broadcom 作為設計服務夥伴能否幫 OpenAI 擠進 TSMC 的排產佇列?這些都是沒有在新聞稿裡回答的問題。

更嚴峻的是,OpenAI 不是唯一一個在追產能的自研晶片玩家。Google 的 TPU 8t/8i、亞馬遜的 Trainium3、微軟的 Maia 200——全在搶 TSMC 的 3nm 和 5nm 產能。當每一家超大規模客戶都在設計自己的晶片,晶圓代工的產能就成了新的稀缺資源。

Hock Tan 在交易中要求 Microsoft 承購約 40% 的 Jalapeño 初期產能,這一細節的潛台詞可能不只是"分擔風險",而是:如果不提前鎖定需求,連 Broadcom 都無法保證 OpenAI 拿到足夠的晶圓。

這是"AI 自研晶片潮"最被低估的瓶頸——設計端正在民主化(有 Broadcom/Marvell 這樣的設計服務公司幫你做),但製造端的寡頭壟斷遠比設計端更頑固。TSMC 一家控制了全球 90% 以上的先進製程產能,而它的擴產速度遠遠跟不上 AI 需求的增速。

所以 Jalapeño 的 50% 成本優勢,能否從實驗室走進資料中心,不僅取決於晶片設計本身,還取決於 OpenAI 能不能在 TSMC 的排產表上搶到一個位置——以及願不願意為此支付溢價。

這個瓶頸可能會成為決定這輪自研晶片浪潮能走多遠的最大變數。

Nvidia 的市值當天沒有波動,CUDA 生態紋絲不動,Blackwell 的訂單仍在排隊。Jalapeño 不會在一夜之間改變什麼。

但它改寫了一件事。

OpenAI 和 Nvidia 的關係,已經從"獨家供應商"變成了"帶著自研晶片上桌的合作夥伴"。它不再是那個每個季度都要在 Nvidia 的定價表面前深吸一口氣的"大客戶"——它變成了一個在晶片設計層面可以和你平起平坐的參與者。

Altman 接過那枚晶圓時,他接過的不僅是一顆晶片——是定價權、是技術主權、是一個不需要再看任何人臉色定義未來 AI 基礎設施的能力。

AI 行業底層權力結構的一次遷移,從這一刻開始。 (艾智Edge)