史上最快！OpenAI 發佈首款晶片：AI 給自己造芯，流片只要 9 個月

2026/06/25

•

AI速讀

OpenAI 發表首顆自研推理晶片「Jalapeño」，與博通及 Celestica 合作，僅耗時 9 個月即完成開發，創下高性能半導體開發之快紀錄。該晶片採取「全端」設計，利用 AI 模型輔助硬體設計，旨在消除資料搬運瓶頸，使性能逼近硬體理論極限。OpenAI 計劃於 2026 年底前部署，並目標構建吉瓦（gigawatt）級數據中心。此戰略旨在透過掌控底層基礎設施降低 AI 推理成本，將高效能智能普及化，形成「AI設計晶片 $ ightarrow$ 晶片跑AI」的正向飛輪。

就在剛剛，OpenAI 史上首顆晶片誕生了。

名字相當火辣，叫 Jalapeño，墨西哥辣椒（doge）。

它是 OpenAI 的第一顆「Intelligence Processor」（智能處理器），專門為大模型推理設計。從一張白紙到流片，整個過程只花了九個月。

OpenAI 管這叫「史上最快的高性能先進半導體 ASIC 開發周期」。

嘖嘖，要知道，造晶片這種活兒，通常一搞就是好幾年。更有趣的是，幫他們加速設計的，正是 OpenAI 自己家的模型。自己造的 AI，造出了自己要跑的晶片。

一顆「辣椒」，親手交到奧特曼手上

頗有畫面感的一幕是，這顆 Jalapeño 晶片，正是博通的總裁兼 CEO Hock Tan 和半導體事業部總裁 Charlie Kawwas，親手交給 OpenAI 的 CEO Sam Altman 和總裁 Greg Brockman 的。

OpenAI 在官宣部落格中表示，這標誌著 OpenAI「為自家模型和產品建構全端」戰略的重要一步。

而且合作不止博通一家。

OpenAI 出腦子：從零開始設計晶片架構，靠的是它對大模型底層邏輯的深度理解，再結合自己的模型路線圖、kernel、服務系統和產品需求；

部落格地址🔗 https://openai.com/index/openai-broadcom-jalapeno-inference-chip/

博通出手藝：負責晶片實現、網路，還有把東西做成大規模量產；另一家叫 Celestica，管板卡、機架、系統組裝這些活。博通還明確提到它的 Tomahawk 網路晶片，被用來幫平台走向大規模量產。

整體來看，未雨綢繆的 OpenAI 這次是真的打算把整條產業鏈都捏在自己手裡了。

以前它只干兩件事：訓練出最強的模型，再拿模型做產品（ChatGPT、Codex、API 那一套）。現在它往基準設施底部又挖了一層——晶片架構、kernel、記憶體系統、網路、調度、部署系統，全自己來。

用 OpenAI 自己的話講，這叫「全端」。

而更好的基礎設施→更高的算力效率→更好的訓練和服務→更強的模型→更好的產品→更多使用者和收入→再回頭投下一代基礎設施。轉著轉著，智能就越來越強、越來越穩、越來越便宜。

九個月，模型幫自己造晶片

令人震驚的是，從最初設計到流片（就是把設計交給工廠做成實物的那一步），中間只隔了九個月。這大概是高性能先進半導體裡，跑得最快的一次 ASIC 開發。

那憑什麼只花了這麼短的時間？

究其原因，一方面是靠軟硬體一起開發，比如 OpenAI 的工程師和博通的造芯團隊貼在一起幹；另一方面則是 OpenAI 直接用自家的模型，去加速晶片設計和最佳化的部分環節。

也就是說，給使用者用的那些模型，反過來在幫 OpenAI 造下一代模型要跑的硬體。

負責 OpenAI 硬體項目的 Richard Ho 說，他們是圍著那些「最要緊的東西」來最佳化架構的——kernel、記憶體搬運、網路、服務模式。根據早期測試，Jalapeño 能把 OpenAI 最重要的活兒，跑到接近硬體理論極限。

簡單理解就是，晶片的紙面性能是 100 分，一般晶片實際只能發揮個六七十分，剩下的都在資料搬來搬去的路上耗掉了。Jalapeño 的架構就是要減少資料搬運，把算力、記憶體、網路幾樣資源配平，讓實際發揮無限逼近那 100 分。

不過，性能到底多強，OpenAI 還沒給最終數字，說詳細技術報告過幾個月再發。但早期測試透了個底：每瓦性能會「大幅優於」目前業界最強水平。（至於是否在畫餅，日後便見分曉了。）

實驗室裡，工程樣片已經在跑真實的機器學習任務了，頻率和功耗都按量產目標來，其中就包括 GPT‑5.3‑Codex‑Spark 這種模型。

還有一點值得一提的是，Jalapeño 不是拿以前的 AI 晶片改改湊出來的，而是為現代大模型推理從零設計的。

它參考的，就是 OpenAI 每天在 ChatGPT、Codex、API 以及未來 Agent 產品上跑的那些真實系統。

目標也很明確。既要有頂級 AI 加速器的算力和吞吐，又要把延遲壓到接近最快的專用推理系統那種水平，專門伺候大規模、要互動的大模型產品。

無法停止的飛輪

Jalapeño 不是一錘子買賣。

它是一個「多代計算平台」的第一步。計畫 2026 年底先部署起來，之後幾年接著擴。整個平台是 OpenAI 設計的加速器，加上博通的晶片實現、網路和連接技術，再加 Celestica 的板卡、機架、系統能力，三家拼起來的。

Hock Tan 表示，這只是個開頭，後面是一張跨好幾代的路線圖。他還順嘴提了一句——靠著跟 OpenAI 直接共同開發的晶片，他們要在 2026 年開始，跟微軟等夥伴一起，鋪起吉瓦級（gigawatt）的資料中心。

吉瓦是什麼概念？

一座大型核電站的發電量等級。OpenAI 是真打算用電廠的規模來堆算力。Greg Brockman 甚至還給這次合作上了個價值——「世界正在轉向一個由算力驅動的經濟」。

在他的邏輯裡，Jalapeño 是 OpenAI 長期全端基礎設施戰略的一環，自己設計的棧越多，就能用更高的效率「賣」出更多的智能，把先進 AI 推向更廣的人群。

至於為什麼死磕推理晶片，邏輯其實不難理解：

推理，就是 AI 觸達使用者/抵達人的重要一環。成本降一點、速度快一點、穩定多一點，落到使用者那頭，就是 ChatGPT 答得更快、Codex 能多干幾步少等會兒、API 更便宜好搭、高峰期更不容易崩。

所以這顆辣椒最後想幹的事，說穿了不複雜：把更多算力變成普通人能天天用得起的智能。學生、開發者、小老闆、研究員、企業，誰想學東西、想創作、想解決難題，都能用上。

當然，最妙的還是技術的反覆套娃：AI 設計晶片，晶片跑 AI，AI 再去設計下一代晶片。而這個圈一旦轉起來，就有點停不下來的意思了。 (愛范兒)

科技