史上最快!OpenAI 發佈首款晶片:AI 給自己造芯,流片只要 9 個月

就在剛剛,OpenAI 史上首顆晶片誕生了。

名字相當火辣,叫 Jalapeño,墨西哥辣椒(doge)。

它是 OpenAI 的第一顆「Intelligence Processor」(智能處理器),專門為大模型推理設計。從一張白紙到流片,整個過程只花了九個月。

OpenAI 管這叫「史上最快的高性能先進半導體 ASIC 開發周期」。

嘖嘖,要知道,造晶片這種活兒,通常一搞就是好幾年。更有趣的是,幫他們加速設計的,正是 OpenAI 自己家的模型。自己造的 AI,造出了自己要跑的晶片。

一顆「辣椒」,親手交到奧特曼手上

頗有畫面感的一幕是,這顆 Jalapeño 晶片,正是博通的總裁兼 CEO Hock Tan 和半導體事業部總裁 Charlie Kawwas,親手交給 OpenAI 的 CEO Sam Altman 和總裁 Greg Brockman 的。

OpenAI 在官宣部落格中表示,這標誌著 OpenAI「為自家模型和產品建構全端」戰略的重要一步。

而且合作不止博通一家。

OpenAI 出腦子:從零開始設計晶片架構,靠的是它對大模型底層邏輯的深度理解,再結合自己的模型路線圖、kernel、服務系統和產品需求;

部落格地址🔗 https://openai.com/index/openai-broadcom-jalapeno-inference-chip/

博通出手藝:負責晶片實現、網路,還有把東西做成大規模量產;另一家叫 Celestica,管板卡、機架、系統組裝這些活。博通還明確提到它的 Tomahawk 網路晶片,被用來幫平台走向大規模量產。

整體來看,未雨綢繆的 OpenAI 這次是真的打算把整條產業鏈都捏在自己手裡了。

以前它只干兩件事:訓練出最強的模型,再拿模型做產品(ChatGPT、Codex、API 那一套)。現在它往基準設施底部又挖了一層——晶片架構、kernel、記憶體系統、網路、調度、部署系統,全自己來。

用 OpenAI 自己的話講,這叫「全端」。

而更好的基礎設施→更高的算力效率→更好的訓練和服務→更強的模型→更好的產品→更多使用者和收入→再回頭投下一代基礎設施。轉著轉著,智能就越來越強、越來越穩、越來越便宜。

九個月,模型幫自己造晶片

令人震驚的是,從最初設計到流片(就是把設計交給工廠做成實物的那一步),中間只隔了九個月。這大概是高性能先進半導體裡,跑得最快的一次 ASIC 開發。

那憑什麼只花了這麼短的時間?

究其原因,一方面是靠軟硬體一起開發,比如 OpenAI 的工程師和博通的造芯團隊貼在一起幹;另一方面則是 OpenAI 直接用自家的模型,去加速晶片設計和最佳化的部分環節。

也就是說,給使用者用的那些模型,反過來在幫 OpenAI 造下一代模型要跑的硬體。

負責 OpenAI 硬體項目的 Richard Ho 說,他們是圍著那些「最要緊的東西」來最佳化架構的——kernel、記憶體搬運、網路、服務模式。根據早期測試,Jalapeño 能把 OpenAI 最重要的活兒,跑到接近硬體理論極限。

簡單理解就是,晶片的紙面性能是 100 分,一般晶片實際只能發揮個六七十分,剩下的都在資料搬來搬去的路上耗掉了。Jalapeño 的架構就是要減少資料搬運,把算力、記憶體、網路幾樣資源配平,讓實際發揮無限逼近那 100 分。

不過,性能到底多強,OpenAI 還沒給最終數字,說詳細技術報告過幾個月再發。但早期測試透了個底:每瓦性能會「大幅優於」目前業界最強水平。(至於是否在畫餅,日後便見分曉了。)

實驗室裡,工程樣片已經在跑真實的機器學習任務了,頻率和功耗都按量產目標來,其中就包括 GPT‑5.3‑Codex‑Spark 這種模型。

還有一點值得一提的是,Jalapeño 不是拿以前的 AI 晶片改改湊出來的,而是為現代大模型推理從零設計的。

它參考的,就是 OpenAI 每天在 ChatGPT、Codex、API 以及未來 Agent 產品上跑的那些真實系統。

目標也很明確。既要有頂級 AI 加速器的算力和吞吐,又要把延遲壓到接近最快的專用推理系統那種水平,專門伺候大規模、要互動的大模型產品。

無法停止的飛輪

Jalapeño 不是一錘子買賣。

它是一個「多代計算平台」的第一步。計畫 2026 年底先部署起來,之後幾年接著擴。整個平台是 OpenAI 設計的加速器,加上博通的晶片實現、網路和連接技術,再加 Celestica 的板卡、機架、系統能力,三家拼起來的。

Hock Tan 表示,這只是個開頭,後面是一張跨好幾代的路線圖。他還順嘴提了一句——靠著跟 OpenAI 直接共同開發的晶片,他們要在 2026 年開始,跟微軟等夥伴一起,鋪起吉瓦級(gigawatt)的資料中心。

吉瓦是什麼概念?

一座大型核電站的發電量等級。OpenAI 是真打算用電廠的規模來堆算力。Greg Brockman 甚至還給這次合作上了個價值——「世界正在轉向一個由算力驅動的經濟」。

在他的邏輯裡,Jalapeño 是 OpenAI 長期全端基礎設施戰略的一環,自己設計的棧越多,就能用更高的效率「賣」出更多的智能,把先進 AI 推向更廣的人群。

至於為什麼死磕推理晶片,邏輯其實不難理解:

推理,就是 AI 觸達使用者/抵達人的重要一環。成本降一點、速度快一點、穩定多一點,落到使用者那頭,就是 ChatGPT 答得更快、Codex 能多干幾步少等會兒、API 更便宜好搭、高峰期更不容易崩。

所以這顆辣椒最後想幹的事,說穿了不複雜:把更多算力變成普通人能天天用得起的智能。學生、開發者、小老闆、研究員、企業,誰想學東西、想創作、想解決難題,都能用上。

當然,最妙的還是技術的反覆套娃:AI 設計晶片,晶片跑 AI,AI 再去設計下一代晶片。而這個圈一旦轉起來,就有點停不下來的意思了。 (愛范兒)