OpenAI公開未來路線圖！具體到28年3月AI研究員將完全自主，奧特曼承認“關於GPT-4o我們搞砸了”

2025/10/29

•

OpenAI完成史上最重要的一次組織架構調整後，緊接著開了一場直播。

首次公開了內部研究目標的具體時間表，其中最引人注目的是“在2028年3月實現完全自主的AI研究員”，具體到月份。

這次發佈會資訊密度非常大，連奧特曼自己都說：“鑑於這些內容的重要性，我們將以不同尋常的透明度分享我們的具體研究目標、基礎設施計畫和產品戰略。”

難道重組後的OpenAI，真的重新Open了？

不過也有一些事故，本來OpenAI發帖徵集大家的問題，結果抱怨GPT-4o對敏感對話強制路由機制的人太多，兩人支支吾吾面面相覷了一陣。

奧特曼最終還是承認“這次我們搞砸了”。

我們的目標是在保護脆弱使用者的同時給成人使用者更多自由。我們有義務保護未成年使用者，保護那些不在合理心態下的成人使用者。

隨著年齡驗證的建立，我們將能夠更好地做出平衡。這不是我們最好的工作，但我們會改進。

2028年讓AI自己做研究，OpenAI給出明確時間表

直播一開始，奧特曼就承認自己的錯誤。

過去，我們把AGI想像成”天上的神諭”，超級智能會自動為人類創造美好的事物。

但現在我們意識到，真正重要的是創造工具，讓人們用這些工具創造自己的未來。

這種思維轉變並非偶然，人類歷史上每一次技術革命都源於更好的工具，從石器到蒸汽機，從電腦到網際網路。

OpenAI相信，AI將是下一個改變文明處理程序的工具，而他們的使命是讓這個工具儘可能強大、易用且普惠。

接下來，首席科學家Jakub Pachocki公開了一份OpenAI內部的目標和路線圖。

2026年9月，AI研究實習生等級。能夠通過大量計算顯著加速研究人員工作
2028年3月，完全自動化的AI研究員，能夠自主完成大型研究項目

在介紹研究進展時他特別強調，OpenAI相信深度學習系統距離超級智能“可能不到十年”，這裡超級智能指的是在大量關鍵領域都比人類更聰明的系統。

他們對AI能力進展的量化方式是看模型能完成的任務所需的時間跨度，從最初的幾秒鐘任務，到現在的五小時任務（比如在國際數學和資訊學競賽中擊敗頂尖選手），這個時間跨度正在快速延長。

想想模型目前在問題上花費的思考時間，再想想你願意在真正重要的科學突破上花費多少時間，讓模型使用整個資料中心的計算資源來思考都是可以接受的，這裡有巨大的提升空間。

Pachocki還詳細介紹了一項名為“思維鏈忠實度”（Chain of Thought Faithfulness）的新技術。

簡單來說，就是在訓練時故意不去監督模型的內部推理過程，讓它保持對實際想法的忠實表達。

我們不引導模型思考“好的想法”，而是讓它保持對實際想法的忠實。

在五層AI安全架構中，思維鏈忠實度瞄準最頂層的價值對齊。

AI真正關心什麼？它能否遵守高層次的原則？面對不明確或衝突的目標時會怎麼做？它是否缺乏人性？

這個問題之所以重要，是因為：

當系統進行長時間思考時，我們無法為每一步都提供詳細指令
當AI變得非常聰明時，可能面對人類無法完全理解的問題
當AI處理超出人類能力的問題時，完整的規範變得困難甚至不可能

在這些情況下必須依賴更深層的對齊，人們無法為每個細節編寫規則，必須依賴AI內在的價值觀。

傳統方法在訓練期間查看並指導模型的思維過程，實際上是在教它說我們想聽的話，而不是保持對它真實思考過程的忠實。

目前，這種方法已經在OpenAI內部廣泛使用，用於理解模型如何訓練、傾向如何演變。以及與外部合作研究，通過查看未受監督的思維鏈，能夠檢測到潛在的欺騙行為。

不過讓AI的價值觀不與監控對抗還只是成功的一半。理想情況下還希望AI的價值觀實際上能夠幫助監控模型，這是OpenAI下一步正在大力研究的內容。

新架構亮相：非營利基金會掌控一切

備受關注的OpenAI重組方案終於揭曉，與原方案相比出人意料地簡潔。

舊的架構包括多個相互關聯的複雜實體：

新架構只剩兩層：

核心是OpenAI基金會（OpenAI Foundation），這個非營利組織將完全控制下屬的公益公司OpenAI Group。

基金會初始將持有公益公司約26%的股權，但如果業績優異，這個比例可以通過認股權證增加。

Sam Altman希望OpenAI基金會成為史上最大的非營利組織，首個重大承諾是投入250億美元用於AI輔助疾病治療研究。

除了醫療研究，基金會還將重點投入一個全新的領域——AI Resilience。

OpenAI聯合創始人Wojciech Zaremba特別介紹了這個概念，它比傳統的AI安全範圍更廣。

舉例來說，即使OpenAI能阻止模型用於危險用途，但如果有人使用其他模型搞事，整個社會仍需要在問題發生時有快速響應機制。

Zaremba認為這就像網際網路早期的網路安全，當時人們都不敢在網上輸入信用卡號，遇到病毒還要互相打電話提醒斷網。但現在有了完整的網路安全產業鏈，人們才敢把最私密的資料和畢生積蓄放在網上。

在基礎設施方面，OpenAI首次公開了他們的投資規模：目前已承諾的基礎設施建設總計超過30GW（吉瓦），總財務義務約1.4兆美元。

奧特曼還透露了一個長期目標：建立一個基礎設施工廠，每周能夠創造1GW的算力，並希望將每吉瓦的成本在五年生命周期內降至200億美元左右。

為了實現這個目標，OpenAI考慮投入機器人技術，用來幫助建設資料中心。

為了讓大家理解這個規模，OpenAI重點介紹了他們在德克薩斯州阿比林建設的首個星際之門資料中心，在多個地點建設中，這是進展最快的。

這個工地每天有數千人在施工，整個供應鏈涉及數十萬甚至上百萬人，從晶片設計、製造到組裝，再到能源供應。

問答環節同樣精彩

Q1：技術變得令人上癮，然而Sora模仿TikTok，ChatGPT可能會加入廣告，為什麼重複同樣的模式？

奧特曼：請根據我們的行動來判斷我們。如果Sora變成讓人刷的上癮而不是被用來創作，我們會取消這個產品。我們希望不會犯前人的錯誤，但可能會犯新錯誤，需要快速演進和緊密的反饋循環。

Q2：AI導致的大規模失業何時會發生？

Pachocki：很多工作將在未來幾年自動化，什麼工作將取代這些工作？什麼樣的新追求值得所有人參與？”

我認為會有幾個方面：能夠理解更多關於世界的東西，令人難以置信的各種新知識、新娛樂、新智能，將為人們提供相當多的意義和成就感。

Q3：內部模型比公開部署的模型領先多少？

Pachocki對下一代模型有很強的期望，預計未來幾個月和一年會有快速進展，但沒有隱瞞什麼極其瘋狂的東西。

奧特曼補充說他們開發了很多元件，當把它們組合在一起時，才會有令人印象深刻的成果。

今天我們只是有很多這樣的元件，不是坐擁未向世界展示的巨大成果，但預計一年後有機會實現AI能力的巨大飛躍。

Q4：OpenAI如何能為免費版本使用者提供這麼多功能？

Jakub首先從技術角度解釋了這個現象：

當OpenAI開發出新一代模型（比如GPT-5）時，它代表了智能的新前沿，也就是目前AI能達到的最高水平。

達到這個前沿後，很快就能找到更便宜的方法來複製這種能力。

奧特曼從商業角度補充了這個討論：過去幾年，特定單位智能的價格每年下降約40倍。

這裡出現了一個看似矛盾的情況，為什麼仍需要大量基礎設施？他們AI越便宜，人們越想使用，最終總的成本預計只會增加。

OpenAI在此做出承諾，只要商業模式依然有效，就致力於繼續將我們能做到的最好技術放入免費層。

Q5：ChatGPT是OpenAI的終極產品嗎？還是通往更偉大事物的前身？

Pachocki解釋作為研究實驗室，最初並沒有打算建構聊天機器人。

但他們現在已經認識到這個產品與整體使命的一致性，ChatGPT讓每個人都能使用強大的AI，不需要程式設計知識，不需要技術背景。

奧特曼認為聊天介面是一個很好的介面，但不會是唯一的介面，人們使用這些系統的方式將隨時間發生巨大變化。

對於五分鐘以下的任務，聊天介面表現很好，可以來回提問，逐步完善直到滿意。

但對於五小時的任務就需要更豐富的介面，那五年或五個世紀的任務呢？這幾乎超出了我們的想像。

奧特曼隨後描繪了他心目中最重要的演進方向：一個環境感知的、總是存在的夥伴，觀察你生活並在你需要時主動幫助你的服務。

視訊回放：
https://openai.com/live/?video=1131297184 (量子位)