#OpenAI總裁
OpenAI 十年棋局:聯創首次講透 Sam Altman 政變、GPT-4 崛起、算力戰爭,以及 AGI 將如何重寫每個人的命運
在矽谷波詭雲譎的科技版圖中,葛雷格·布羅克曼(Greg Brockman)始終扮演著一種極具張力的角色。作為 OpenAI 的聯合創始人兼總裁,他既是那個在凌晨時分依然親自下場偵錯程式碼的“頭號工程師”,也是在 2023 年 11 月那場震驚全球的董事會“地震”中,堅定選擇與Sam Altman並肩作戰的靈魂人物。從 Stripe 的早期技術骨幹到引領全球 AI 範式轉移的弄潮兒,布羅克曼的個人軌跡與 OpenAI 的每一次命運轉折緊密交織。近日,布羅克曼接受了深度訪談,以前所未有的視角復盤了 OpenAI 從非營利機構向營利實體的艱難轉型,解讀了從 Dota 2 到 GPT-4 的技術跨越,並首次詳盡還原了管理層動盪背後的心理韌性。在他看來,世界正加速邁向一個由算力驅動的新經濟時代。在這場通往通用人工智慧(AGI)的征途中,OpenAI 的核心競爭力絕非單一的模型,而是那台能夠持續製造智能的“機器”——一支敢於直面真相、在痛苦中成長的精英團隊。核心觀點技術哲學:在大規模算力加持下,簡單的演算法(如預測下一個字元)能夠產生深刻的語義理解和智能湧現。使命驅動:OpenAI 的核心競爭力不在於單一模型,而在於能夠持續製造這些模型的“機器”——即那支擁有高度韌性、直面嚴酷真相且願為夥伴而戰的團隊。迭代部署:通過將中間版本的技術推向市場,讓社會在適應中建立韌性,是實現安全 AGI 的唯一可行路徑。算力經濟:世界正轉向由算力驅動的經濟模式,未來每個人都將擁有代表個人長期目標的 AGI 代理。“在 AI 領域保持領先對美國至關重要,因為這是確保民主價值觀得到保護和捍衛的方式。”“大規模算力配合簡單演算法,這不僅僅在理論上成立,它是切實可行的,能夠產生深刻的語義理解和智能湧現。”“我們正轉向由算力驅動的經濟模式,未來每個人都將擁有代表其個人長期目標的 AGI 代理。”“迭代部署是實現安全 AGI 的唯一可行路徑,必須讓社會在適應中間版本技術的過程中建立韌性。”“偉大的團隊不是為了錢而戰,他們是為了身邊的夥伴而戰。”“如果你沒有經歷痛苦,就意味著你沒有創造價值。”緣起納帕谷:一個改變命運的使命2015 年,布羅克曼正處於職業生涯的十字路口。儘管他在支付巨頭 Stripe 取得了巨大成功,但他深感那並非自己終身追求的宿命。在與山姆·奧特曼(Sam Altman)的一次長談後,兩人一拍即合。當時的 AI 領域被 Google DeepMind 統治,外界普遍認為白手起家已無可能。布羅克曼回憶道:“當時的感覺就是,想要白手起家創辦點什麼,甚至還有可能嗎?但沒有人能給出一個理由說明這在事實上是不可能的。”為了打破僵局,布羅克曼在納帕谷組織了一場線下團建,那次會議誕生了 OpenAI 追求十年的技術藍圖:解決強化學習、無監督學習,以及逐步學習更複雜的事物。布羅克曼認為,OpenAI 的誕生源於一種近乎宗教般的使命感,即確保 AI 的收益得到廣泛分配。正是這種感召力,讓他在沒有任何正式組織架構的情況下,說服了伊利亞(Ilya Sutskever)等頂尖科學家加入。技術哲學:從預測下一個字元到智能湧現布羅克曼的技術哲學根植於對“規模法則”的堅定信仰。在早期研究 Unsupervised Sentiment Neuron 論文時,他敏銳地察覺到,僅僅通過訓練模型預測下一個字元,就能讓神經網路湧現出對情感的深刻理解。這推翻了許多人的偏見,即認為預測只是平庸的模仿。他強調:“如果你真的能預測愛因斯坦口中說出的下一個詞,那麼你至少和愛因斯坦一樣聰明。預測的意義不在於預測已知,而在於讓你置身於此前從未見過的場景。”這種哲學在 Dota 2 實驗中得到了終極驗證。OpenAI 使用簡單的強化學習演算法 PPO,配合巨大的算力,最終在極其複雜、無序的遊戲環境中超越了人類頂尖水平。這次成功讓布羅克曼意識到:“如果採用同樣的計算方法,但將其擴展到人類大腦的規模會怎樣?那是一個非常引人深思的問題。” 這也為後來 GPT 系列的全面爆發埋下了伏筆。商業轉型的邏輯:算力霸權與現實主義2017 年,OpenAI 迎來了最關鍵的轉折——從非營利模式轉向營利實體。這一決策在當時引發了巨大爭議,但在布羅克曼看來,這是使命驅動下的必然選擇。隨著對算力需求的指數級增長,非營利組織的籌款潛力已達上限。他坦言:“我們開始計算算力需求,意識到這需要一台大型電腦。如果我們能收購超大規模的資料中心,那將成為一種獨特的優勢。”布羅克曼認為,OpenAI 的核心優勢在於對未來的“提前下注”。當競爭對手還在質疑投入規模時,OpenAI 已經開始構思百億美元等級的算力叢集。他直言不諱地指出:“聰明的經營者總是在尋找槓桿效應。我們被一種強烈的動力所驅使,即真正地面對現實,去思考未來 10 年實現目標意味著什麼。”驚魂周末:忠誠、韌性與“救生筏”訪談中,布羅克曼首次詳細回顧了 2023 年 11 月那場管理層危機。當他在家中收到薩姆·阿爾特曼被免職的消息時,他沒有陷入憤怒,而是出於直覺選擇了辭職。“我只是知道這樣做是不對的。掛斷電話後,我立刻和妻子談了談,我說,我必須辭職。”隨之而來的景象令他震驚:大批核心成員取消了感恩節假期,擠在辦公室裡要求與公司共進退。布羅克曼將這段經歷視為團隊韌性的終極測試。由於 Google Docs 在處理請願書籤名時因人數過多而崩潰,員工們不得不通過聯絡人手動加入名字。他引用了一句箴言:“他們不是為了錢而戰。他們是為了身邊的夥伴而戰。” 最終,這場危機不僅沒有摧毀 OpenAI,反而鍛造了一個更具凝聚力的鑽石核心。安全與監管:在迭代中建構社會韌性對於 AGI 的安全擔憂,布羅克曼提出了“迭代部署”的概念。他堅決反對在象牙塔裡閉門造車,認為必須讓社會接觸中間版本的技術,以便建立應對風險的“肌肉記憶”。“如果你把 AGI 當作你的第 100 個系統,而此前你已經部署過 99 次能力遞增的系統,世界就有機會圍繞它們進行重構。這就像給汽車安裝安全帶,給城市修建道路。”在談到模型偏見與政治傾向時,布羅克曼表示 OpenAI 致力於訓練模型追求長期目標,而非通過“獎勵作弊”來取悅使用者。他預測,未來的 AGI 將成為 80 億人的個人代理,全天候代表使用者的利益行事。終局願景:算力驅動的未來經濟布羅克曼對未來持有一種極具前瞻性的樂觀主義。他認為,人類正在進入一個“算力驅動型經濟”,每個人都將成為“智能體管理者”。在這個世界裡,AI 不再是人們通過電腦操作的工具,而是電腦主動為人類完成工作。“即使是在這兩年內,我們將看到的不僅是 AI 作為向善的力量。每個人都應該進入這樣一個世界:口袋裡隨時揣著一名水平超過全球頂級專家的醫生。”訪談最後,布羅克曼再次回到了他的初心。對他而言,成功的定義從未改變,那就是:“實現 OpenAI 的使命,確保通用人工智慧造福全人類。” 在這場跨越技術瓶頸、商業競爭與人性考驗的長跑中,這位頂尖架構師依然堅信,痛苦與不確定性正是創造價值的必經之路。天空之城全文整理緣起:從 Stripe 到 AI 夢想Shane Parrish: 那麼 OpenAI 是如何誕生的呢?我知道我想創辦一家初創公司,因為我覺得那是我想做的事情。但你當時正身處一家初創公司,Stripe 就是一家初創公司。Greg Brockman: 確實如此,但我從未……我覺得 Stripe 所解決的問題並非我自己的問題,那並不是我從小到大一直在思考的問題。那是一個重要的問題,我為此使命全身心投入了多年,但我感到無論有沒有它都會成功。所以,我當時第一次真正思考:有什麼使命是我願意投身其中,甚至願意餘生都致力於解決這個問題,只為看到它能以稍微好一點的方式發展下去。對我而言非常明確的是,首選目標就是 AI。如果你能真正對 AI 在世界上的發展軌跡產生影響,那將是充滿意義的一生。Shane Parrish: 當你考慮離職時,Patrick 讓你去和 Sam Altman 談談。那次談話發生了什麼?Greg Brockman: Patrick 曾經說過,Sam 見過很多處於你這種境況的年輕人。而且我認為,Patrick 真心希望 Sam 能說服我留下來。和 Sam 談了幾分鐘後,他表示,你顯然已經決定了。這非常明顯。於是他問,那你接下來打算做什麼?我說,我在考慮創辦一家 AI 公司。他說,我也在考慮在 AI 領域做點什麼。我們應該保持聯絡。所以在我離開 Stripe 之後,我和 Sam 可能又談過一次。他問你還在考慮做 AI 相關的事情嗎?我說,是的。他說,我也開始獲取更多細節,並正在籌備七月份的這場晚宴。於是我飛過去參加了那場晚宴。我記得當時討論的一個話題是:現在組建一個匯聚頂尖研究人員的實驗室是否已經太晚了?這還有可能嗎?Shane Parrish: 那是在那一年?Greg Brockman: 2015年,因為你會考慮到 DeepMind 當時幾乎擁有了所有的研究人員、所有的資金以及所有的資料。當時的感覺就是,想要白手起家創辦點什麼,甚至還有可能嗎?人們列舉了各種各樣的理由。這很難。但沒有人能給出一個理由說明這在事實上是不可能的。那天晚上,Sam 和我開車回城時,我記得我們相視一笑,說道,我們必須做這件事。我們就是必須得做。於是第二天,我就全身心投入到這件事的籌備工作中了。這很困難,因為它在當時非常模糊。我們有一個使命和願景,即我們認為能夠建構人類水平的 AI,讓它對世界產生積極影響,並確保其收益得到廣泛分配,但具體該如何實現呢?而且,你該如何說服人們真正離開現有的工作,加入這個項目呢?最初,我鎖定的人選其實是 Ilya、Dario Amodei、Chris Olah 以及我自己。這就是最初的核心團隊。我們在一起度過了很多時光。我們花了大量時間討論實驗室的潛在願景,以及各種可能的運作方式。事情並沒有完全整合在一起,其中一部分原因僅僅是,這是否具備足夠的推動力?Dario 覺得他需要去闖出一番名堂,而且他不確定這是否真的是他要走的路。當時還存在關於這一切將如何運作的問題。與此同時,John Shulman 開始產生興趣。他說他願意加入。Dario 和 Chris 最終決定去 Google Brain。所以實際上就只剩下 Ilya、還有 John,或許還有另外幾個人。當時我有一個大約 10 人的團隊,他們中許多人說,我對這個感興趣,但還有誰會加入?我問 Sam,我們該如何打破這種僵局?我們到底該怎樣讓每個人都說,我們加入?Sam 的建議是邀請大家參加一次線下團建。所以我們在 Napa 組織了一場活動,當時我甚至還專門製作了 T 恤——那是在他們加入之前?當時沒有任何正式的邀約,也沒有人加入,我們沒有任何組織架構,什麼都沒有,我們只有一個想法。我們有一個願景。我們有一個使命。我們把大家請了過來。我們一起開車去了 Napa,那是非常棒的一天。大家靈感迸發。我們提出了我認為可以稱之為我們在過去 10 年中所追求的技術藍圖。第一點,解決強化學習問題。第二,解決無監督學習問題。第三點是逐步學習更複雜的——加上引號——事物。在那次場外會議之後,我向每個人傳送了邀請,並說,嘿,我們希望在接下來的兩到三周內啟動。如果您有意參與,請告知我。Shane Parrish: 您為什麼認為 DeepMind 具有如此難以踰越的優勢?Greg Brockman: 當時的情況確實是,Google DeepMind 在該領域佔據絕對統治地位。他們擁有大量的資本,擁有成功的過往記錄。那是 AlphaGo 問世之前,AlphaGo 在幾個月後推出,但這並不令人驚訝,那種勢頭非常明顯。因此問題在於,這真的可能實現嗎?去建構一個獨立且全新的事物,這並非顯而易見。商業轉型與技術里程碑:從 Dota 到 GPT-4Shane Parrish: 你是在什麼時候意識到,非營利模式是行不通的?Greg Brockman: 在 2017 年,我們開始深入思考,首先,我們該如何真正實現我們的使命?我們到底該如何建構一個 AGI?那會是什麼樣子的?於是我們開始計算算力需求。你會逐漸意識到,這需要一台大型電腦。我們發現了一家名為 Cerebras 的公司,他們當時正在建構一種獨特的計算硬體。而我們意識到,他們所承諾的那種電腦,將遠超我們計算預測中的算力水平。正如你開始意識到的那樣,如果我們能購買大量此類電腦,我們實際上很有可能成功建構出 AGI。如果我們能獲得 Cerebras 的獨家訪問權,那將賦予我們壓倒性的優勢。如果我們能收購超大規模的資料中心,那也將成為一種獨特的優勢。關於非營利組織的籌款,我認為其潛力本質上是有上限的。因此,Elon、Sam 和我都一致認為,OpenAI 向前發展的唯一途徑,即實現其使命的唯一路徑,就是建立一個與 OpenAI 相關的某種形式的營利性實體。我們致力於這一方向,並且我們深知這是實現該使命的唯一途徑。Shane Parrish: 你意識到一切都將為你而改變的那個時刻是什麼時候?是在 Dota 時期,還是在那之前,亦或是之後?Greg Brockman: OpenAI 的運作方式是一系列時刻的累積。在這些時刻,你會意識到一切已成現實。每當你以為自己已經理解了它,認為一切都已經塵埃落定時,你就會發現一個新的視野,而那曾是你尚未察覺的。所以在此過程中,我認為有過一次最初的發佈。當時的感覺是,哇,我們真的組建起了一支團隊。現在我們可以追求這個使命了。但第二天來到辦公室時,我在想,我們該做什麼呢?我們甚至連一塊白板都沒有。我的意思是 John 想在白板上寫點東西。我說,我會去弄一塊白板來。那是力所能及的事情。Dota。我們取得了第一個重大成果,那真的就像是,哇,當我們下定決心時,確實可以成就一番事業。你確實可以看到所有這些計算資源匯聚在一起。你擴大了計算規模。你也就擴大了成果規模。GPT 系列在開發過程中有多個重要時刻。我記得其中一個早期時刻是關於 unsupervised sentiment neuron 的那篇論文。你聽說過那篇嗎?Shane Parrish: 我聽說過,但我沒讀過。Greg Brockman: 好吧。那篇論文很有意思,因為它是在 2017 年發表的。那確實是我們第一次看到語義從語言模型訓練目標中湧現出來。通過訓練學習下一個字元,預測下一個字元,然後你突然得到一個能夠理解情感的神經網路,能夠判斷內容是正面還是負面的。這比聽起來要困難得多。但就在那一刻你意識到,哇,我們正在建構能夠學習語義的機器,它們不僅僅是知道逗號、名詞和動詞的位置,而是真正能夠理解句子的含義。你必須推動這一處理程序。Shane Parrish: 當然,當你看到像 GPT-4 這樣的事物時,我記得我們當時正在試用它,有人問,為什麼這個東西還不是 AGI?Greg Brockman: 這其實很難界定,因為你可以用任何你想要的方式與它進行流暢的交流。它顯然還不是 AGI,確實缺少了某些東西,但如果你在兩個月前列出你的 AGI 標準,它很可能已經符合 GPT-4 當時的表現了。所以,在整個過程中有許多時刻會讓你覺得它現在是真實的。這一切真的會發生。經濟將在這個由算力驅動的世界中發生轉型。我認為這些時刻遠未結束。我認為我們還有許多突破性的時刻,在那些時刻你會意識到下一個階段是可能的。Shane Parrish: 我認為 Dota 是一個令人難以置信的時刻,因為它不像 Deep Blue 下的國際象棋,也不像 AlphaGo 那樣在計算上高度密集但規則非常明確。它實際上是以一種與人類互動的方式進行的,即世界在某種程度上是有結構的,但你又擁有所有這些自由。Greg Brockman: 那確實是非常引人注目的。諷刺的是,我們最初開發 Dota 是為了研究新方法,因為當時的強化學習顯然無法實現擴展,我們使用的演算法叫做 PPO,你需要對每一個時間步進行規劃。它沒有層級結構。而作為人類,這並非你規劃一天的方式。所以我們知道這種演算法存在嚴重的缺陷,永遠無法實現擴展,並且還有所有這些問題。但你必須從某個地方開始。你必須不斷推高基準線以觸及天花板,這樣我們才能真正看到現有條件下所謂的卓越極限在那裡。然後你就可以引入新的演算法。我們不斷擴展 PPO 的規模,最終超越了頂尖人類的表現。這本身就是一項發現,即大規模算力配合簡單演算法,這不僅僅在理論上成立,它是切實可行的。它在實踐中行之有效。我們確實能夠實現它。在這種極其混亂、無法程式設計、無法預判且無法進行搜尋的環境中。你所需要的只是這種類人的直覺。順便提一下,我們使用的神經網路非常微小,相當於昆蟲的大腦,其突觸數量與真正昆蟲的大腦相當。你會意識到,如果採用同樣的計算方法,但將其擴展到人類大腦的規模會怎樣?那會是什麼樣子?這是一個非常引人深思的問題。Shane Parrish: 推理和預測之間有區別嗎?你提到了預測下一個字元、預測下一個單詞,與真正基於第一性原理的推理之間的區別?我認為它們之間有著深刻的聯絡。Greg Brockman: 一方面,僅僅預測接下來會出現什麼聽起來是一項平庸的任務。但如果你真的能預測 Einstein 口中說出的下一個詞,那麼你至少和 Einstein 一樣聰明。你可能會爭辯說,但我覺得這些論點站不住腳,其中存在某種錯誤,因為預測的意義不在於能夠預測已知的事物,預測的意義在於讓你置身於一種新的情境之中。你此前從未見過的內容,並預測接下來會發生什麼。我認為智能與預測之間有著深刻的聯絡,學術文獻中對此有長期的論述,關於你如何思考這一點、壓縮技術,它們本質上都屬於同一事物。現在,這些推理模型中,我認為非常有趣的一點是我們通過強化學習來訓練它們。所以這確實回到了最初的 OpenAI 計畫,它分為兩個步驟。第一步是無監督學習。你通過讓模型預測接下來會發生什麼來對其進行訓練。在這一階段,資料要靜態得多。它更多是觀察性的。同樣,這些是它從未見過的資料、從未見過的場景,但這些場景是已經發生過的。然後進行強化學習,也就是說你基本上讓 AI 在其自身資料上進行學習,你讓它自己做出決定,這就是我將要採取的行動。你從世界獲取觀察結果,並從中進行學習。再次強調,你實際訓練它的方式依然是基於預測,它試圖預測,如果我採取這個行動,最可能發生的情況是什麼?然後根據你做得有多好,來對其進行強化。其精妙之處在於,它現在成為了一個既擁有背景知識又具備真實世界經驗的 AI。但從根本上說,我們在無監督階段和強化階段所使用的技術是完全相同的。你依然是在進行預測,只是改變了資料的結構。危機、衝突與使命的存亡Shane Parrish: 局勢是從什麼時候開始變得緊張的?Greg Brockman: 我認為關於 OpenAI 的一點是,如果你真正相信這一使命,如果你真正相信創造出具備人類智能水平的機器是有可能的,那就意味著賭注總是顯得非常高。關於決策者是誰、關於這些決策背後秉持何種價值觀,以及那些在典型公司中或許顯得平庸、更像是辦公室政治的問題,開始承載起這種關乎存亡的重量。我認為這在很大程度上影響了 OpenAI 這類備受矚目的衝突。有時即便只是關於誰該為某項具體成果署名的問題,突然之間也具有了這種關乎存亡的重量。Shane Parrish: 我正是從這個角度思考的,因為到了那個節點,你很可能意識到這項技術是不可避免的,而且它將改變世界。而這一點當時並未被世人廣泛認知。而且我能夠想像,有些人會想:我想要處於最前沿。我想要為此而攬功。Greg Brockman: 是的。這就是我在此領域觀察到的壓倒性態勢。事實上,這不僅僅關乎 OpenAI。我早期的一個觀察是,這項技術本質上是非常碎片化的,那就是,有時,當你面臨巨大壓力時,你可能會得到一顆鑽石,也可能會出現裂痕。你經常會看到像鑽石一樣的核心團隊形成,也就是那些真正能夠通力協作、擁有高度信任並深諳運作之道的團隊。但有時你也會看到他們出現分化,各自走上了不同的道路。我認為在 AI 領域,我們從這種方法的多樣性中獲益良多。不同的團隊確實在相互推動,以更具益處的方式引入這項技術;同時,他們也在思考關於安全性、何為安全、如何真正部署這項技術,以及如何權衡風險與收益的複雜問題。我認為這是一場非常健康的辯論。這在 OpenAI 的內部一直都在發生。現在,我認為這種辯論也正在全球範圍內真正展開。我認為這對我們整個社會來說是真正有益的。Shane Parrish: 本節目的贊助商是 CoinShares。當行業內大多數人還在爭論數位資產是否合法時,CoinShares 已經在默默建構基礎設施,以便能夠妥善地進行投資。他們目前管理的資產規模已超過 60 億美元,在每一個市場周期中都保持盈利,並擁有嚴肅投資者所期望的透明度和治理機制,且完全合規。無論是加密資產交易所交易基金(ETFs)、主動管理策略,還是比特幣挖礦 ETF 敞口,你都可以通過現有的經紀帳戶訪問所有這些投資產品。大人們來了。訪問 coinshares.com 瞭解更多資訊。這不是投資建議。你整天都在開會。你努力保持專注,但又擔心會忘記會議的決定、待辦事項和重要的後續步驟。這就是 Granola 的用武之地。Granola 是一款用於會議的 AI 驅動記事本。你像往常一樣草草記下筆記,而在後台,Granola 會在會議結束後將這些筆記轉錄並轉化為清晰、實用的內容。沒有機器人會加入你的通話,不會造成任何干擾,只有一個能幫你保持專注的簡潔記事本。在通話期間或通話結束後,你可以與你的筆記進行對話。你可以要求 Granola 提取行動事項、協助你進行談判、做出決策、撰寫跟進郵件等等。即使是在聽播客時,我也會使用它。一旦你在第一次會議中試用過,就很難再離開了。前往 granola.ai/Shane,使用優惠碼 Shane 即可免費獲得三個月的使用權。網址是 granola.ai/Shane。帶我回到你得知 Sam 被解僱的那一刻。你當時在那裡?Greg Brockman: 我在家裡。Shane Parrish: 發生了什麼?Greg Brockman: 我收到了一條簡訊,問我能不能加入視訊通話。於是我加入了視訊通話。Shane Parrish: 我注意到董事會成員都在那裡,除了 Sam。當時不在場嗎?Greg Brockman: 不在。我推斷出出事了,但是……Shane Parrish: 因為你是董事會成員。Greg Brockman: 我是董事會成員,或者說是當時的董事會成員。就在那一刻。Shane Parrish: 是的。然後發生了什麼?Greg Brockman: 我被告知了。董事會已經決定將 Sam 免職。實際上我收到的資訊,與公開帖文中的內容完全一致。我詢問是否能提供更多資訊。得到的回覆是暫時不行。我追問是否之後可以,得到的回覆依然是無可奉告。隨後對方告訴我還有後續內容。即我已被移出董事會。但我仍會留在公司,因為我對公司和其使命至關重要。我再次詢問能否提供任何理由或反饋,得到的答覆依然是否定。在對話末尾,對方表示,在新的架構下,希望我能通過新的配置獲得反饋。Shane Parrish: 這就是整個對話的內容。你當時是怎麼想的?就是覺得不對勁。是憤怒嗎?Greg Brockman: 不是。Shane Parrish: 我感覺我理解了所發生的事情。過了多久你才真正弄清楚是什麼導致了這種情況?Greg Brockman: 這個問題的答案包含兩個部分。其一是,我覺得自己仍在不斷獲知額外的事實和某些人內心真實的想法。在某種程度上,這歸結於溝通的缺失,對吧,你意識到我所緩衝的那些不同事物其實一直都在。而在某種程度上,大概就是那種感覺。我當時心想,對於在場的每一個人,我都能很好地推斷出他們為什麼會有那樣的行為。但這並不是那一刻對我而言最重要的事情,我只是知道這樣做是不對的。掛斷電話後,我立刻和妻子談了談,我說,我必須辭職。她說,我同意。Shane Parrish: 然後你就在那天辭職了。Greg Brockman: 是的。那後來發生了什麼?我辭職的那天,抱歉,因為收到了這麼多消息,人們說,我不知道你和 Sam 接下來的打算是什麼,但我支援你們。我想和你們一起去開創些什麼。真的,那確實是一個非常真實、出乎意料的驚喜。我確實沒想到會得到那樣的支援,那樣的聲援。那天還有幾位與我密切合作的同事也辭職了。他們是 Jakub、Szymon、Aleksander,加上我們五個。所以這些人加上 Sam,我們聚在一起,開始規劃一家新公司可能會是什麼樣子。我記得第一天的時候感覺是,我們實際上有 10% 的機會能把公司拿回來,10%。第二天,我們在 Sam 家裡安排了一次會議。公司裡的一群人過來參加,我們展示了我們剛剛草擬的願景。所以這真的是在第一天,有了關於我們如何營運這個項目的全新構想。那個周末我們還花了很多時間與董事會和公司進行談判,試圖找出一條行得通的回歸之路。那個周日晚上,董事會撤換了臨時 CEO Mira,換上了一個新人,公司隨即發生了反抗。就像我們當時確實還在辦公室一樣。我們原本以為離達成交易很近了,也以為能回來。Shane Parrish: 能回來。Greg Brockman: 沒錯。我們以為已經找到了一條可行之路。然後董事會就做出了那個調整。緊接著,所有人突然都開始湧出大樓,場面簡直一片混亂。我當時正與許多有興趣加入這家新公司的人進行視訊通話,安撫他們說一切都會好起來的。我們有計畫。我們擴大了規模,你也知道,我們一直在為那小部分我們預期會願意加入的人打造這艘救生筏,對吧。突然之間,大家似乎都不想再與這個實體扯上任何關係了,人們希望能站出來,維護他們眼中正確的事情。Sam 與我們之前討論過的 Satya 進行了溝通,詢問他是否願意提供資金支援?你是否能助一臂之力,支援這個新的事業?我當時說,嘿,能不能不只是這艘小小的救生艇,而是把這裡的每一個人都帶上?於是,答案是肯定的。我們接收所有人。你當時的態度就是,無論如何我們總能想到辦法解決。當時很多人正處於感恩節假期前夕。很多人原本都計畫飛回各自的家鄉。相反,他們取消了航班,辦公室裡擠滿了人。就好像每個人來到辦公室僅僅是為了待在那裡,參與其中。而且,即使他們無法對這些談話做出任何貢獻,他們也只是想在歷史創造的時刻身處現場。接著,一份請願書開始流傳。當時有太多人同時試圖簽署這份請願書。這直接導致 Google Docs 崩潰了。所以你必須不得不……必須指定某些人作為聯絡人,由他們來負責將你的名字加入進文件中。你不能同時擁有太多的編輯權限。我認為那是一個被強烈聽到的聲音。我記得,我大約凌晨 5 點左右才到家,然後就睡了。我大約 45 分鐘後醒了過來。我查看了 Twitter,發現 Ilya 已經發佈了內容並簽署了請願書。上面寫著他希望公司能夠重歸於好。那一刻我感到如釋重負。我心中充滿了感激,感覺一切都好起來了,我們可以重頭再來。我們可以回到正確的軌道上來。Shane Parrish: 你和 Ilya 是共同創立了這家公司。在那之後,試圖修復你們之間的關係是什麼樣的體驗?Greg Brockman: 聽著,這很艱難。那絕對是一段非常親密的關係。他曾擔任我民事婚禮的證婚人。我們曾共同經歷過極其艱難的時刻。正如任何一段關係一樣,大家總是會有起起落落。此後我們花了很多時間進行深入交流,試圖真正去理解並表達出那些在我們之間積壓已久或未曾言說的事情。我認為通過那個過程,我們最終達成了一種非常好的狀態。對我而言,我覺得我們對所發生的一切都做到了釋懷。Shane Parrish: 對於你所激發出的那種忠誠,你有什麼感受?Greg Brockman: 深感感激。這確實是我從未主動要求過,也從未預料到的事情。我想我的行事方式是,我更傾向於做一個深入一線、身先士卒的領導者。有時我這樣做的時候,我不總是——我有點情緒化了——我不總是回頭看大家是否跟上,我只是徑直衝了進去。而當人們真的加入並切實幫助建構這些事物時,我只會感到非常感激,並覺得他們在各方面都超出了我的預期。所以最終大家都回來了。我得告訴你,這並非十拿九穩,因為整個周末競爭對手都在伺機而動。想像一下那種人們正準備採取的瘋狂爭搶,大家都在接收邀約,但那個周末我們確實沒有失去任何一個人,沒有人接受競爭對手的邀約。Shane Parrish: 我覺得這太不可思議了。確實如此。這更多是因為,當我們討論什麼是最好的團隊時,Coach Belichick 確實曾這樣告訴過我。他說,他們不是為了錢而戰。他們是為了身邊的夥伴而戰。當你提到這些人全都辭職時,讓我想到了這一點。他們中沒有人是因為得到了據說是更多的錢或更好的報價而離開的。當時每個人都在試圖圍獵和挖角。Greg Brockman: 那確實是一個非常珍貴的時刻。尋找初心:研究與反思Shane Parrish: 這一切發生之後,你休息了一段時間。當時你的內心狀態如何?Greg Brockman: 那是一段極其強烈的經歷,無論是在經歷的過程中還是回歸之後,坦率地說,在 OpenAI 我最艱難的時刻之一就是 Ilya 離開的時候。那可能是 OpenAI 歷史上唯一一個讓我覺得不想再繼續下去的時刻。我想我需要一些時間來找回初心,重溫我當初為何投身於此,為何這一切如此重要,以及為何它值得我承受這些痛苦。Shane Parrish: 在那段期間你做了什麼?Greg Brockman: 我訓練了語言模型。Shane Parrish: 你是在那個時候學會如何操作的,就像你進行的自學那樣。我在你的部落格上讀到過。Greg Brockman: 不是的。事實上,在 OpenAI 工作期間,我就已經完成了這些。我當時訓練的是針對 DNA 序列的語言模型。所以我基本上把我的研究成果帶到了 Arc。Shane Parrish: 為了 Arc Institute。沒錯。Greg Brockman: 那是一次非常棒的經歷。我運用了自己已有的技能,並將它們應用於一個截然不同的領域,而這個領域對我和我妻子來說都具有非常重要的個人意義。她有很多健康方面的問題,我們在思考 AI 能為她的健康做些什麼,能為我們都非常熱愛的動物的健康做些什麼,這就像是一個應用領域,讓我們覺得或許能以一種與我以往追求這項技術時截然不同的方式提供幫助。所以那確實是這段經歷中非常積極的一部分。Shane Parrish: 如果我讓你打開一個 Google 文件,用一頁紙寫下你從這一系列事件中對自己的認識——從 Sam 被罷免,到你辭職,再到激發了如此多的忠誠,到休整一段時間,最後回歸——你會寫些什麼?Greg Brockman: 我想我只是學會了要堅持追求那些值得的東西,如果你肩負著一項重要的使命,那麼在經歷起起落落的過程中,必然會有陷入絕境的時刻,也會有重回正軌的瞬間,你絕不能讓這些波動偏離了既定航向。我認為,在此期間你必須培養出極強的個人韌性,因為如果你處於領導地位,人們會仰賴你的沉穩、支援以及對整體發展方向的把控。我努力提升自我的一大核心,就是既要真正能夠理解我們所做之事的細節,即一項決策會帶來什麼影響,又要能夠在決策時保持果斷。我想,曾有那麼一些時刻,我在審視 OpenAI 時深受不確定性的困擾,總覺得不知道什麼才是正確的答案。我不知道開發這項技術的正確路徑是什麼,也不清楚該如何回答這些極其棘手的問題。但這裡有很多非常聰明的人,他們有著非常鮮明的觀點。所以我努力嘗試去理解所有這些觀點,並設法將它們整合在一起。有時這是正確的處理方式。但有時你會意識到,這些觀點之間存在著相互矛盾,它們不可能同時成立。在這種情況下,你有時必須做出抉擇。你知道這意味著總會有人感到不滿,有人會選擇離開,也有人會覺得被冷落。我認為我努力做到的一點是,在保持更強自我意識的同時,在確信需要採取行動時,擁有更堅定的信念。回想在 OpenAI 發展的過程中,有一些事情我希望能以不同的方式處理。我覺得通常情況都是這樣。我們在明知某些事情的情況下卻遲遲未動。我們知道某個人並不完全適合某個職位。我們認為這在技術方向上並非完全正確。我們認為這種讓項目運行的方式可能行不通,但我們等待的時間太久了。所以,這正是我想從中汲取教訓併力求每天真正成長的地方。當我回顧 OpenAI 和 Stripe 的發展歷程,甚至追溯到大學時代以及我過去參與過的項目時。我認為我的行事風格是,我既非常熱愛這項活動的資料本身。我熱愛個人貢獻。我熱愛這款軟體。我熱愛對問題的深入思考。但我同時也非常關注完成這些工作的環境。我實際上願意放棄那種類型一樂趣,也就是像快速上手建構某個東西時的那種簡單快樂。那些更像是類型二樂趣的事情總是很酷,儘管當下可能感到痛苦,但卻是值得的。但你所做的是創造一個環境,讓其他人也能獲得那種體驗,去完成個人貢獻工作,去成就偉大的事業。所以,致力於建構一個這樣的環境,正是我所傾向的方向。這並不總是最容易的,你確實必須願意承擔巨大的個人痛苦。就像 Ilya 所說的那樣,Ilya 總是說你必須學會忍受痛苦,如果你沒有經歷痛苦,就意味著你沒有創造價值。我認為這其中蘊含著深刻的真理。Shane Parrish: 深入探討一下這一點。Greg Brockman: 關於 Ilya 的觀點,我覺得很有趣,因為他有一種非常獨特、只屬於他個人的表達方式。他所選擇的詞句中總是蘊含著深刻的啟迪。這種對於痛苦的描述,是我們貫穿 OpenAI 整個發展歷程中一直在思考的問題,就像我們從一開始就面臨著巨大的不確定性。這東西真的行得通嗎?有很多理由說明它可能行得通,為什麼它不該行得通,甚至可以說它根本不可能行得通,無論是如何招募人才?還是如何推進技術研發?比如,你如何籌集到足夠的資本?你如何保持人們的動力?比如,你如何做出正確的決策?這些事情每一件都極具難度,且充滿極大的不確定性。人們很容易掩蓋問題,盲目地高喊口號,一往無前。我認為這就是 Silicon Valley 文化中消極的一面,至少是外界對 Silicon Valley 的認知,就是那種盲目地去做事,然後通過所謂的“現實扭曲場”或者其他方式來行事。但我認為這在 AI 領域行不通,對於 OpenAI 來說也行不通。我不認為這是我們一直以來的運作方式。我認為我們一貫的運作方式是:直面嚴酷的真相,理解科學,以及事物的本來面貌。我認為,這正是我們能夠取得成功的原因之一——即以不同的方式思考問題,而不滿足於現狀。即使是在早期,我們也曾思考過:如果只是撰寫並行表一些論文,那當然很好,我們會獲得引用,會成為會議上最酷的人,但我們能實現使命嗎?就像是,你如何通過這些活動,讓 AGI 的發展對世界更有利?這兩者之間並沒有直接聯絡,僅僅這樣做是不夠的。也許這只是一個基礎,也許只是邁出了一步,但這還遠未足夠。於是,你開始真正思考那些宏觀層面的問題:建構 AGI 需要什麼,但這並不輕鬆,不是嗎?因為你會意識到,根本沒有現成的路徑。你會意識到你需要資金。而你沒有任何機制來籌集這些資金。你可以努力嘗試。我們確實努力嘗試了。我們付出了極大的努力。但是,也許你正在籌集 1 億美元。你可能可以做到 5 億美元。很好。但如果是 10 億美元呢?相當困難。看看 OpenAI 憑藉我們所能籌集到的資源已經取得的成就。為了推進這一使命,除了直面痛苦並試圖理解我們想要達成的目標真相之外,確實沒有其他方法可以做到。快速問答與行業前瞻Shane Parrish: 有什麼教訓是你不得不反覆學習的?Greg Brockman: 做出艱難的決策,進行艱難的對話。Shane Parrish: 你收到過最好的建議是什麼?Greg Brockman: 我其實會說是來自我 Harvard 大一寫作課上的建議,就是不斷刪減詞彙以保持清晰並實現有效溝通。Shane Parrish: 你如何篩選資訊?Greg Brockman: 我閱讀量很大,並會積極地進行分類篩選。Shane Parrish: 你的榜樣是誰,為什麼?Greg Brockman: 我會說是 Gauss 和 Descartes,他們是非常深思熟慮的人,遠超於他們所處的時代,是非常有遠見的思想家,他們提出了真正的突破性見解,我認為這些見解改變了我們的思維方式和生活方式。Shane Parrish: 你希望非技術人員瞭解關於 AI 的什麼?Greg Brockman: 它將成為他們個人生活中的一股向善力量,他們將從中受益,並且它將有助於推動科學、醫學的發展,真正提升每個人的福祉。Shane Parrish: 外界對 Greg Brockman 有什麼誤解?Greg Brockman: 我認為人們並不瞭解我對這一使命的專注程度,這種專注在很多轉折點上讓我個人感到非常痛苦,但我堅信這項技術能夠助力於人並造福每一個人,我真的希望能助力實現這一目標。Shane Parrish: 為什麼 OpenAI 在模型命名方面表現得如此糟糕?Greg Brockman: 這一點我無法回答你。Shane Parrish: 我們是否已經接近 AI 驅動 AI 實現指數級增長的臨界點了?Greg Brockman: 我認為我們正處於這樣一個階段:將 AI 應用於其自身的開發流程中,並且這一處理程序正在變得越來越快。而且從很多方面來看,這種情況確實從 ChatGPT 出現後就在發生,我們利用 ChatGPT 來最佳化我們的開發流程。這讓效率提升了 10% 到 20%。現在我們擁有了這些出色的編碼工具,它們真正徹底改變了軟體工程的實施方式。而我們在生產模型時,大部分工作環節都受限於軟體開發的速度。關鍵在於如何實現這些系統。關鍵在於將它們規模化。關鍵在於如何管理這些龐大的電腦。我們即將進入一個階段,屆時 AI 也將能夠提出自己的研究思路,並進行驗證和實驗。因此,我認為我們所產出的成果將持續推動迭代和創新速度的提升。Shane Parrish: 目前有多少比例的程式碼是由 AI 編寫的?Greg Brockman: 很難統計還有多少程式碼不是由 AI 編寫的。那已經是一個微乎其微的比例了。至於實際的程式碼編寫工作,在給予正確的上下文和結構前提下,AI 目前在寫程式碼方面已經遠勝於人類。當然,在程式碼的架構層面,我們的頂尖人類專家仍然具有顯著優勢,這涉及對模組佈局的思考、各部分協作方式的規劃,以及某些介面定義的設定,但實際的程式碼編寫工作現在基本上全都由 AI 完成了。Shane Parrish: 它是否提出了你之前未曾想到的創新點?Greg Brockman: 我認為我們現在正處於臨界點。例如,我們在晶片設計領域已經看到了這一點。以我們自主研發的晶片設計為例,去年,我們應用了我們的技術來尋求更優的佈局,從而有效縮減電路所佔用的面積。在那裡,我們發現模型生成的最佳化方案實際上已經在我們的清單之中了。所以它並沒有提出人類從未想到的新穎構思,但它以一種我們無法及時實現的方式加快了執行速度。如果你觀察數學和物理領域,我們現在正在解決未解的數學難題。我們正在解決未解的物理難題,並且最近在量子物理學中,我們以與學術界預期相反的方式解決了這個特定的物理問題,並得到了一個優美而簡潔的公式,這看起來確實正在成為現實。因此,這些模型產生新想法是非常可行的,我們已經開始在其中一些領域中看到了成果。現在,隨著將其應用到越來越困難的領域,或者那些需要更多現實世界背景知識的領域,我們正開始看到成效。我們已經明確了實現目標的路徑,但仍有大量工作要做。政治、偏見與安全Shane Parrish: 為什麼模型會讓人感覺帶有政治傾向,幾乎像是存在政治偏見?Greg Brockman: 我們投入了大量精力確保模型的中立性,使其能夠呈現事實。你可以在我們的網站上準確查看我們模型所遵循的價值觀。我們發佈了公開規範,定義了我們希望模型採取的行為方式,你可以針對這些方式提供反饋。我們付出了巨大努力以真正達到這種中立的立場,併力求公平與平衡。我認為,有時你在 Twitter 上看到的那些截圖,其來源本身並不一定完全真實,這可能是因為後台存在某些影響答案的記憶、隱藏指令或對話的前序內容。所以有時,問題本身就沒有標準答案。比如當你問一個問題並要求用一個詞回答時,無論你怎麼回答,都會遭到某種關於偏見的指責。在我看來,問題的核心在於,我們非常在意事實,並致力於打造一個真正代表你意願的 AI。Shane Parrish: 你認為如果模型是基於強化學習建構的,它們是否會演化成專門說我們想聽的話?也就是說,如果我的政治傾向偏左,它就會給我一個偏左的回答;如果我偏右,它就會給我一個偏右的回答。Greg Brockman: 事實上,在如何根據使用者偏好訓練模型方面,我們已經經歷了一次演變。我們發現,在某一個階段,比如去年,這些模型確實開始傾向於說你想聽的話,比如會對你說:“這是一個非常棒的回答”。對此我們已經做出了應對。我們表示這並不是我們希望模型運作的方式,因此我們進行了改進。因為我們希望模型真正對齊的目標是幫助你解決問題,實現你的長期目標,或許在當下,聽到“這是一個很棒的問題,是有史以來最好的提問”會讓人感覺良好,但這並不是你真正想要的。也許有些人會喜歡,但這不是大多數人真正想要的。因此,我們實際上在技術上做了很大的改進,以確保我們的 AI 訓練不會導致所謂的“獎勵作弊”(reward hacking),我們要確保那裡有明確的訊號指向目標,而不僅僅是你的短期目標。Shane Parrish: 什麼是能讓你獲得快速成功的途徑?Greg Brockman: 對我而言,這也許是個人 AI 以及個人 AGI 未來發展願景中最重要的一部分,即確保它不僅僅是看起來不錯。它真正關乎的是與你的長期福祉、長期目標以及你內心真正想要的東西保持一致。這就是為什麼我認為它最能賦予人們力量,因為它確實讓你掌握了主動權,因為你將擁有一個 24 小時全天候為你服務的實體。當你入睡時,它仍在努力思考 Shane 想要什麼,我該如何做得更好,並且真的能夠將其實現。全球競賽與算力霸權Shane Parrish: 我們處於一場全球 AI 競賽中嗎?Greg Brockman: 我認為我們當然處於一場全球 AI 復興之中。而且我認為國家之間的動態關係尚未完全定義。我們看到這些突破性演算法的源頭高度集中在美國,集中在西方公司手中。顯然,世界各地都在進行大量的創新,但我認為具體的動態平衡,以及各國如何依賴不同的提供商,這一切目前仍在演變之中。Shane Parrish: 會有什麼後果嗎?你認為如果美國不是第一個實現 AGI 的國家會有什麼影響嗎?Greg Brockman: 我確實認為在 AI 領域保持領先對美國至關重要,因為我認為這是確保民主價值觀得到保護和捍衛的方式。而且我認為,每個國家也開始意識到它們需要某種形式的自主 AI 戰略。如果這正成為經濟安全和國家安全的基礎,它們就需要以某種方式參與其中。如果你審視美國為管理晶片出口和技術出口所做的許多努力,你會發現,如果採取過於激進的限制措施,那麼其他國家就不得不開發自己的競爭技術,或者依賴於其他正在建構此類技術的國家。如果你採取過於寬鬆的政策,那麼你可能會失去自己的優勢。問題在於,如何平衡這兩者?如何保持你的領先地位?但領導力不僅僅在於領先。領導力也在於引領世界共同前行。Shane Parrish: 其他國家是否在竊取技術進步?我最近一直在閱讀關於模型蒸餾的內容。Greg Brockman: 目前確實有很多關於模型蒸餾的嘗試,這些嘗試來自美國的科技公司,也來自世界各地。但我認為這忽略了核心要點,即這項技術正處於指數級發展的處理程序中。每當我們擁有一個模型時,我們其實已經轉向了下一個模型。我們已經在邁向下一個層級。因此,我們投入了大量精力來防禦蒸餾行為,加大其操作難度,特別是針對思維鏈以及模型中那些對於向使用者交付成果或輸出結果並非真正必要的部分。但我們所擁有的核心優勢,即我們隨時間積累的實力,實際上並不依賴於任何單一的模型,這與製造這些模型的機器有關。Shane Parrish: 噢,這就是你們停止展示推理過程的原因嗎?Greg Brockman: 這只是其中一部分原因。所以有兩個原因。其一是考慮到模型蒸餾,但第二個原因在某種程度上更為重要,那就是我們在最初開發推理範式時獲得了一個洞察:它為我們提供了一種未曾預料到的可解釋性機制,因為你真的可以讀取模型的思維過程,你可以精準看到它是如何得出答案的。因此,你可以解釋它是如何得出答案的,或者說是什麼真正促成了那個答案。現在的問題是,如果你訓練模型去生成一種看起來很完美的思維鏈,那麼你就會失去所有的忠實度,這就像是模型知道預期的答案部分要求思維鏈呈現出某種特定的樣子。因此,它可能不再能夠代表它是如何真正得出該答案的了。因此,我們很早就決定,要避免任何想要訓練這些思維鏈(chain of thoughts)以使其看起來更討喜,或者使其看起來像是可以直接呈現給使用者的傾向。所以,無論是出於競爭原因,還是出於安全考量,這些都讓我們更傾向於不展示這些中間思維過程。Shane Parrish: 目前的趨勢似乎是發佈預覽版模型。你認為這是因為我們受到了算力的限制嗎?Greg Brockman: 我想說的是,我們總體上正在走向一個算力受限的世界。如果你思考一下這些模型能為個人創造的價值總量,那是巨大的,這已經不僅僅是回答一個快速提問了。甚至也不僅僅是為你提供健康資訊存取權那麼簡單。它正在深入研究,並消耗大量的 token 來整合各種不同的資料來源,搜尋你的企業知識庫,從而真正有能力解決這些難題,去編寫出比人類水平更高的軟體。所有這些都是相當困難的。如果你看看我們從 GPT-5 到 5.2、5.3 再到 5.4 之間取得的進展,那是非常巨大的。這些模型在理解你的意圖以及適應你想要實現的目標方面正變得越來越出色。我們還把它們置於像 Codex 這樣的介面中,使其變得非常好用,這樣作為開發者,你真的可以如虎添翼,能夠實現遠超你預期之外的目標。而這一切從根本上都是由算力驅動的。如果你想為世界上每個人都配備一個 GPU,那麼現有的算力是遠遠不夠的。那相當於 80 億個 GPU。我們目前的發展軌跡遠達不到那種量級的算力水平,目前幾十萬個 GPU 就算是一個相當龐大的叢集了,而未來將會有數百萬個 GPU。世界上算力太少並不令人驚訝,為了真正能將這項技術普及給每一個人,我們需要更多的算力。至於訓練方面,我想說的是我們發佈產品的方式。因此,我們投入了大量精力,以確保我們能夠根據對未來趨勢的預判來建構計算能力。我認為我們將非常專注於我們的使命,即向所有人提供這些模型,並實現其廣泛普及。Shane Parrish: 你們曾因在資料中心投入如此多的人力和資金而受到調侃。你們認為目前的情況如何?Greg Brockman: 我認為這會為我們帶來優勢。而且我認為這將成為一種優勢,不僅是對業務而言,更是為了切實履行將這項技術普及給每個人的使命。Shane Parrish: 因為你們,就像你們很早就預見到了這一點。你們幾乎受到了所有競爭對手的調侃。Greg Brockman: 看看現在是誰在笑,我認為我們的競爭對手在算力方面過得並不順心,我只能這麼說。Shane Parrish: 但你們一定看到了他們沒有看到的東西,每個人當時都處於非常相似的技術空間裡,或者至少從外部看起來是這樣,大家都知道這一天終將到來,然而你們卻有膽量押注 1000 億美元。Greg Brockman: 這正是 OpenAI 的核心所在:真正地面對現實,真正去思考我們在未來 6 個月、未來 12 個月乃至未來 10 年將要實現的目標意味著什麼。這對於我們的宏大願景是如此,對於我們日常設計軟體的不同部分是如此,對於像擴大算力規模這樣的事情也是如此。我認為我們被一種強烈的動力所驅使,那就是將這項技術帶給每一個人,我們也在思考許多不同的機制,以確保能夠高效且安全地實現這一目標。聰明的經營者總是在尋找槓桿效應。你覺得呢?資料中心最終會專注於解決特定的問題。比如,你在北達科他州擁有一個巨大的資料中心,它專門用於攻克癌症,這就是它全部的工作。Greg Brockman: 是的。Shane Parrish: 我們距離實現這一目標還有多遠?Greg Brockman: 我認為這種情況在今年發生並非不可能。這確實令人驚嘆。試想一下,擁有一台這樣的巨型機器,你去過這些資料中心嗎?Shane Parrish: 沒有,我是在網上看到的,但從未親臨現場。Greg Brockman: 在這些機架之間穿行是一種非常不同的體驗。沿著通道走,看著那些長度完全精準的線纜,你就會意識到資料中心究竟是什麼——它們是龐大的機器,或許是人類所創造出的最大型機器。接著你會問,我們為什麼要建造這些機器?為什麼它們值得建造?因為它們有潛力去解決對人們而言至關重要的問題,比如尋找癌症的治療方法,幫助人們經營企業,有時也可能只是為了處理一些日常查詢。在我看來,其目的歸根結底在於如何創造價值?如何實現人們的目標?我認為,這些龐大機器針對單一問題所帶來的機遇,是我們尚未真正內化的。Shane Parrish: 但如果我們受到算力限制,該如何決定優先服務誰呢?比如,當我想生成一張圖片,而別人在嘗試攻克癌症時,為什麼要優先服務我?Greg Brockman: 這將是社會需要回答的最重要的問題。算力該投向何處?那些問題值得解決?雖然有很多值得解決的問題,但你必須對它們進行優先順序排序,因為算力資源終究是有限的。因此,我們堅信的一點是,每個人都需要獲得計算資源。這就是為什麼我們提供 ChatGPT 的免費版本。我們確實投入了精力,確保人們能夠使用這種廣泛可用的技術,因為我們認為這是我們工作的核心。我們認為,將這項技術交到人們手中,能夠賦予他們力量,讓他們實現目標,同時也能幫助他們理解這項技術。這有助於他們塑造這項技術在未來如何定位。你可以採取完全不同的方法,認為這只是象牙塔裡的事,只需解決問題,然後以某種方式分發技術突破即可。我認為那種方式也有其優點,但那並不是我們工作平衡點的正確所在。我認為我們確實非常希望在特定問題上取得重大進展。但我認為,這再次應該服務於我們的願景,即我們希望這項技術的益處能夠得到廣泛的分配。企業變革與個人 AGI 願景Shane Parrish: 在 OpenAI 內部,你們是如何看待消費者產品與企業級產品之間的關係的?Greg Brockman: 我最近思考的很多內容都集中在專注度上,因為這個領域本身就是機遇的化身,不是嗎?你可以利用 AI 並將其應用於任何問題,或任何你想建構的事物上。現在一切皆有可能。而我們面臨的問題是,計算資源是有限的。你想把資源放在那裡?因此,你需要形成協同效應。你需要回歸到這樣一個事實:你有多項事務同時進行,且它們共同作用,產生一加一等於十的效果。這正是夢想所在,也是最終目標。我認為 OpenAI 下一階段非常重要的一部分顯而易見是企業業務,因為我們正眼睜睜地看著經濟轉變為算力驅動型經濟。這一切正在發生。正如我們在軟體工程領域所見,這種情況將發生在人們使用電腦進行工作的每一個領域。每個人的電腦工作模式都將發生轉變:不再是你通過電腦工作,而是你的電腦為你工作。這將會是真正令人驚嘆的變革。因此,我們需要在場以幫助人們部署這些模型,弄清楚如何利用它們,並找出如何從中獲得最大收益的方法。順便提一下,企業與消費者之間的界限也將變得模糊,因為創業將變得比以往任何時候都更加容易。比如,我們現在已經看到了這種情況。甚至舉個例子,我的一位朋友描述說,他姐姐當時正形容一款她非常希望能有人開發出來的應用,她腦海裡已經有了這款應用具體想要實現的樣子。而他當時一邊聽著,一邊在 Codex 裡輸入程式碼,嗯哼,嗯哼,嗯哼,然後按下Enter。幾個小時後,他就向她展示了這款應用。她當時就說,等一下,這是什麼?這東西是從那兒來的?是誰開發的?他說,是你。我認為這非常了不起,你會意識到任何人都可以成為開發者,像 Codex 這樣的工具是面向所有人的。它不僅僅是為軟體工程師準備的。這就像是現在每個人都可以成為軟體工程師一樣。如果他們有願景,有這種主觀能動性,有想要實現的目標,那麼現在你擁有了可以實現這一切的神奇工具。而在消費者端,消費者這個詞涵蓋的範圍太廣了,這裡面包含了很多不同的東西。比如娛樂、各種自我表達的方式,還有解決目標問題。而我們在消費者領域真正專注於的一點,就是解決目標問題。比如我們堅信這項技術,你看智慧型手機,有 40 億人在使用它們。所有這些人應該都擁有一個個人 AI,一個能夠隨時線上、充分瞭解他們、掌握他們個人語境且值得信賴的個人 AGI;他們可以向其尋求建議,而且它對他們瞭解得如此透徹,以至於當你最喜歡的音樂家來到城裡時,它會自動主動地購買門票;也許它知道,我應該在操作前確認一下,又或者它知道,我必須去做這件事,而且我已經有了預先批准;擁有這樣一個瞭解你、能幫你實現任何目標、並幫你明確你目標是什麼的 AI,就是這種水平的體驗。你依然應該自己設定這些目標。它們應該是你的目標,你應該處於主導地位,但這正是我們想要創造的東西。而且我認為這不僅僅是 40 億人想要且需要的東西。我認為這將是 80 億人所需。我認為整個地球都將真正受益於並需要訪問個人 AI。因此,你可以從深度知識工作和代理系統的廣泛分發訪問這兩個維度來看待。我們希望建構這兩個方面,它們融為一體,因為歸根結底,它們是相同的技術。歸根結底,你需要一個位於雲端的 AI,它能獲取可信的資訊,能夠給出好的回答,並能代表你採取行動,無論是在建構工作還是個人生活中,或許你會有多個實例,但從根本上講,它是一個單一的技術系統。Shane Parrish: 你認為我們將來會在太空中建立資料中心嗎?Greg Brockman: 我認為我們會在任何地方建立資料中心。Shane Parrish: 你認為距離實現這一點還有多遠?Greg Brockman: 在太空中建立資料中心涉及許多技術難題。例如,我們今天建構的資料中心非常嬌貴。它們就像巨大的機器,內部包含著非常脆弱且昂貴的元件。過去我們遇到過很多問題,比如線纜繃得太緊,字面上就是線纜過緊,導致了訊號完整性問題,進而使電腦無法正常工作。因此,目前如何維護這些系統,往往需要人工去進行物理操作,未來很可能會轉向機器人作業。所以我認為,在考慮將資料中心部署到各種嚴苛環境時,解決這些技術問題將是至關重要的前提條件。雖然太空看起來是一項巨大的挑戰,但我認為我們對計算能力的需求如此之大,以至於必須考慮所有的選擇。安全性與監管:如何走向 AGIShane Parrish: 什麼是迭代部署?為什麼要採取這種方式?Greg Brockman: 迭代部署是 OpenAI 實現技術惠及大眾並達成使命的核心支柱之一。雖然我可能是最先明確提出這兩個詞的人,但這種精神確實是在我們構思首個產品部署,並深入思考它與我們的目標有何關聯時自然形成的。你會意識到,在考慮建構能夠惠及人類的 AGI 時,可以採取兩條不同的路徑。Shane Parrish: 你是怎麼做到的?Greg Brockman: 一種方式是選擇秘密地進行開發。你不部署任何東西,你有大量的時間去打磨它、確保它完美,然後在某個時刻你按下按鈕宣佈部署。我記得當時在想,我能採用那種策略嗎?我能為那種策略負責嗎?你願意坐在房間裡思考:我們已經完成了所有測試,我們準備好部署了嗎?而且你之前從未部署過任何東西。那是你與現實的第一次接觸。而且這是一個將真正改變世界的強大系統。這是一個非常棘手的設定。但反過來,如果採用一種將此視為你第 100 個系統的方法會怎樣?在此之前,你已經不得不通過能力日益強大的系統來解決過 99 次這類問題。而世界也已經有機會適應它們,並圍繞它們進行重構。我們很早就從 GPT-3 中吸取了教訓。我們非常具體地看到了部署一個系統是什麼樣的——我們花了很多時間去思考 GPT-3 的所有濫用可能,以及它可能出錯的方式。我們考慮了虛假資訊。我們考慮了諸如此類的宏大圖景。Shane Parrish: GPT-3 最主要的濫用是什麼?Greg Brockman: 是醫療垃圾資訊,比如向人們推銷各種藥物,這並不是我們曾經認為會成為問題的事情,但當我們親眼目睹時,我們就有機會做出反應並從中學習。因此,迭代部署的理念是我們將引入該技術的中間版本。當然,這並不是盲目部署的藉口,你仍然需要在每一步都充分考慮我們對於所有可能被濫用的方式的最佳預判。Shane Parrish: 有那些負面影響?Greg Brockman: 有那些風險?讓我們去緩解這些風險。但你能夠觀察到它。你可以驗證自己的判斷是否正確,從現實中學習,並在下一次做得更好。Shane Parrish: 我認為人們沒有意識到這在多大程度上是全新的事物。沒有任何現成的行動指南。就像你一樣,我們也是在邊做邊摸索,而且這還是世界上部署速度最快的技術,大概沒有之一。這太強大了。Greg Brockman: 在 OpenAI 歷史上的不同階段,我們確實曾懷抱希望,認為總會有那些曾經部署過變革性技術的人。也許他們能告訴我們答案。但事情從來沒有那麼簡單。他們的確擁有智慧和見解。而且我認為我們確實已經汲取了這些智慧。但我們意識到,我們才是最瞭解這項技術的人。正因為我們創造了它,所以我們對如何塑造它有著深刻的理解。對於那些不夠深入瞭解這項技術的人來說,要對此發表意見或提出建議是很難的。我認為我的一個觀察是,正確的選擇極其依賴於具體的技術事實。或者說,手機、大型電腦、AI 以及電力等不同技術所施加的壓力各不相同。每一項技術都有其獨特的傾向性和問題。這些都是它們被開發的方式。參與其中的個體也很重要,不同人類之間的互動及其人為因素,對 AI 當今在我們眼前的發展方式產生了巨大的影響。我認為,從 OpenAI 創立之初,甚至在此之前,我們花了很多時間在做的事情,其實就是夢想。我們花了很多時間去認真思考我們所做之事可能帶來的所有影響。我認為我觀察到的一點是,對於沿途出現的一些關鍵時刻,我們並沒有真正感到驚訝。但我們對它們到來的時間、實現的難度,以及我們所觀察到的具體先後順序感到驚訝。我認為我們正在邁向的世界,在許多方面都比我們預想的更加美妙且令人驚嘆。Shane Parrish: 如果一個前沿模型將安全性視為首要考慮因素,而另一個前沿模型則不然,您如何看待這種競爭隨時間推移的演變?Greg Brockman: 我認為我們已經發現,安全性實際上是一項核心產品功能。畢竟,沒有人會想要一個與自己意圖不一致的模型,你想要的是一個值得信賴的模型,無論在什麼情況下,它都能做出正確的反應。因此,我們進行了投入。我想我們實際上在安全性方面的投入,可能遠超人們的認知,甚至可能超過了任何其他實驗室,我們在 ChatGPT 上擁有全球最廣泛的 AI 部署,這些語言模型被最多的人所使用。我們必須重視這一點。我們一直都很重視。但當你看到我們能夠將這項技術帶給如此多的人時,你確實會有所感觸。所以我認為,如果建構這項技術並擁有成功產品的人不全力投入安全保障,那麼這種狀態是無法持續的。我認為真正的挑戰在於如果你退後一步審視,因為交付安全性的某些方面並不一定只關乎短期。你不僅要為你的企業著想,還要為你所創造的事物進行長遠思考。其中一部分涉及如何訓練模型。另一部分則涉及如何建立反饋循環。但我只想說,我們致力於將安全作為使命的一部分,我認為這一點已經在我們的產品和現實世界中得到了體現。人們還忽略了一點,那就是這不僅僅關乎模型的安全性。這還關乎社會的韌性。如果你審視變革性技術是如何進入世界的,就會發現社會是圍繞這些技術的優勢和風險進行自我建構的。你會考慮引擎,你製造汽車,但同時也需要安全帶。你還需要修建道路,並重新規劃城市。圍繞著這項技術運作方式的事實來展開。你會考慮電力。你會有各種安全標準。你會有關於允許安裝電線杆位置的不同規定,還有高壓線以及所有這些設施。我認為 AI 也是如此。這不僅僅關乎技術本身。這不僅僅關乎模型本身。這實際上關乎他們如何融入到一個具有韌性的社會中。這也是我們正在大力投入的領域。OpenAI Foundation 將此作為其核心重點之一,旨在幫助社會投資並建構針對 AI 的韌性層。Shane Parrish: 你認為 AI 的監管應該是什麼樣的?Greg Brockman: 我認為 AI 監管需要實現的目標涵蓋了多個不同的方面。首先,我認為至關重要的一點是,我們最終必須確保這項技術造福於人類。當你思考諸如此類的問題時,情況已經非常明確了。即人們曾經認為穩定的機構、工作崗位乃至生活軌跡,這些前提假設可能不再適用了。因此,我們需要確保提供支援,並確保在技術推廣的過程中,我們都能彼此扶持。那麼,從監管的角度來看,這意味著什麼呢?我認為有很多想法,比如是否應該讓每個人都能獲得計算資源。我們要如何確保這一點屬實呢?我們要如何確保隨著這項技術開始產生更多經濟價值時,這些價值不會僅僅聚集在某一個地方,應該有一些切實能讓每個人都受益的事物。這項技術不應僅僅是抽象地造福經濟。它顯然會做到這一點。它應該直接成為人們在日常生活中能感受到的東西,讓他們覺得因為這項技術的存在、因為他們在通過使用它來完成更多成就,他們的生活變得更好了。我認為我所看到的這些發展方式,將其建立在我們真正所見的事實基礎上是非常重要的。例如,很多人表示他們或其摯愛的生命因使用 ChatGPT 而得救,這是一個很好的例子。你意識到這正是應該得到支援和保護的事情。因此,通過監管來實現這一目標的一個好例子,就是考慮隱私和特權問題。當你與醫生交談,或者與律師交談時。這些屬於享有特權的對話。你能夠放心地分享它們。對於醫療服務提供者何時必須將這些資訊提供給執法部門或向他人發出警示,法律是有明確約束機制的。這在法律中有明確的定義。目前,我們在 AI 領域還沒有類似的機制。但人們正在使用這些工具,而且他們應該使用這些工具,因為這些工具對於人們獲取原本無法獲得的資訊至關重要,同時他們也理應瞭解相應的保護措施。所以我認為,我們需要深入思考這些模型是如何融入人們生活的。我們如何在確保持續創新的同時,也確保其帶來的福祉能夠廣泛惠及大眾?我們該如何確保美國保持領先地位,比如在機器人技術方面,我認為我們目前並非處於領先地位。我認為對於 AI,我們必須確保繼續保持我們目前所取得的卓越地位。你考慮像資料中心這類事物時,會發現人們顯然對諸如“它們是否推高了電價?”這類問題存在許多擔憂。我們有責任確保它們不會產生這種情況。我認為每一項需求都可以通過多種不同的機制來實現。有時是通過監管。有時是通過公司的承諾。而有時僅僅是通過讓人們瞭解事實。一個很好的例子是資料中心和水資源消耗。這是一個人們討論得很多的話題。但實際上,我們的資料中心用水量極少,不是嗎?那實際上是他們經常使用的一種錯誤資訊。Shane Parrish: 它的用量比一個家庭用的還要少,不是嗎?Greg Brockman: 確實是這樣。因為它是一個閉環系統。你基本上是把一個巨大的,你可以把它想像成一個游泳池的水填滿。然後你只是讓它在內部循環。所以這是一個固定且總量並不大的水體。但我認為人們真正需要理解的是原因。為什麼我們要建造這些東西?為什麼這樣做是值得的?對我有什麼好處?能夠賦予人們這種賦能,無論是幫助他們感受到自己現在可以成為創業者,可以建立業務,還是可以創造出某些東西。這些都是我們必須解決的問題。我們必須確保人們在日常生活中能真切地感受到這一點。終章:不確定性與人類的未來Shane Parrish: 當我告訴別人我要進行這次採訪時,一種普遍的反應是他們對自己的工作和不確定性感到擔憂。你會對他們說什麼?Greg Brockman: 我確實認為這項技術充滿了不確定性。關於它究竟會如何演變。我認為它演變的方式也會令人驚訝。就像我們現在擁有的 AI 以及我們現在所處的世界,並非科幻小說所預見的那樣。這僅僅是不同而已。我認為,一些不可避免的結論在真正發生時,其實際樣貌往往與預期不盡相同。所以,我相信人們總是最容易看到自己失去了什麼,而變革即將來臨。這是不可避免的。事實絕對如此。但要在事發前預見你將獲得什麼,卻要困難得多。舉個例子,試想一下如果在 1950 年向某人描述 Uber 會是什麼樣。你必須考慮到電腦。你必須考慮到行動電話。你必須考慮到 GPS。而且,現在你還能在三分鐘內讓一輛車出現在你所在的位置。如果你思考一下這種用例背後的技術投入水平,這其實是非常瘋狂的。但它確實發生了。而且它不僅僅是發生在那一個用例中。它發生在成千上萬、數以百萬計的其他用例中。所以我認為,我對 AI 的看法是,它關乎賦能。它關乎人類的主觀能動性。這確實意味著,一些現有的機構、工作崗位以及類似的事物,原本我們認為可以依賴的東西,可能會變得不如我們想像中那麼穩定。因此,這將會對人們產生影響。但我們需要深入探討的問題是,你從中獲得了什麼,以及你如何從中受益?所以現在你可以成為一名建構者。你可以創造任何事物。任何你能想像到的事物都能成為現實。那麼,你想像到了什麼?你如何通過深入利用這項技術來培養那種能力?我觀察到的一點是,在這一技術的多個迭代周期中,那些似乎獲益最多的人,往往是之前就已經在應用該技術的人。因此,你越是磨煉這種能力,其核心就在於主觀能動性、願景和創意,因為現在嘗試這些創意的准入門檻比以往任何時候都要低。所以我認為將會創造出新的機遇。我認為世界確實需要思考,我們如何在這個充滿不確定性的時刻,以及在即將到來的任何變革中支援每一個人,因為未來的經濟將是計算驅動型經濟。它會變得不同,但我相信每個人都將有貢獻自己力量的空間。Shane Parrish: 如果現在身處高中、大學,或者剛剛步入職場,年輕人應該把投資重點放在那裡?你認為未來那些技能會變得更有價值?Greg Brockman: 我真的認為深入鑽研這項技術將是一項關鍵技能,真正理解如何從 AI 中獲得最大收益,因為我們都將邁向一個由我們擔任智能體管理者、甚至很快可能成為自主 AI 公司首席執行長的世界。或者試想一下,如果你擁有一個 10 萬人的公司規模的勞動力,全都聽命於你,為你效勞。全天候 24-7 運作,只要你有充足的 tokens 和算力來驅動它——我認為這再次強調了每個人都需要獲得算力,這對全世界來說是至關重要且必須解決的問題。因為到了那個階段,你可以將其指向任何問題。而人類想要解決的問題數量是無限的。所以我認為,人們越是深入研究這項技術,越能弄清楚如何利用即將到來的變革,如何以創新的方式組合這些技術,如何與自己的智能體互動以進行有效管理,並深入思考:我想要什麼?我的自我意識是什麼?我的目標是什麼?我希望在這個世界上看到什麼?實現這些目標的難度將比以往任何時候都要低。我認為那個世界,連同我們將獲得的收益,其發展前景幾乎是難以想像的。Shane Parrish: 這是對未來最積極的一種看法。你能想像到的最消極的情況是什麼?Greg Brockman: 關於科技發展至今的一個非常有趣的現像是,它實際上一直是關於我們如何扭曲自身以適應機器。試想一下,有多少人每天坐在那個盒子前不停敲打,患上腕管綜合徵,肩膀也變得佝僂,所有這些其實都不符合我們的自然生理狀態,那並不是我們被設計出來的初衷。而我們正邁向這樣一個世界:不再僅僅是你通過電腦進行工作,而是電腦實際上在為你完成工作。這是一件事物,它帶來了機遇。我認為它也帶來了風險。我認為我們需要設法降低這些風險。歸根結底,核心問題在於,如果你擁有的機器能夠幫助人們實現他們的目標——也就是在外界按你的意願行事——但有時人們的目標會相互衝突,你該如何解決這種衝突?你如何確定 AI 協助的邊界在那裡?我們真正試圖搞清楚的是,這項技術如何融入社會,以及如何確保其收益不僅流向一家公司或一小部分人,而是真正惠及所有人。我們需要提高底線,讓每個人都能享有高品質的生活和這項技術,並有能力利用它去實現目標。我認為,這相應地也會提升發展的上限。因此,我認為我們將進入一個每個人都擁有新機遇的世界。這不僅關乎社會安全網,更關乎如何確保每個人都能在發展處理程序中不掉隊。屆時,我們將能夠成就更多偉大的事業。比如,你可以思考一下醫療服務的普及問題。如果我們能把工作做好,我們就應該進入這樣一個世界:每個人都能獲得醫療服務,就像口袋裡隨時揣著一名醫生。這名醫生的水平超過當今任何醫療團隊,甚至是世界上最好的醫生。他們隨叫隨到,關心你的狀況,真正閱讀你的病歷,並且全天候思考如何有效改善你的健康狀況。這具有顛覆性,這種技術將如何與世界互動,這不會是免費得來的。我們已經目睹了它的初期階段。但我認為,僅在接下來的兩年裡,我們將看到的不僅是它作為一種向善的力量,我們還必須承認它可能出錯的所有方式以及它所帶來的風險,以便實現那些積極的成果。Shane Parrish: 我們總是以同一個問題結束每一期播客,那就是:對你而言,什麼是成功?Greg Brockman: 實現 OpenAI 的使命,即確保通用人工智慧造福全人類。非常感謝。Shane Parrish: 這太棒了。這是一次很棒的對話,夥計。謝謝。Greg Brockman: 我度過了一段愉快的時光。 (Web3天空之城)
OpenAI關閉Sora之後 | OpenAI總裁對話實錄
4月2日,OpenAI 聯合創始人兼總裁 Greg Brockman 接受海外播客Big Technology 的深度訪談。本次對話中, Greg Brockman 首次回應了OpenAI 為何在視訊生成風頭正勁時選擇關停Sora APP,在 AI 競爭進入白熱化的當下,OpenAI 轉向全速推進“超級應用”與“推理模型”的真實意圖以及戰略抉擇。此外介紹了超級應用的終端形態、揭秘了代號為“Spud”的新一代預訓練模型,詳細探討了Scaling Law 在推理側的演進以及算力經濟學等話題。Greg Brockman指出,公司正處於從能力展示向現實效能轉化的轉折點,核心邏輯已從“驗證技術可行性”轉向“獲取知識工作的深度反饋”。他透露,即使擁有全球頂尖的算力儲備,也無法同時支撐視訊生成(Sora)與核心推理(GPT)這兩個完全不同的技術樹分支,OpenAI 現階段選擇收縮 Sora 的商業化投入,是為了確保資源向具備更高協同效應、能解決物理與科學難題的推理路徑絕對對齊。關於 AGI的進度,Greg Brockman認為 AGI 已經完成了 70% 到 80%,並將在未來幾年內實現。他指出,AGI 的判斷標準不應是圖靈測試或感官上的智力構想,而應是“經濟模式全面轉型的時刻”,即 AI 能夠自主勝任幾乎所有電腦端的智力任務。針對超級應用,他指出,未來的超級應用是程式設計、瀏覽器與對話的合體,未來的 AI 不應讓人類去適應電腦的操作邏輯,而是由 Agent直接操控網頁並處理複雜背景資訊,人類則演變為管理成千上萬 Agent 艦隊的CEO,承擔最終的問責制。關於代號為“Spud”的全新預訓練基礎模型,他指出,預訓練的提升具有巨大的乘數效應,基礎能力的跨越能顯著降低後續強化學習與推理的成本。同時,他詳細闡述了即將發佈的自動化研究員路徑,該系統能接管研究科學家的端到端工作流,通過 AI 反哺 AI 研發實現技術騰飛。在算力經濟,他提出,算力不是“成本中心”,而是像僱傭銷售人員一樣的“收入中心”,算力的建設規模直接決定了企業收入的邊界。01放棄 Sora的戰略取捨OpenAI 目前在消費級市場已取得領先,但近期似乎在收縮Sora方面的投入,轉而集中精力開發結合商業和程式設計場景的“超級應用”。作為外界觀察者,我們很好奇這種資源轉移背後的真實考量是什麼?你們在優先順序排序上是如何權衡私人助手與生產力工具的?Greg Brockman: 我是這樣看的,我們一直處於開發深度學習技術的世界中,真正的目標是驗證這項技術能否產生我們預想中的正向影響,以及它能否被用來建構改變人們生活的應用程式。此前,我們一直有一支專門的力量在嘗試實際部署,無論是為了維持業務運轉,還是為了在技術真正成熟並實現我們創立公司時的願景之前,積累現實世界的應用經驗。我認為我們正處於一個轉折點,我們已經看到這項技術確實有效。我們正在超越單純的基準測試和能力展示,進入一個新的階段:為了進一步開發,我們需要將其投入現實世界,從知識工作和各種實際應用中獲取反饋。由於技術發展階段的變化,這是一個重大的戰略轉移。這並不代表我們正從消費者市場轉向 B2B,我們真正想表達的是,面對眾多的可能性,那些是最核心的應用?因為我們無法面面俱到,我們需要專注於那些在建構時能產生協同效應,並能提供深遠影響,從而提升每個人效率的功能。在我們的願景中,消費級應用涵蓋很多方面。它可以是私人助手,瞭解你、與你的目標一致並協助你達成人生目標,也可以是創意表達或娛樂工具。而在商業領域,核心其實是一件事:當你有一個困難的任務時,AI 能否利用所有的背景資訊去完成它?對我們來說,優先順序排序中排在最前面的是兩件事:一是私人助手,二是能幫你解決難題的 AI。即便以我們目前擁有的算力,甚至都不足以同時支撐這兩件事。如果我們繼續增加更多其他非常有用的 AI 應用場景,資源會更加捉襟見肘。這是對技術快速成熟及其巨大影響的預判,我們需要明確優先順序,挑選出最能造福世界的應用集。02Sora 與 GPT 屬於不同技術分支,必須放棄全面開花你曾用迪士尼的“米老鼠”模型來類比 OpenAI:以模型為核心衍生出視訊、助手和企業服務。現在 OpenAI 是否已經無法再維持這種“全面開花”的狀態,必須在不同產品方向間做出殘酷的取捨?此外,既然視訊生成的進步有目共睹,為什麼你們最終押注 GPT 推理模型,而不是在 Sora 這樣理解世界物理規律的“世界模型”領域繼續投入?Greg Brockman: 實際上我認為這個類比現在比以往任何時候都更貼切。但在技術層面必須理解的是,Sora 模型雖然非常出色,但它與核心推理模型 GPT 系列屬於不同的技術樹分支。它們的建構方式完全不同。在某種程度上,同時追求這兩個分支對我們目前的資源來說確實太難了。目前,我們依然在機器人領域繼續進行 Sora 的研究計畫,因為機器人顯然將是一個變革性的應用,儘管它仍處於研究階段。機器人技術還沒有像知識工作那樣成熟到可以大規模部署的程度。這是一種戰略選擇:在當前這一時刻,我們需要將主要精力放在 GPT 系列的開發上。這並不意味著我們只做文字或腦力工作。例如,雙向通訊、出色的語音互動介面,這些都能讓技術變得非常易用且實用。但這些並不屬於不同的技術分支,它們源自同一個模型,只是進行了不同的微調。如果你把戰線拉得太長,在算力有限且需求極大的世界裡,是很難維持兩個不同產品方向的。(關於為何押注推理)這個領域最大的問題是機會太多了。我們在 OpenAI 早期就觀察到,只要是能想像到的技術路徑幾乎都行得通。雖然工程難度和算力需求各不相同,但只要數學邏輯成立,都能產生不錯的結果。這證明了深度學習底層的力量,它能觸及問題的實質,讓 AI 真正理解生成資料的底層規則。這不只是關於資料本身,而是理解底層的運作過程並將其應用到新語境中。無論是世界模型、科學發現還是程式設計,都是如此。關於文字模型能走多遠、文字智能是否能真正構築世界觀,這些爭論曾非常激烈。我認為我們已經給出了明確答案:它將通向 AGI。我們已經看到了實現這一目標的清晰路徑,也看到了今年即將推出的更強大的模型。在內部,關於如何分配算力的決策確實越來越痛苦。我們的核心邏輯是聚焦順序和時機。目前,一些曾被視為夢想的應用已觸手及輕。例如,解決未解決的物理難題。最近一位物理學家將困擾他許久的問題交給了我們的模型,12 小時後就得到瞭解決方案。他說這是他第一次感覺到模型在思考,解決了一個人類可能永遠無法攻克的難題。當你看到這種潛力時,你必須傾注所有資源去加倍投入,因為這能為全人類釋放巨大的潛能。對我來說,這不僅是重要性的比較,更是關乎 OpenAI 的使命:將 AGI 帶給世界並讓每個人獲益。03未來的超級應用是程式設計、瀏覽器與對話的合體GoogleDeepMind 的 Demis Hassabis 曾認為圖像/視訊生成器最接近 AGI,因為它們需要理解物理世界。如果你放棄這個分支,是否會錯失關鍵機會?另外,你心目中那個整合了所有核心能力的“超級應用”到底是什麼樣的?它針對的是商業還是個人場景?Greg Brockman: 兩個回答。第一,絕對存在這種可能(錯失機會)。在任何領域,你都必須做出選擇和博弈。OpenAI 的起點正是基於我們所堅信的實現 AGI 的路徑,並為此全力以赴。隨機向量的總和為零,但如果你能對齊向量,你就能朝著一個方向突圍。第二點是,圖像生成在 ChatGPT 中非常受歡迎,我們會繼續優先投資。之所以能做到這一點,是因為我們的圖像生成並非基於擴散模型分支,而是基於 GPT 架構。雖然資料分佈不同,但底層核心技術是統一的。這就是 AGI 奇妙的地方:語音互動、圖像生成、文字、科學研究和程式設計,這些看起來迥異的應用,其實都可以在同一個技術框架內實現。我們正在努力實現技術上的最大統一,因為這項技術將驅動整個經濟體。雖然我們無法獨自完成所有事情,但我們會盡力做好核心部分。(關於超級應用形態)我心目中的超級應用將把程式設計、瀏覽器和 ChatGPT 結合在一起。我們要建構一個終端應用,讓你真正體驗到 AGI 的通用力量。現在的對話功能將演變成你的個人 AGI 助手,它瞭解你、與你目標一致且值得信賴,在數字世界中代表你。目前的 Codex 可能更像是一個面向軟體工程師的工具,但它正在進化為面向每個人的工具,讓任何人都能通過它指揮電腦完成任務。它不再僅僅關乎軟體,而是關乎如何使用電腦。比如我想設定筆記本的複雜選項,直接告訴 Codex,它就會幫我完成。這才是電腦該有的樣子:順應人類的習慣,而不是讓人類去適應電腦。想像一下,一個應用就能處理你對電腦的所有需求。它內建了瀏覽器功能,AI 能夠實際操作網頁,並讓你負責監督。無論是聊天、程式碼還是知識工作,所有的對話都將統一,AI 擁有記憶並深刻地瞭解你。但這只是冰山一角。更重要的是技術底層的統一。現在不再僅僅是模型本身的問題,而是框架的問題。模型如何獲取背景資訊、如何與世界連接、能採取什麼行動,以及互動的循環如何運作。這些環節我們原本有多個不同的實現,現在正在進行融合。最終我們會形成一個強大的 AI 層,通過非常輕量化的方式指向特定的應用。你可以為金融或法律領域建構外掛或介面,但通常情況下,你只需要這個功能極度廣泛的超級應用。(關於應用場景)兩者兼顧。這正是它的核心。就像你的筆記型電腦一樣,它既是生產力工具,也是生活工具。它是你的個人機器,為你提供了一個進入數字世界的介面。04競爭白熱化的當下,OpenAI 追趕並反超的機會在那?Anthropic 已經通過 Claude 建構了屬於自己的超級應用,並搶佔了先機。你認為 Anthropic 敏銳察覺到了那些你們此前忽略的痛點?在競爭白熱化的當下,OpenAI 追趕並反超的機會在那裡?Greg Brockman: 回看過去一年多,我們一直將程式設計視為核心領域。在各類高難度程式設計競賽中,我們的模型表現始終處於頂尖水平。但我們此前在應用落地的最後一公里上投入不足。儘管AI 非常聰明,能解決複雜的競賽題目,但它從未接觸過現實世界中雜亂的程式碼庫,真實環境遠不如競賽環境那樣純淨,這正是我們之前的短板。(關於追趕進度)但從去年年中開始,我們開始認真解決這個問題。專門的團隊在研究現實世界的複雜性,包括如何獲取訓練資料、建構訓練環境,讓 AI 體驗真實的軟體工程流程,應對各種異常幹擾。目前我們已經追趕了上來。在與競爭對手的直接對比中,使用者往往更傾向於我們的產品。這證明了擁有優秀模型的同時,不能只盯著競爭對手。如果只關注對手的位置,當你到達時,對方已經移動了。現在情況發生了逆轉,很多人在盯著我們的位置,而我們已經邁向了下一步。我非常看重公司內部的這種合力。以前我們將研究和部署視為獨立環節,現在我們實現了深度整合。目前的狀態讓我感到踏實。外界的評價往往毀譽參半,但我們始終保持著穩健的節奏。在模型生產的核心環節,我對路線圖和研究投入充滿信心。在產品側,全公司的能量正匯聚在一起,將成果交付給世界。05下一代模型揭秘自2022 年以來 OpenAI 雖是領導者但競爭已白熱化,公司內部是否已進入“戰時模式”並取消了無關副業?傳聞中已完成預訓練的 Spud 模型到底是什麼?它與 Sam Altman 所說的“幾周內面世的強大模型”有何關聯?相比GPT-4 剛發佈時公眾的遲鈍,你認為下一代模型是會讓某些行業產生巨變,還是那種每個人都能感受到的普遍提升?它能做到那些今天模型做不到的事?Greg Brockman: 對我個人而言,最令人警惕的時刻是ChatGPT 發佈後的節日派對,當時全公司都瀰漫著勝利的氣息。但我從未有過那種感覺,我始終認為我們是挑戰者。在這個領域,競爭對手都是擁有雄厚資本、人才和資料的巨頭。OpenAI 能夠參與競爭,很大程度上是因為我們從不自滿,始終保持危機感。看到市場中出現競爭對手,看到敘事方式發生轉變,讓團隊每個成員都意識到這一點,其實是非常健康的,我非常歡迎這種變化。(關於 Spud 模型及個人投入)這個名字很有意思,我不會證實或否認具體的名稱。但這不僅僅關乎某一個模型。我們的開發流程是先進行預訓練,產生新的基礎模型,以此作為後續改進的根基。這需要全公司巨大的協作投入。在過去 18 個月裡,我個人的大部分精力其實都花在了 GPU 基礎設施上,全力支援團隊在大規模訓練任務中擴展架構,這是支撐這一切的底層基石。隨後是強化學習過程。AI 會應用學到的知識,接著通過後訓練過程來打磨其行為和可用性。你可以將 Spud 理解為一個凝聚了過去兩年研究成果的全新預訓練基礎。使用者將感受到能力的提升。單一版本的發佈並不是終點,它只是我們持續進化過程中的一步。我們正建構一個不斷加速的進化引擎,Spud 只是其中的一個階段。(關於模型能力的提升)新模型將能解決更難的問題,處理細節也更細膩。它對指令和上下文的理解會深刻得多。當模型真正變得更聰明時,會更順應使用者的意圖。如果 AI 不理解問題,還需要使用者反覆解釋,那種體驗是很糟糕的。這種提升是定性的。以前你可能因為 AI 不夠聰明而放棄某些場景,但現在你會不假思索地去使用。這種提升是全方位的。我非常期待它能如何拉高能力的上限。我們已經看到了在物理學等領域的應用。未來,它將能解決更多開放性、長周期的問題。同時,它也能提高能力的底線,讓任何任務都變得更加高效。(關於使用者感知的差異)我覺得情況會類似(GPT-4 剛發佈時)。剛發佈時,一部分人會覺得它帶來了翻天覆地的變化。但在某些不以智能為瓶頸的應用場景中,這種提升可能就沒那麼明顯。隨著時間推移,這種變化會深入人心,因為它從根本上改變了使用者對系統的依賴程度。使用者與 AI 互動時的心理模型更新較慢。直到它完成了一些超出想像的事,使用者才會意識到它的潛力。比如在醫療領域,有人通過 AI 研究出了癌症的治療思路,並在醫生無能為力的情況下獲得了治療方案。這需要使用者對 AI 有信任基礎,才會投入精力去挖掘。未來,AI 在各個領域的輔助作用會變得更加顯而易見。這既是技術的進步,也是人類認知的追趕。06自動化研究員與技術“騰飛”OpenAI 預計在今年秋天發佈的“自動化研究員”具體是什麼?它如何實現技術“騰飛”並反哺 AI 的進化?你是否擔心這種勢不可擋的進化處理程序會失控?Greg Brockman: 我們正處於技術騰飛的早期階段。騰飛意味著隨著AI 沿著指數曲線進化,我們可以利用 AI 來反哺,讓 AI 變得更強,從而加速開發處理程序。這種騰飛也體現在現實影響力上。技術研發正在飛速積聚動力,晶片廠商投入了大量資源,經濟生態也在蓬勃發展。AI 正在從邊緣輔助變成經濟增長的主引擎。這不僅僅是 OpenAI 圍牆內的事,而是全球經濟在共同推動技術的進步。(關於自動化研究員細節)自動化研究員將承擔更多原本由人類處理的任務。我們可以讓它自主運行,但這並不意味著放任不管。我們依然會深度參與管理。就像指導初級研究員,放任不管可能會誤入歧途。資深研究員即使不親自動手,也可以通過提供反饋、審查結果和指明方向來發揮作用。這個系統將極大地加速我們生產模型和實現研究突破的速度,讓模型在現實世界中更加實用。簡單來說,它能夠接管研究科學家完整的端到端工作流程,並在電腦模擬環境(in silico)中完成。(關於進化速度與風險)我覺得機遇和風險並存。我們必須在追求技術紅利的同時,深刻思考風險中的防範。在技術層面,我們在安全和保障上投入了巨大精力,比如防禦提示注入。必須確保 AI 不會被惡意指令誤導。我們將人類容易受欺騙或忽略背景資訊的特點引入開發過程,確保 AI 與人類對齊。這需要綜合考慮社會和經濟等宏觀問題。我不僅在推動技術進步,也在思考如何確保其潛能轉化為積極的影響。07AGI 的進度條:完成了70% 到 80%黃仁勳認為AGI 已經基本實現,你認同嗎?OpenAI 內部對 AGI 的定義是否發生了演變?在你的視角裡,我們距離那個“無可爭議”的臨界點還有多遠?Greg Brockman: 每個人對AGI 的定義都不盡相同,肯定有很多人認為我們現狀已達成了 AGI。這雖然可以辯論,但有趣的是,當下的技術表現呈現出明顯的鋸齒狀。AI 在許多工上表現出絕對的超人水平,例如編寫程式碼,AI 能夠直接完成任務並顯著消除創作過程中的阻礙。然而,在一些人類看來非常基礎的任務上,AI 依然表現掙扎。因此,這取決於你如何劃定界限。在某種程度上,這更多是一種感官上的直覺判斷,而非硬性的客觀標準。OpenAI 在 2017 年曾對 AGI 下過內部定義,目前的成果早已遠遠超越了那個標準。但人們的目標也在不斷演進,正如曾經被視為終極標準的圖靈測試,當我們的模型通過測試時,大家反而覺得這雖然有趣,但還不足以定義 AGI。我確實認為我們正在接近大眾認知中的 AGI,但我不認為我們已經完全抵達終點,真正的科學進步仍有待突破。我將 AGI 視為經濟模式全面轉型的時刻,即你可以直接引入一個系統,讓它真正具備勝任幾乎任何人類工作的能力。目前我們尚未完全達到這一水平,只有到了那一刻,AGI 的實現才會成為無可爭議的事實。在最後這幾步中會發生什麼是一個有趣的問題,但我確信我們終將達到一個讓所有人產生共鳴的臨界點。回顧過去十年我與這項技術打交道的經驗,以前我們通過數學計算來預測 Scaling Law 及其前景,我雖然在理性上堅信不疑,但內心並沒有實感。直到 GPT-4 問世,我第一次真切地感受到了它的力量。那一刻我意識到,這不再僅僅是一個智力構想,而是真實的科學突破。如果你在五年前向我展示現在的系統,我會認為這就是我們追求的目標,但真實的體驗卻與我們曾經想像的完全不同。我們必須相應地調整自己的心理模型。(關於實現進度)我認為大約完成了 70% 到 80%,我們已經非常接近了。未來幾年內,我們顯然會擁有 AGI。雖然它的能力分佈可能依然不均,但它處理智力任務的下限將極大提升,幾乎任何在電腦上進行的操作,AI 都能勝任。我現在很難給出確切答案,因為這裡存在一種類似測不準原理的情況。從我個人的定義來看,我們已近在咫尺,只要再往前邁出一小步就絕對會實現。08AI 從錦上添花的邊緣工具躍升為重構工作流的核心引擎回顧2022 年底,是什麼讓模型實現了從 20% 到 80% 的任務覆蓋跳升?有使用者利用 Codex 輔助視訊編輯,它自動為 Adobe Premiere 建構了外掛、劃分章節並開始剪輯。這種非技術人員的自發應用,是否改變了你認為 Codex 僅限程式設計師使用的看法?Greg Brockman: 新模型的發佈讓AI 能處理的任務佔比從 20% 直接跳升至 80%。這是一個巨大的轉變,AI 從一個錦上添花的工具,變成了你必須圍繞其重新建構工作流的核心。我有一個沿用多年的測試提示詞:幫我建一個網站。當年我學程式設計時,花了好幾個月才做出來。2020 年或 2021 年時,AI 通常需要四小時並經過反覆提示才能搞定。但在 12 月那次,它一次性就完成了任務,而且質量非常出色。這很大程度上歸功於更優的基礎模型。OpenAI 在改進預訓練技術方面深耕已久,那一刻我們只是預先窺見了未來的變革。但這並非單點技術的突破,而是在創新的每一個維度上不斷推動的結果。這些模型的神奇之處在於,雖然你期望進步是線性的,但它有時表現為飛躍,有時又表現為連續的演進。它不是從 0 跳到 80,而是從 20 提升到 80。在後續的每一個小版本更新中,我們都看到了這種持續的改進。在 GPT-4 和 GPT-4.5 之間,我的一位負責硬核底層系統工程的同事發現,AI 從完全無法幫忙變成了得力助手。他給 AI 一份設計文件,AI 就能完成實現、加入指標和可觀測性、運行性能分析器(Profiler)並進行最佳化,直到產出完全符合預期的成果。這種進步通常是極其緩慢地積累,然後突然在某一刻爆發,而這一切在目前的技術進展中早有預兆。在一年甚至更短時間內,它將變得極其可靠。(關於 Adobe Premiere 外掛案例)關於你提到的那個視訊編輯案例,這正是我最想聽到的反饋。Codex 最初是為程式設計師設計的,對非技術人員來說門檻其實還很高。比如遇到報錯時,開發者知道怎麼修,但普通人會覺得莫名其妙。即便如此,我們依然看到很多從未程式設計過的人在用它建構網站、自動化辦公。最難的部分,也就是建構一個聰明且有能力的 AI,我們已經完成了。現在的任務是完成那個相對簡單的部分:消除准入門檻,讓它變得真正通用。(關於 Codex 普及)我之前一直關注 Codex,認為它是給程式設計師準備的。考慮到 OpenAI 內部很多都是為自己開發工具的工程師,這種慣性思維很自然。但隨著技術演進,我們意識到其底層技術的本質並非關於程式碼,而是關於解決問題。它關乎如何管理上下文、利用測試框架(Harnesses)以及思考 AI 應該如何深度整合到工作中。這意味著,那怕是寫程式碼,普通人也能上手,因為你現在管理的是一個能真正幹活的實體。只要你有願景和目標,描述出意圖,AI 就能幫上幫。這也引發了我的反思,為什麼只盯著寫程式碼呢?在 Excel 表格處理或幻燈片製作中,其實有大量機械化的技能。只要 AI 掌握了背景資訊,它現在的原生智能足以高水平地完成這些任務。只要我們降低門檻,Codex 就不再僅僅屬於程式設計師,而是屬於每一個人。09人類將任務委派給 Agent,但必須保持對核心細節的敏銳掌控與最終問責矽谷出現了Open Claw 現象,人們授權 AI 訪問桌面、郵件、日曆並由其代勞。OpenAI 招攬其創始人是否意味著你們的願景是讓 AI 深度管理生活?當你像首席執行長一樣指揮成千上萬個 Agent 艦隊為你工作時,這種新的模式是否會讓你覺得對問題的敏銳掌控正在消失?Greg Brockman: 這項技術的核心難點在於發掘它的用處、使用者的使用偏好、AI Agent 的願景以及它如何融入日常生活。我觀察了多代技術的發展,發現那些全身心投入、充滿好奇心和遠見的人,才真正擁有一種極具價值的新興技能。Open Claw 的創始人 Peter 就擁有非凡的眼光和創造力。這在某種程度上關乎特定技術,但更多時候是關於我們如何轉化這些能力,找到它們在人們生活中的位置。作為技術人員,我對此感到興奮。而作為一個致力於提供實用工具的人,這是我們正在加倍投入的方向。(關於能動性與掌控)我認為這有利有弊。我們需要做的是發揮這些工具的優勢並規避其弱點。它給人們提供了槓桿和能動性,讓你有願景就能指揮 Agent 艦隊去實現。但歸根結底,必須有一個負責方。如果你建網站時 Agent 辦砸了並影響了使用者,那不是 Agent 的錯,而是你的錯。為了用好這些工具,你必須意識到人的能動性和問責制是系統的核心,人如何使用 AI 是極其根本的問題。作為這些 AI Agent 的使用者,你不能推卸責任,不能當甩手掌櫃。(關於失去掌控的風險)對我來說,這兩者是緊密相連的。如果你作為 CEO 卻脫離了細節,對實際情況失去了敏銳的觸覺,那是不會有好結果的。我並非認為人類不瞭解現狀是好事。有些細節是可以信任的,比如你找建築承包商蓋房子,很多細節你確實不需要操心,因為你相信他們能處理好。但最終如果細節出了錯,你必須在乎並保持知情。這是一個微妙但重要的區別。你不能盲目地接受失去對實際情況的掌控。相反,我們需要深入其中,為了真正理解優勢和弱點而保持敏銳。當你從那些低等級的機械性事務中抽身時,應當是因為你已經通過建立信任,確認了系統能出色地完成任務。10未來 AI 將通過電腦操控能力實現跨領域的創造力大爆發模型在工具使用後的下一步進化方向是什麼?如果AI 能操控桌面,它能為普通人帶來什麼?既然模型已經如此強大,為什麼這種變革還沒有全面發生?另外,對於 Peter Thiel 提到的數學型人才面對 AI 衝擊更危險的觀點,你作為數學俱樂部成員是否感到擔心?Greg Brockman: 我們正身處一個機器能力和深度持續增長的世界。除了工具使用,我們現在還需要建構強大的配套設施。比如電腦使用能力,如果AI 能真正操控桌面,它就具備了人類能做的一切能力。同時,我們也得為機器進行針對性的建構,例如在企業環境中,憑證管理、審計追蹤和可觀測性如何實現。我們要建構大量技術,才能跟上核心模型本身的能力。整體發展方向包括極佳的語音互動介面,讓你能自然地與電腦交流。它理解你,執行需求,並給出建議。它能主動反饋工作進展,甚至能為你經營一家公司。我認為創業的民主化時代絕對正在到來。它會提醒你,這裡有些問題,有位客戶不太高興,他們想和真人溝通,你應該去跟進一下。這些都會變為現實。提高人類雄心的天花板,解決更具挑戰性的難題,也是這項技術的下一步。我們正處於這種趨勢的最前沿。未來一年,我們將看到人們利用這種能力實現大爆發。我最期待的是,就像當年 AlphaGo 的第 37 手一樣,那一招任何人類棋手都想不出來,它充滿了創造力並改變了人類對博弈的認知。這種現象將發生在科學、數學、物理、化學、材料學、生物學、醫療和藥物研發等每一個領域,甚至文學和詩歌。它將以我們現在無法想像的方式,釋放人類的創造力、認知和構思。(關於效能滯後)模型的潛在能力與其實際應用之間存在一種效能釋放滯後。我們對模型潛力的理解仍在不斷加深,即便技術不再進步,現有的存量技術也足以引發巨大的經濟變革。由算力驅動的經濟模式終將到來。目前我們非常擅長在可衡量的任務上訓練模型,比如數學題和程式設計題,這些都有完美的校驗器。要把這種能力引入更開放的問題,關鍵在於擴大可評分的範圍。AI 本身就能幫上忙,如果你給它一個評分準則,它就能評估任務完成的好壞。當然,像創意寫作這類事情,評分要難得多。目前我們教導 AI 學習這類事物的能力還較弱,但這一切都在改變,目標已經非常清晰。(關於數學與人文)人總是更容易看到失去了什麼,而很難看到得到了什麼。我們對自己熟悉的東西被 AI 取代有著深刻的危機感,但驅動人類進步的從來不是數學競賽本身。如果你看我們現在的工作方式,躲在盒子後面敲字其實並不自然。我們被捲入了這個數字世界,但這並非人類存在的真諦。做人的真諦在於當下、在於臨場感、在於人與人之間的連接。我們將看到,AI 將釋放出大量的時間,讓我們去增強人際連接,建立更深的情感紐帶。這才是讓我感到無比興奮的地方。11算力經濟邏輯與 Scaling Law 的乘數效應當重心轉向推理應用,是否還需要進行大規模訓練和購買輝達GPU?建設資料中心的數學邏輯是什麼?你們籌集 1100 億美元的邏輯如何回報投資者?面對 Dario Amodei 關於“基礎設施豪賭可能導致破產”的警告,你作何回應?Greg Brockman: 我認為這種觀點(預訓練已足夠)忽略了技術發展中非常關鍵的一點。模型生產鏈條的每一個環節都有乘數效應,因此必須改進所有環節。我們發現,只要改進了預訓練,後續的所有步驟都會變得簡單得多。這很好理解,因為預訓練出的模型學習速度更快。由於起步能力更強,模型在嘗試新想法和從錯誤中學習時的效率就更高,而且能通過Scaling Law 更有效地減少錯誤。過去我們認為只是在獨立訓練一個大腦系統,然後讓它越變越大,但現在的重大轉變是:你需要讓模型去嘗試、去理解現實世界中人們的使用方式,並將這些反饋整合回訓練中。但這並不意味著預訓練研究不再重要。另一個變化是,過去我們只關注原始的預訓練能力,而不太考慮推理效率。這是過去兩年的一個大變化,我們意識到需要一種平衡。基礎模型可以擁有各種優異屬性,但你必須保證它的推理效率,因為你需要進行強化學習,需要面向全球提供服務。這意味著你不一定非要追求極致的規模,因為你必須考慮下游的實際應用。你真正想要的是智能與成本的最佳平衡點,並同時最佳化這兩者。(關於輝達)絕對需要。原因有很多。首先,即便推理和訓練的比例在變,但除了將算力集中在單一問題上進行大規模訓練,目前還沒有其他路徑。我們投入到預訓練模型中的算力量只會持續上升。雖然部署端的規模會大幅增長,但當你進行超大規模預訓練時,依然需要極其密集的算力。此外,Nvidia 團隊非常出色,做了非常了不起的工作,我們之間的合作非常緊密。(關於預訓練上限)這就像在問,是不是等人類解決了眼前的所有問題,我們就可以止步不前了。我們的願景非常宏大,也許在過去 50 年裡人們有些退縮了。看看那些顯而易見的問題,比如我們能否實現全民醫療,而且不是等病了才治,而是真正的預防性醫療。不只是建議生活方式,而是如何在大病發生前檢測到潛在疾病。我認為更智能的模型能解決這些問題。也許達到某個水平後能解決這個問題,那時你會問,我還需要模型再聰明兩倍嗎?但還會有其他更難的問題需要更強的模型。(關於 1100 億籌資邏輯)邏輯很簡單,我們面臨的最大支出就是算力。但你可以把算力看作收入中心,而不是成本中心。這就像雇銷售,你想雇多少人?只要產品賣得出去,只要銷售模式可擴展,銷售人員越多,收入就越高。現實情況是,我們發現算力的建設速度永遠趕不上需求。自那以來每年都是如此。挑戰在於,購買算力需要提前 18 到 24 個月甚至更久鎖定訂單,這意味著你必須具備超前的預判。目前我們大部分收入來自消費者訂閱,這很重要。但新的機會顯然是知識工作。我們看到各大企業都意識到這項技術真實有效,為了保持競爭力,他們必須採用。無論是軟體工程師的自發使用,還是企業內部各種知識工作的滲透,付費意願和收入增長都非常明確。我們能看到一些外界看不到的趨勢,即這些模型改進的明確路徑。綜合來看,整個經濟的增長,其核心驅動力都將圍繞 AI 展開,取決於你利用 AI 的程度,以及支援運行的算力儲備。(關於企業端反超)企業端的增長非常迅速,而且企業端的定義也在演變,本質上是人們將其用於高效的知識型工作。在定價方面,以 Codex 為例,如果你有 OpenAI 帳號或 ChatGPT 訂閱就能使用。我認為未來的界限不會那麼死板,核心在於使用者擁有了一個通往數字世界的門戶,這才是收入的根本來源。(關於破產風險警告)我不認同(Dario 的觀點)。我們一直很清醒,也看到了未來的趨勢。今年大家就會發現,所有參與者都會面臨算力短缺。我們是最早預見到這一趨勢並提前佈局的。其他玩家可能去年底才反應過來,開始到處找算力,但那時已經沒貨了。發表評論很容易,但事實是大家都意識到這項技術是玩真的。軟體工程只是開端,我們目前的瓶頸完全在於算力不足。我們有更多的緩衝餘地。如果你擔心下行風險,這確實是個好問題。但在某種程度上,這不只是對某一家公司的豪賭,而是對整個行業的信心。關鍵在於,你是否相信這項技術能產生我們預見的巨大價值。看看軟體工程吧,如果你沒試過,你很難想像它的變革性。它徹底改變了寫程式碼的方式,而這種改變正在發生在所有領域。12公眾的AI偏見、能源轉型與個體的未來準備你平時怎麼使用AI Agent?為什麼 AI 在公眾中並不討喜?看空 AI 的人遠多於看好的。面對人們對失業、能源、環境污染和電費上漲的恐懼,你認為他們錯了嗎?以及給普通人的未來建議。Greg Brockman: 我用它為團隊開發內部工具,比如同步視訊進度和縮圖設計。我還用它整合YouTube 資料,根據縮圖預測視訊表現,這相當於為我定製了一個我原本絕不會花錢去買的軟體。這就是目前的有趣之處,雖然軟體可以大規模普及,但很多細節並不是為你量身定製的。而 AI 讓我們能以更自然的方式與軟體互動。這是關鍵。現在的電腦其實是把我們拉進了一個生硬的數字世界,你需要不停地刷手機、點按鈕。為什麼非要這樣?AI 的本質是讓機器更貼近人,實現個性化,理解你的意圖。流行文化裡那種能對話、能替你辦事的電腦正成為現實,這種奇妙的體驗必須親自嘗試才能理解,我們正處於一個非常特殊的時刻。(關於公眾偏見)我們需要向公眾展示 AI 到底能給他們帶來什麼好處,而不僅僅是宏觀經濟或生產總值的增長。我每天都聽到很多真實感人的案例。比如有一個家庭,孩子生病需要做核磁共振卻被保險公司拒絕,他們用 ChatGPT 研究症狀,找到了申訴理由並成功拿到了檢查機會,結果發現了腦腫瘤並救了孩子的命。這樣的故事還有很多,人們的生活正因為與 AI 合作而發生翻天覆地的改變。但這些故事沒有被廣泛傳播。相反,大量流行文化充斥著對 AI 的負面想像。但當人們真正開始使用它,他們會發現它的價值。我確實擔心我們還沒能讓大家理解,這股技術浪潮是為了改善生活和人類聯絡。這關係到未來的經濟和國家安全,關乎國家競爭力。在全球範圍內,不同地區對 AI 的應用方向和治理理念存在差異。我們必須確保這項技術能讓每個人受益。(關於能源與環境擔憂)關於資料中心確實存在誤讀。比如耗水,我們在 Abilene 的超級電腦,其用水量其實僅相當於一個普通家庭的一年用量,幾乎可以忽略不計。關於電費,我們承諾會承擔自己的用電成本,不推高民眾的負擔。作為行業成員,我們有責任回饋當地社區,創造稅收和就業。引入更多電力並不意味著更多污染。目前的電網中存在大量無法利用的擱置電力,且傳輸系統急需升級。由我們來承擔這些升級費用,而不是讓納稅人買單,這對社區是有利的。在北達科他州,因為資料中心的入駐和對公用事業的投資,當地居民的電費反而下降了。(關於未來建議)對那些害怕 AI 的人,最重要的一點是去試用這些工具。只有親身體驗,你才能理解它能為你做什麼。它能賦予從未建過網站的人建站的能力,能幫創業者處理繁瑣的後台流程,能幫你管理健康、賺錢省錢。人們往往更容易看到變動帶來的危機,而忽略了潛在的收益。核心是保持好奇心。從技術中獲益最多的人,往往是那些敢於在工作流中嘗試的人。要克服面對空白輸入框的迷茫,培養自己的主體性,把自己定位為管理者,去設定方向、委派任務並進行監督。這種管理技能在未來至關重要。我們開發 AI 是為了讓人類有更多時間做自己想做的事。所以,看清自己真正想要什麼,並利用 AI 去實現它,這就是最重要的事。 (數字開物)