AGI的秘密已被破解?OpenAI前研究主管的驚人預言

6月17日紅杉資本Training Data的播客邀請到Bob McGrew深談。作為OpenAI前研究主管,McGrew曾與Ilya Sutskever、Anthropic創始人Dario Amodei等一起制定roadmap,見證了GPT-3的歷史性突破,深度參與了從GPT-3到GPT-4的技術演進,他是推動OpenAI從研究實驗室向商業巨頭轉型的關鍵人物,更是少數幾個真正理解當前AI技術全貌的內部人士。在訪談中,這位見證了AI發展史上最重要時刻的技術領袖,拋出了一個觀點:"如果你在2035年回頭看,會發現我們今天已經掌握了創造通用人工智慧(AGI)的所有基礎概念,我認為即使在2035年,我們也不會看到任何新的趨勢。"

  • “AGI所需的核心技術堆疊(預訓練、後訓練、推理)已經成熟,2035年前不會出現新的基礎範式”
  • “2025是推理之年”
  • “AIAgents將因算力成本趨零而實現低價化”
  • “機器人技術迎來拐點”

一、AGI技術堆疊的三駕馬車

McGrew描繪了一個完整的AGI技術堆疊,他稱之為"三駕馬車":預訓練、後訓練、推理。這三個環節構成了現代AI系統的完整開發流程,構成了通向AGI的完整路徑。

預訓練(pre-training):規模化的基礎

"預訓練仍然重要,但已經進入收益遞減期。"McGrew指出,模型的智能水平與投入的算力呈對數線性關係——每次智能的顯著提升都需要指數級的算力投入。一個巨大的訓練過程,需要消耗所有的資料中心,預訓練下一個模型時,需要新的資料中心,則需要更漫長的時間。

這解釋了為什麼各大AI公司都在瘋狂擴大訓練規模,但同時也預示著純粹的算力軍備競賽將逐漸失去意義

後訓練(post-training):性格塑造的藝術

預訓練和推理都有一個非常清晰的縮放定律(Scaling Law),你投入更多的計算,就能獲得更高的智能,而後訓練則不同,後訓練是關於模型個性的。"後訓練關於模型性格。"這個階段的重要性正在日益凸顯。

有趣的是,McGrew透露這項工作往往由產品經理等級的人員而非研究科學家來完成,說明AI開發正在從純技術驅動轉向產品和使用者體驗驅動。這是一個需要大量人類審美判斷和行為設計的過程

推理(reasoning):2025年的關鍵戰場

“思維鏈Chain-of-Thought(CoT)”是最近兩年最重要的突破。McGrew特別提到了GPT-4(o3)相比GPT-3.5(o1-preview)的關鍵差異:"o1-preview無法使用工具,而o3可以將外部工具納入思考鏈。"這種將推理與工具呼叫結合的能力,讓AI從"回答問題"進化為"解決問題"

McGrew對2025年有一個明確的預測:2025將是"推理之年"。他觀察到一個有趣的發展軌跡:從去年9月的o1-preview到今年的o3,推理能力的進步速度正在從"隔月升級"轉向"半年升級"。這种放緩並非技術停滯,而是說明推理技術正在走向成熟。更重要的是,推理技術正在從OpenAI擴散到整個行業。Google DeepMind、Anthropic等公司都在快速跟進,這將推動整個AI生態系統向更高層次的問題解決能力演進。

二、智能體(AI Agents)與經濟模式重構

McGrew預測了一個顛覆性的經濟趨勢:智能體的定價將趨向於算力成本的機會成本。這個看似技術性的判斷,實際上預示著整個服務經濟的重構。

傳統服務業的顛覆

想像一下,當AI律師的成本接近算力成本時,傳統律師服務會發生什麼?McGrew認為,那些主要依賴知識處理和標準化流程的職業將面臨根本性的價格重構。這不僅是效率的提升,更是商業模式的革命。

創業機會的新地圖

但McGrew也指出了希望所在:真正的創業機會集中在具有網路效應、需要人類深度互動的領域。企業級服務、個性化諮詢、複雜的多方協調——這些需要深度理解人類情感和社會關係的領域,仍然是人類的主場。

"應用公司需要網路效應、品牌價值、規模經濟來建構護城河。"McGrew強調,單純的技術能力不再是競爭壁壘,真正的價值在於如何將AI能力嵌入到具體的業務場景中

三、資料價值的範式轉移

McGrew揭示了一個令人震驚的趨勢:專有資料的優勢正在被AI的"無限耐心"所削弱

專有資料優勢的消解

他舉了一個生動的例子:特斯拉花費巨資收集的Autopilot駕駛資料,現在可以通過AI模擬大部分場景來復現。"AI可以通過公共資料加上無限的耐心和嘗試,復現很多我們認為需要專有資料才能獲得的價值。"

這個觀點顛覆了許多人對資料護城河的認知。那些花費巨資收集資料的公司可能會發現,他們的資料優勢正在被AI的生成和推理能力所消解。

新的稀缺資源

那麼什麼資料還有價值?McGrew指出了兩類真正稀缺的資料:

1. 個性化資料:如財務顧問對特定客戶的深度理解、醫生對患者的長期觀察記錄

2. 場景化流程知識:特定行業、特定企業的業務流程細節和最佳化經驗

這些資料的價值在於其不可複製性和高度個性化特徵

四、機器人技術的破局時刻

McGrew對機器人技術的突破有著獨特的洞察。他認為,大語言模型為機器人提供了自然語言任務介面降低了任務定義成本以及視覺編碼的技術突破,共同構成了機器人技術的關鍵驅動,推動機器人從單一任務向通用任務擴展。

從單一任務到通用任務

McGrew舉了一個對比鮮明的例子:過去OpenAI花費數年時間教機器人解決魔方這一個任務,而現在像Physical Intelligence這樣的公司只需要幾個月就能讓機器人學會洗衣服、摺疊紙箱、整理蛋托等多種任務。

這種飛躍的背後是技術堆疊的根本性變化:機器人不再需要為每個任務重新訓練,而是可以基於預訓練的大模型進行快速適應

商業化的時間窗口

"因為他們站在了現有前沿模型的肩膀上。"McGrew指出,這種技術復用大幅縮短了機器人應用的開發周期,從傳統的十年周期壓縮到數月。這意味著機器人技術正在從實驗室走向商業應用的臨界點。那些能夠快速將通用AI能力轉化為特定場景解決方案的公司,將在這一輪變革中佔得先機。

五、未來挑戰與應對

教育革命:孩子需要理解的三件事

作為三個孩子的父親,McGrew對AI時代的教育有著深刻的思考。他認為孩子們需要理解幾件核心的事情:

1. AI是工具,不是朋友:"他花很多時間與ChatGPT交流,但他知道這不是他的朋友,而是一個他可以交談的專家。"這種認知邊界對於健康的AI使用至關重要。

2. 學習的最佳時機:McGrew引用了教育學的一個重要原理:"當有人提出問題時,正是他們準備學習的時候。"AI的價值在於能夠在孩子產生好奇心的那一刻,提供即時、詳盡、個性化的解答。

3. 掌握的核心能力:“第一,學習和解決問題的過程,這就是數學、論文寫作和程式設計的價值所在。這有點像學習的過程。第二,對項目有想法,並且相信自己可以做到,並且有能力使用任何可用的工具來解決問題,所以,這就是自主權。”

只有具備了這些基礎能力,AI才能真正成為增強學習的工具。

管理哲學:以員工利益為導向

在談到如何管理這麼一群“天才型”團隊成員時,McGrew的核心原則是:"始終以員工的最佳利益為重"

OpenAI的人才留存策略

無論是項目分配、團隊首發,還是艱難的解僱決定,McGrew都主張從"對方的最優利益"出發。這種理念在OpenAI的人才留存上體現得尤為明顯——即使在激烈的人才爭奪戰中,這種以人為本的管理方式也能建立真正的忠誠度。

協作的藝術與挑戰

但McGrew也坦誠地承認,管理天才型員工是一個巨大的挑戰。"如何平衡天才型員工的自我意志與團隊目標",這個問題在AI公司中尤為突出。

他的解決方案是消除人為的職能隔閡。在組織架構上,他推崇將"研究者vs工程師"統一為"技術團隊成員"(Member of Technical Staff),促進跨職能協作。這種做法已經在OpenAI、Anthropic等領先的AI公司中成為標準。

McGrew的觀點無疑是大膽且具有爭議性的。如果他的判斷可靠,那我們可能比想像中更接近這個歷史性的時刻。McGrew自己也承認:"我有點希望我是錯的。"如果基礎性突破已經完成,那麼競爭的焦點將轉向工程實現、產品創新和商業應用AGI技術堆疊已進入精細化打磨階段,核心突破轉向推理能力最佳化與多模態融合。經濟價值將嚮應用層遷移,具備網路效應、個性化服務的企業更具生命力。機器人技術因語言介面革新迎來商業化拐點,而資料與算力的壟斷壁壘正在瓦解未來十年,AGI發展將圍繞現有範式的效率提升展開,而非基礎理論突破。如McGrew所言:"如果有什麼事情人類能做到,而你無法讓模型做到,那是你的問題。" (JER學家)