AI 大神 Andrej Karpathy 的 2025 年度總結:人工智慧的六大範式轉變
Andrej Karpathy 是誰?如果說 AI 領域有江湖,那他就是那種"掃地僧"等級的存在。他是 OpenAI 的創始成員之一,曾擔任特斯拉 AI 總監,史丹佛大學博士,CS231n(深度學習最著名課程之一)的建立者。當這樣的頂級專家發佈年度總結時,整個 AI 圈都會豎起耳朵仔細聆聽。
2025 年 12 月 19 日,Karpathy 在他的個人部落格上發佈了《2025 LLM 年度回顧》。在這篇文章中,他總結了 2025 年大語言模型(LLM)領域的六個"範式轉變"——這些不是普通的技術進步,而是真正改變遊戲規則的創新。
讓我們用最通俗的語言,深入淺出地理解這六大變革。
想像一下,過去訓練 AI 就像教小孩背課文:
這套方法從 2020-2022 年就定型了,一直很管用。但 2025 年出現了一個新階段:RLVR(可驗證獎勵強化學習)。
傳統方法的侷限:就像學生只會背標準答案,不會靈活思考。遇到新題型就傻眼了。
RLVR 的突破:不再喂標準答案,而是給 AI 大量有明確對錯的題目(比如數學題、程式設計題),讓 AI 自己摸索解題方法。結果神奇的事情發生了——AI 自發地學會了"推理":
這就像孩子自己琢磨出了"怎麼思考",而不是死記硬背解題步驟。
1. 訓練時間大幅增加:因為有客觀的對錯標準(不像人類打分那麼主觀),可以讓 AI 練習更久。2025 年,很多計算資源從預訓練轉移到了 RLVR,模型大小沒怎麼增加,但"練習思考"的時間大大延長。
2. 誕生了"思考時間"這個新維度:現在可以控制 AI 思考多久。給它更多時間,它就能推理得更深入。這就像考試時,簡單題 1 分鐘做完,難題可以思考 10 分鐘。
3. 里程碑事件:
Karpathy 提出了一個發人深省的觀點:
我們不是在"進化動物",而是在"召喚幽靈"
這話什麼意思?
人類和動物:
大語言模型:
想像一個場景:
這就是 2025 年 AI 的真實寫照——同時是天才博學者和認知障礙的小學生。
因為 RLVR 讓 AI 在"可驗證領域"瘋狂長尖刺:
Karpathy 坦言,他在 2025 年"對基準測試失去了信任"。為什麼?
因為幾乎所有基準測試都是"可驗證"的(有標準答案),所以:
這就像"應試教育"——考試分數很高,但實際能力參差不齊。
核心問題:有沒有可能 AI 把所有基準測試都考滿分,但仍然沒有實現 AGI(通用人工智慧)?答案是:完全可能。
Cursor 是 2025 年爆火的 AI 程式設計工具。但 Karpathy 關注的不是它有多火,而是它定義了一種全新的 LLM 應用模式。
傳統模式(如 ChatGPT):
Cursor 模式:
Karpathy 總結了 Cursor 式應用的四個要素:
2025 年業界爭論激烈的問題:
Karpathy 的觀點:
LLM 大廠培養的是"通用大學生",而 LLM 應用公司會把這些大學生組織成專業團隊,部署到具體行業
比如:
關鍵差異在於:私有資料、感測器、執行器和反饋循環
Claude Code(CC)是 Anthropic 推出的一個命令列工具,但它的意義遠不止於此。
OpenAI 的思路(Karpathy 認為走錯了):
把 AI Agent 部署在雲端
Anthropic 的思路(Karpathy 認為正確):
這不是技術架構的區別(雲端 vs 本地計算),而是互動範式的區別:
舊範式:AI 是你訪問的一個網站(像 Google)
新範式:AI 是住在你電腦裡的"小精靈/幽靈"
因為我們處在一個"能力參差不齊"的 AI 時代,讓 AI 直接接觸你的真實工作環境,比在雲端遠端操作效率高得多。
就像你雇了一個助手:
這個詞是 Karpathy 自己在 2025 年的一條推文中創造的,結果意外走紅。
傳統程式設計:
Vibe Coding:
案例1:Rust 分詞器
案例2:一次性應用
案例3:快速原型他 Vibe Coded 了很多項目:
1. 權力下放
這符合 Karpathy 之前寫的一篇文章觀點:LLM 是第一個讓普通人比專業人士受益更多的技術
2. 專業人士寫更多程式碼
3. 軟體的本質改變
"Vibe Coding 將改造整個軟體地貌,改變工作描述"
Google Gemini Nano Banana 是 Karpathy 眼中"2025 年最令人驚嘆、最具範式轉變意義的模型之一"。
Karpathy 提出了一個宏大的視角:
LLM 就像 1970-80 年代的電腦,我們會看到類似的創新演進:
LLM 的原生語言:文字
人類的偏好:視覺和空間資訊
第一代:純文字對話(命令列時代)
第二代:Markdown、emoji(給文字"化妝")
第三代:真正的"LLM GUI"
不只是"能生成圖片",而是:
就像 GUI 之於命令列的革命,LLM GUI 可能會徹底改變我們與 AI 互動的方式。
Karpathy 在文章最後給出了他的總體判斷:
這是"幽靈 vs 動物"那一節的核心觀點。我們得到了一種全新的智能形態,不能用人類智能的標準去衡量。
"我認為業界還沒有實現 AI 當前能力的 10% 潛力"
即使不考慮未來的進步,光是已有的能力,應用空間還大得很。
這麼多想法可以嘗試,這麼多方向可以探索,充滿機會。
在 Dwarkesh 播客中,Karpathy 提到了一個"表面上矛盾"的觀點:
我同時相信:
這不矛盾,因為:
Karpathy 用"Strap in"結尾——系好安全帶,精彩的旅程才剛開始。
Karpathy 不是投資人,不是媒體,而是真正在一線做技術的頂級專家。他的觀察是基於:
他直言對基準測試失去信任,批評 OpenAI 的一些技術選擇,這種坦誠在行業內很少見。
他不追逐短期熱點,而是關注"範式轉變"——那些真正改變遊戲規則的創新。
"幽靈 vs 動物"、"LLM GUI"這些概念,不只是技術觀察,而是對智能本質的哲學思考。
他自己在用 Vibe Coding 做項目,自己在體驗 Claude Code,這些不是紙上談兵,而是來自一線的真實感受。
Karpathy 在文章中提到了他寫的其他深度文章:
還有他的播客訪談:
讀完 Karpathy 的總結,最大的感受是:我們正處在一個激動人心但混沌不清的時代。
AI 既不是即將到來的"神",也不是被誇大的"泡沫",而是一種全新的、我們還在學習理解的智能形態。
2025 年的六大範式轉變告訴我們:
但更重要的是,旅程才剛剛開始。
正如 Karpathy 所說:Strap in(系好安全帶)。 (AI Daily Insights)