達沃斯論壇,AI兩大巨頭罕見同台,開啟一場關於AGI未來重磅對話。Dario Amodei驚人預測:AI全面取代軟體工程師,最快只需6個月!同時,一半初級白領崗未來1-5年全部消失。
達沃斯這個全球大佬扎堆的地方,Anthropic和GoogleDeepMind CEO再次同框。
這一次,他們坐在一起聊的是一個讓人既興奮又發怵的話題——AGI降臨之後的第一天。
與去年巴黎那次不同,他們的預期裡都帶著點「真的快來了」的緊迫感。
半個小時爐邊對話中,Dario Amodei扔出了一枚震撼所有人的「核彈」——
AI端到端接管軟體工程師(SWEs)幾乎全部的工作,倒計時僅剩6-12個月了!
同時他還爆出,Anthropic內部工程師基本不手寫程式碼了,全由AI操刀,人類只負責審查和引導。
Dario Amodei和Demis Hassabis幾乎同時承認,通往AGI的路,已經看得越來越清楚了。
隨著模型參數規模不斷Scaling、多模態越來越強、智能體越來越自主——這些疊加在一起,AGI逼近僅剩時間問題。
以下是訪談的主要亮點,核心觀點全在這裡——
Dario Amodei:
Demis Hassabis:
關於AGI何時降臨,兩位大佬給出了各自的預測。
Dario Amodei不僅是激進,簡直就是「狂飆」。
即便站在2026年的門檻上,他依然篤定地押注:到2026年或2027年,必將誕生在眾多領域達到「諾獎級」水平的模型。
「我認為結果不會偏離太遠」。
他的底氣,源自一個正加速閉環的「循環」,一個設想的機制是——
AI自己寫程式碼 → AI自己搞研究 → 完全自我迭代的閉環。
Dario拋出了一個令AI圈震動的判斷:
一旦這個正反饋環真正跑順,研發速度會直接起飛,指數級衝刺。
相較於Dario的激進,Demis Hassabis的立場相對穩健,但幾乎也沒有後退。
他守住了去年的底線:本年代末(2030年前),將有50%的機率實現AGI——展現人類全部認知能力的AI。
為何比Dario保守?Hassabis指出了一個無法被程式碼輕易踰越的「物理屏障」。
過去一年,程式設計和數學領域發生了顯著的變化,但自然科學自動化進展完全是另一回事。
它需要真實世界的實驗驗證,恰恰這個環節,AI暫時還無法實現「閉環」。Hassabis表示,更難的部分在於科學創造力的層面。
GoogleDeepMind最終會創造出AGI,不過目前還缺少一兩個「關鍵拼圖」。
這裡,他提到了一個關鍵的變數——
自我進化閉環,能夠在沒有人類深度參與的情況下真正跑通。如果這個閉環真正形成,進展速度會遠超當前預期。
Dario舉了一個最直觀、也最令人背脊發涼的例證——
Anthropic內部工程師已經幾乎不自己寫程式碼了。
他們現在的角色,更像是產品經理或架構師。也就是,只負責提出需求、編輯模型生成的程式碼、把控整體架構。
在Dario看來,我們離模型「端到端」完成軟體工程師絕大部分、甚至全部工作,可能僅剩6-12個月。
這裡所說的「端到端」意味著什麼?
在英文語境中,SWEs(Software Engineers)不僅僅是寫程式碼的人,而「端到端」涵蓋了一個軟體產品的全生命周期:需求、設計、前端、後端、部署、測試等等……
如此看來,Anthropic已經率先實現的了軟體開發的AGI(畢竟他們的員工擁有一個無限額度的Claude)。
為了量化這種能力,我們來看一下SWE-Bench(軟體工程基準測試)。
這是一個評估模型在真實GitHub程式碼庫中定位問題、跨檔案修改、跑通測試並交付CI補丁能力的「實戰考場」。
在這些問題中,我們可以將難度細分為:
如果我們把SWE-Bench的難度對應到現實世界的科技大廠職級,情況更加觸目驚心:
簡單到中等任務(<1小時)相當於初級工程師水平(Junior/SDE1)。
相當於:GoogleL3、阿里P5-P6、字節1-1/1-2等級,工作0-3年經驗
困難任務(1-4小時)相當於中高級工程師水平(Senior/SDE2-SDE3)。
相當於:GoogleL4-L5、阿里P6-P7、字節2-1/2-2等級,工作3-7年經驗。
這些任務就不僅僅是單檔案修改,需要跨檔案修改,平均改動32.8行程式碼,涉及1.7個檔案。
而超難任務(>4小時)則資深/專家工程師水平(Staff+)。
相當於:GoogleL6+、阿里P7-P8、字節3-1等級及以上。
目前頂級AI模型想要解決這類問題也非常困難。
儘管目前頂級AI模型在面對這些「超難任務」時需要極其複雜的上下文理解和架構設計才能解決的問題——
AI還顯得有些力不從心。
但別忘了Dario那個令人感到驚訝的預判:6-12個月。
當「AI寫AI」的飛輪開始瘋狂轉動,從L3進化到L6,可能只需要幾次模型迭代的時間。
那道曾經被認為不可踰越的「專家級」護城河,正在以肉眼可見的速度乾涸。
當技術飛輪轉動時,被碾壓的是舊有的就業結構。
Dario曾預測未來1-5年內,一半初級白領工作將消失,主持人則表示,現有統計顯示,目前勞動力市場尚未明顯波動。
她反問道,這是否只是「勞動總量固定謬誤」,AI最終會創造更多新崗位?
Hassabis認為,短期內,確實會看到AI創造出新的崗位。舊工作消失,新工作湧現,且更有價值、更有意義。
而且,他深刻感受到,初級/入門級崗位、實習招聘都在放緩。
但Hassabis鼓勵年輕人,要極度熟練掌握當下AI工具。
即便是建構模型的人,也很難完全探索當下模型的「能力懸溢」(capability overhang),更不用說未來的了。
我認為這可能比傳統的實習更能讓你在專業領域中發揮作用,實現自我飛躍。
Demis Hassabis他強調,AGI真正到來後,一切進入未知領域。
Dario Amodei同樣沒有給出一絲安慰,依舊撕開了2026年殘酷的真相:未來1-5年內,一半初級白領工作消失。
1-2年內,我們可能擁有全方位超越人類的AI。
現在,他看到苗頭了——尤其在軟體和程式設計領域。Anthropic內部已經顯現:初級和中級崗位需求銳減,公司正在嚴肅思考如何人性化處理裁員和轉型。
他承認,歷史上有適應性,農業自動化後,80%農民轉為工廠工人,再轉為知識工作者。
但這一次真的不同,指數級增長複利太猛,人類社會的適應速度根本跟不上。
滯後效應可能讓就業衝擊來得晚一些,但一旦爆發,降壓到一切。
對於更長遠的未來,Hassabis拋出了關於「意義」的終極追問:
在一個後稀缺的世界裡,當工作不再是必須,人類將如何尋找存在的意義?
也許是探索星空,也許是藝術,也許是極限運動....但這將是比經濟分配更難解決的哲學問題。
過去的一年,AI競賽的「座次排位」發生了劇烈震盪。
一年前,行業曾因「DeepSeek時刻」而興奮,當時GoogleDeepMind似乎顯得有些落後。
面對質疑,Demis坦承這是「不平凡的一年」,但他自信地表示,DeepMind擁有最深厚的研究儲備,正在通過Gemini 3等模型重回榜首。
他們正把GoogleDeepMind當作「核心引擎室」,加速把前沿模型推向產品介面。
而站在另一邊的「獨立模型製造商」Dario,則展示了令人咋舌的增長曲線。
過去三年,Anthropic的收入經歷了指數級暴漲:
Dario表示,這聽起來很瘋狂,我們在試圖白手起家做一件與世界最大公司規模相當的事情。
他特別提到,Anthropic和GoogleDeepMind有一個共同點:兩者都由研究驅動,把解決重大科學問題作為北極星。
這種公司形態,才是未來勝出的關鍵。
對話的最後環節,主持人拋出如今AI模型飽受詬病的問題——欺騙、兩面派的能力。
Dario Amodei表示,從Anthropic成立第一天,團隊就深陷這個戰場,開創了「機制可解釋性」。
過去一年,他們記錄了更多不良行為,也在用可解釋性拚命修復。他堅定表示,風險是存在的,但也是可解的。
Demis Hassabis同樣堅信,這是「非常可解」的問題,只要給人類智慧足夠時間、專注和合作,我們就能過關。
QA環節中,一位來自太空資料中心公司的觀眾拋出了著名的「費米悖論」:
既然宇宙這麼大,為什麼我們還沒看到外星人?是不是因為所有高等文明都被自己的AI毀滅了?
Demis直接反駁道,如果是AI毀滅了外星文明,我們應該看到宇宙中到處飛舞著「回形針」或者巨大的戴森球結構,但我們什麼都沒看到。
他更傾向於認為,人類已經通過了「大過濾器」,未來依然掌握在人類自己手中。
當主持人Zanny詢問明年再見時會有什麼變化時,兩位巨頭的回答殊途同歸。
Dario和Hassabis觀點一致:最關鍵變數是「AI建AI」的閉環。
不僅如此,Hassabis還期待著自我進化之外的其他突破:世界模型、持續學習,以及機器人技術的爆發時刻。
也許全人類都該暗自希望Hassabis是對的,希望那條時間線能慢一點,好讓我們有喘息的機會去迎接那個徹底改變一切的「第二天」。
然而,Dario眼神中透出的焦慮,卻揭示了殘酷的真相:在通往AGI的賽道上,「減速」從來不是一個可選項。
達沃斯的這場對話,與其說是一場觀點的交鋒,不如說是一次同步的預警。
無論是Dario激進的2026,還是Hassabis穩健的2030,那個終點已經清晰可見。
AGI降臨的第一天,不再是科幻小說裡的模糊概念,而是矽谷大佬日曆上正被圈出的具體日期。 (新智元)