Andrej Karpathy潑冷水:智能體爆發並非近在眼前,還需十年


Andrej Karpathy對OpenAI Operator的看法:Agent 是數位世界的“人形機器人”,還需要10年才會突破

人工智慧大神Andrej Karpathy剛剛發表了對OpenAI最新的發佈的代理的看法,他將OpenAI的Operator等項目比作數字世界的“人形機器人”,並預言未來十年將是智能體(Agent) 蓬勃發展的時代

Karpathy巧妙地將數位世界的智慧體與物理世界的人形機器人相提並論。他指出,Operator這類項目,正如人形機器人之於物理世界,都是一種通用的系統,能夠透過原本為人類設計的輸入/輸出介面(鍵盤滑鼠或人體),逐步執行任意通用的任務。這種共通性預示著一個漸進式的混合自主世界即將到來,在這個世界中,人類將成為低級自動化的“高級主管”,就像駕駛員監控自動駕駛系統一樣

Karpathy認為,數位世界的變革速度將遠超物理世界,原因在於「翻轉位元」的成本比「移動原子」低約1000倍。儘管如此,他承認物理世界的市場規模和機會似乎更為巨大。這暗示了數位智能體將率先崛起,並在未來深刻地影響物理世界的自動化處理程序

回顧OpenAI的早期發展,Karpathy透露他們曾嘗試過類似的概念,例如Universe和World of Bits項目,但當時的“時機不成熟”,因為大型語言模型(LLMs) 尚未發展成熟。即使在今天,他對智能體是否真正「準備就緒」仍然持保留態度。他指出了當前技術的侷限性,例如多模態資訊(影像、視訊、音訊) 的整合仍然處於初級階段,往往是作為「介面卡」生硬地附加在LLM之上。更重要的是,我們尚未真正探索「超長任務周期」的領域。例如,處理海量的視訊訊息,僅依靠將所有資料「塞入」上下文視窗(當前的主流範式) 並期望其有效運作,可能是不現實的。 Karpathy認為,在這個領域可能需要一到兩次「突破」才能實現真正的進展

儘管有挑戰,Karpathy對智能體的未來充滿信心。他注意到社交媒體上許多人預測2025年將是“智能體元年”,但他個人認為2025-2035年才是真正的“智能體十年”。他強調,要讓智能體真正發揮作用,還需要在各方面進行大量的努力。但他堅信,智能體「應該」能夠成功

Karpathy描繪了智能體從當前到未來的發展藍圖。如今,Operator已經能夠幫助使用者在DoorDash上訂餐或查詢酒店資訊,儘管有時效果「可能」還不夠理想。然而,在不久的將來,使用者將能夠建立由多個Operator組成的“組織”,用於執行更長期的、使用者自訂的任務,例如經營完整的公司。那時,人類將扮演類似執行長(CEO) 的角色,同時監控十幾個智能體,偶爾深入「第一線」解決問題。這樣的未來“將會非常有趣” (AI寒武紀)