Andrej Karpathy潑冷水：智能體爆發並非近在眼前，還需十年

2025/01/25

•

Andrej Karpathy對OpenAI Operator的看法：Agent 是數位世界的“人形機器人”，還需要10年才會突破

人工智慧大神Andrej Karpathy剛剛發表了對OpenAI最新的發佈的代理的看法，他將OpenAI的Operator等項目比作數字世界的“人形機器人”，並預言未來十年將是智能體(Agent) 蓬勃發展的時代

Karpathy巧妙地將數位世界的智慧體與物理世界的人形機器人相提並論。他指出，Operator這類項目，正如人形機器人之於物理世界，都是一種通用的系統，能夠透過原本為人類設計的輸入/輸出介面（鍵盤滑鼠或人體），逐步執行任意通用的任務。這種共通性預示著一個漸進式的混合自主世界即將到來，在這個世界中，人類將成為低級自動化的“高級主管”，就像駕駛員監控自動駕駛系統一樣

Karpathy認為，數位世界的變革速度將遠超物理世界，原因在於「翻轉位元」的成本比「移動原子」低約1000倍。儘管如此，他承認物理世界的市場規模和機會似乎更為巨大。這暗示了數位智能體將率先崛起，並在未來深刻地影響物理世界的自動化處理程序

回顧OpenAI的早期發展，Karpathy透露他們曾嘗試過類似的概念，例如Universe和World of Bits項目，但當時的“時機不成熟”，因為大型語言模型(LLMs) 尚未發展成熟。即使在今天，他對智能體是否真正「準備就緒」仍然持保留態度。他指出了當前技術的侷限性，例如多模態資訊(影像、視訊、音訊) 的整合仍然處於初級階段，往往是作為「介面卡」生硬地附加在LLM之上。更重要的是，我們尚未真正探索「超長任務周期」的領域。例如，處理海量的視訊訊息，僅依靠將所有資料「塞入」上下文視窗(當前的主流範式) 並期望其有效運作，可能是不現實的。 Karpathy認為，在這個領域可能需要一到兩次「突破」才能實現真正的進展

儘管有挑戰，Karpathy對智能體的未來充滿信心。他注意到社交媒體上許多人預測2025年將是“智能體元年”，但他個人認為2025-2035年才是真正的“智能體十年”。他強調，要讓智能體真正發揮作用，還需要在各方面進行大量的努力。但他堅信，智能體「應該」能夠成功

Karpathy描繪了智能體從當前到未來的發展藍圖。如今，Operator已經能夠幫助使用者在DoorDash上訂餐或查詢酒店資訊，儘管有時效果「可能」還不夠理想。然而，在不久的將來，使用者將能夠建立由多個Operator組成的“組織”，用於執行更長期的、使用者自訂的任務，例如經營完整的公司。那時，人類將扮演類似執行長(CEO) 的角色，同時監控十幾個智能體，偶爾深入「第一線」解決問題。這樣的未來“將會非常有趣” (AI寒武紀)