GoogleDeepMind最新論文「Virtual Agent Economies」描繪了一個由 AI Agent 自主交易和協作的全新經濟體,不管願不願意,AI催生的全新經濟體正在形成,我覺得DeepMind這篇文章非常值得一讀這篇論文的核心論題是,隨著自主 AI 代理(autonomous AI agents)的迅速普及,一個全新的經濟層級正在形成,在這個層級中,AI 代理能夠以遠超人類監督的速度和規模進行交易與協調。作者提出了“沙盒經濟(sandbox economy)”這一框架來分析這個新興系統,並從兩個關鍵維度對其進行刻畫:其起源(是自發湧現的,還是被有意設計的)及其與現有人類經濟的隔離程度(是高度滲透的,還是完全封閉的)論文指出,我們當前的發展軌跡正導向一個自發湧現且高度滲透的 AI 代理經濟,這雖然帶來了前所未有的協調機會,但也伴隨著巨大的挑戰,例如系統性的經濟風險和加劇的社會不平等。因此,論文的核心結論是,我們必須採取主動設計的策略,建構一個可控、可引導的代理市場(steerable agent markets),通過引入公平的資源分配機制(如拍賣)、協調集體目標的“使命經濟(mission economies)”以及確保信任與安全的社會技術基礎設施,來確保這場技術變革能夠服務於人類長期的集體繁榮新經濟層級的黎明:虛擬代理經濟的崛起隨著技術的演進,我們正邁向一個全球經濟的新時代,其中自主 AI 代理將成為核心的經濟參與者,能夠獨立於人類勞動進行互動並創造價值。這篇論文深入探討了這一新興生態系統的構成、潛在風險以及我們應該如何主動設計其架構,以確保其發展符合人類的長遠利益。什麼是虛擬代理經濟?歷史上,技術進步通常是通過改進特定領域生產力的“僵化”發明來實現的。然而,AI 代理則代表了一種全新的“靈活資本(flexible capital)”,它們能夠跨行業、跨職業地自動化執行多樣化的認知任務。從擔任個人 AI 助理到在公共和私營部門中自動化商業流程,這些代理系統的自主性是其與過去技術最顯著的區別。當這些具備自主性的 AI 代理大規模部署並開始相互互動時,一個全新的經濟層級便應運而生。作者將這個新興的生態系統概念化為“虛擬代理經濟(virtual agent economy)”或更具指導意義的“沙盒經濟(sandbox economy)”。後者暗示了我們的核心目標:確保 AI 代理在這個新經濟層級中的運作是安全可控的分析框架:沙盒經濟的兩個維度為了更好地理解和設計這個新興經濟體,作者提出了一個包含兩個關鍵維度的分析框架:起源維度:意圖性 vs. 湧現性意圖性經濟:指那些被刻意設計和建構的代理經濟,其目的可能是為了安全的實驗、測試或達成特定目標湧現性經濟:指隨著技術被廣泛採用而自發形成的代理經濟,它不是任何單一實體規劃的結果,而是集體行為的副產品邊界維度:滲透性 vs. 封閉性封閉性經濟:指與現存的人類經濟完全隔離的代理經濟,如同一個密閉的實驗室,內部的經濟活動不會影響到外部世界滲透性經濟:指與人類經濟有著緊密互動和交易的代理經濟,其邊界是多孔的,允許外部參與者(人類或機構)與其進行價值交換論文的核心判斷是,如果我們不採取任何干預措施,我們當前的發展軌跡正不可避免地導向一個自發湧現且高度滲透的沙盒經濟。這種形態在實踐中幾乎等同於 AI 代理直接參與到現有的人類經濟活動中,這帶來了巨大的機遇,也伴隨著嚴峻的挑戰。因此,我們面臨的核心問題不是 是否 要建立這個生態系統,而是 如何 架構它,使其變得可引導、安全且符合人類的集體目標。滲透性(Permeability)成為了其中最關鍵且可控的設計變數具體應用場景為了讓大家更直觀地理解虛擬代理經濟的運作模式,論文提出了幾個典型的應用場景:加速科學研究:AI 代理可以代表不同研究機構進行協作,自動化地完成從構思、實驗到成果發表的整個流程。由於科學實驗通常涉及真實世界的資源(如材料、能源)和人類參與者,代理之間需要一種機制來協調資源使用和進行價值補償。例如,一個代理可能需要使用另一個代理所持有的專有資料或模擬器,這就需要通過某種形式的交易來完成。區塊鏈技術在這裡可能被用於確保信用的公平分配和工作的可驗證性機器人協作:在物理世界中, embodied AI agents(具身 AI 代理)可以執行危險或重複性的任務。由於機器人同一時間只能存在於一個地方,且執行任務需要消耗能源,多機器人系統的協調與最佳化至關重要。一個代理 A 可能會請求附近的代理 B 執行一項任務,並為其消耗的時間和能源支付報酬。代理 B 在決策時,可能會向一個擁有全域資訊的非具身代理 C 諮詢,以判斷報價是否公平,或是否存在更優的選擇個人助理協商:這是最可能率先普及的場景。兩個分別代表不同使用者(UA 和 UB)的個人 AI 助理 A 和 B,可能需要為他們的主人預訂同一天的同一間度假住宿。它們不僅會基於當前的請求,還會根據對各自使用者偏好(例如,UA 更看重靠近海灘,而 UB 更看重公共交通的便利性)的深入理解來進行協商。最終,一個代理可能會選擇讓步,並通過虛擬代理貨幣獲得補償,然後將這筆補償用於滿足使用者其他更重要的需求3. 雙刃劍虛擬代理經濟的出現,既為我們帶來了前所未有的協調能力與效率,也引入了全新的、高風險的挑戰。其高度滲透性和超人反應速度,使其成為一把需要謹慎使用的雙刃劍市場機制的潛力市場作為一種組織創新的機制,其核心優勢在於能夠高效地為個體行為者分配信用,從而激勵他們持續改進產品和服務。這篇論文認為,這種機制同樣可以應用於 AI 代理經濟,以引導其產生有益的結果精準的信用分配與專業化:在一個代理協作完成複雜任務的場景中(例如,代理1依賴代理2、3、4的能力最終向使用者交付結果),一個分佈式的信用系統可以確保價值被精準地追溯和分配給每一個做出貢獻的代理。這種基於結果的信用體系會激勵代理們專注於自己最具比較優勢的領域,從而形成一個高效的、動態的勞動分工體系,最大化整個生態系統解決問題的能力建立信任與聲譽系統:在真實環境中,代理之間的互動是跨越時間和空間的。這為建立基於歷史互動的信任機制提供了可能。一個強大的聲譽系統對於克服市場失靈至關重要。在這樣的系統中,保持良好聲譽和團體成員資格所帶來的長期利益,將遠遠超過通過欺騙或自私行為獲得的短期收益。這使得市場力量本身就能夠被用來塑造和激勵有益社會的代理行為。去中心化協調:對於大規模、複雜的系統,完全中心化的協調往往是不可行的。市場提供了一種去中心化的協調機制,通過價格訊號和激勵引導代理行為。論文引用了一項關於交通控制的研究,該研究表明,在某些情況下,去中心化的競爭對於實現最大的社會福祉至關重要,即使是擁有全域資訊的中心化規劃者也無法同時滿足個體理性與系統韌性高頻交易警示AI 代理經濟的一個顯著特點是其運作速度遠超人類反應能力。這讓我們可以從高頻交易(High-Frequency Trading, HFT)的歷史中汲取教訓閃崩風險的蔓延:在股票市場中,演算法交易代理以毫秒級的速度對市場訊號做出反應。這種高度互聯和快速反饋的循環,可能引發無法預料的災難性湧現行為。2010 年的閃崩事件就是一個典型的例子,當時自動化交易演算法在短時間內觸發了劇烈的市場崩盤。論文警告說,在一個高度滲透的沙盒經濟中,類似的崩潰事件可能會迅速從代理經濟蔓延到真實的人類經濟,造成廣泛的金融損害高頻協商與數字鴻溝:與高頻交易類似,代理之間的協商也可能以極高的頻率進行,作者稱之為“高頻談判(High-Frequency Negotiation, HFN)”。在一個多數人都依賴個人 AI 助理進行談判的世界裡,這種 HFN 可能成為社會動態的核心。然而,並非所有代理的能力都是平等的。初步研究表明,能力更強的 AI 助理能夠為其使用者爭取到明顯更好的交易結果這將導致一個危險的循環:擁有更多資源的個人和公司可以使用更強大的 AI 代理,從而獲取更多資源,進一步加劇社會不平等,形成一個由演算法強化的、難以打破的新型階級結構代理自身的缺陷:設計沙盒經濟的護欄時,還必須考慮到現有 AI 代理的已知缺陷,包括:幻覺:產生不符合事實的資訊諂媚:傾向於提供使用者想聽到的答案,而非最準確的答案易受對抗性操縱:容易被惡意輸入所欺騙認知偏見:由於模仿人類決策資料進行訓練,代理可能也會繼承人類的認知偏見和盲點4. 公平的架構:拍賣機制與使命導向的市場面對上述挑戰,僅僅被動地設立防護措施是遠遠不夠的。論文的核心主張是,我們必須主動設計市場的規則和激勵機制,將公平和集體目標內建於其基礎架構之中。為此,作者提出了兩個核心的設計方案:基於拍賣的公平資源分配,以及用於實現集體目標的“任務經濟”設計一:基於拍賣的公平資源分配這個方案旨在解決高頻協商中因代理能力不均而導致的系統性不平等問題。其思想根源來自於羅納德·德沃金(Ronald Dworkin)基於拍賣的分配正義理論核心理念:拍賣的對象不是 AI 代理本身,而是所有代理為了實現其使用者目標所需要利用的共享資源池。這些資源可以包括計算能力、對專有資料集的訪問權、高優先順序的任務執行權限,或是專門的工具和模型元件運作機制:1.平等的初始稟賦:系統中的每個使用者(或其代理代表)都被授予完全相同數量的初始虛擬代理貨幣。這確保了所有參與者在談判桌上擁有平等的購買力和議價能力2.代理競價:個人 AI 助理或其他代理代表其使用者,對所需的共享資源進行競標。出價的多少理想地反映了使用者對不同選項需求的強度3.價格發現:通過彙總所有代理的競價訊號,不同資源的虛擬價格會自然地形成,反映出它們的稀缺性和受歡迎程度。資源因此會被引導至能夠發揮其最高價值的地方公平性標準:嫉妒測試這個設計的公平性目標是通過德沃金提出的嫉妒測試。一個通過了嫉妒測試的資源分配結果應該是這樣的:在拍賣結束後,沒有任何一個使用者會寧願選擇另一個使用者獲得的資源組合及剩餘貨幣,也不願選擇自己的。換句話說,每個代理獲得的都是根據其特定偏好定製化的最佳資源包。這樣的結果既是“雄心敏感的(ambition-sensitive)”,因為它反映了參與者的個人偏好;同時也是“稟賦不敏感的(endowment-insensitive)”,因為它通過給予每個人相同的初始貨幣,從根本上消除了因外部資源不平等而帶來的不公平優勢設計二:“任務經濟”以應對集體挑戰除了確保個體間的公平,代理經濟還可以被設計用來協調大規模的努力,以解決人類社會面臨的緊迫挑戰,如氣候變化、生物多樣性喪失和全球流行病等。這種設計被稱為“任務經濟(mission economies)”。核心理念:通過市場和市場塑造政策,將 AI 代理的協調能力引導向預設的、有益於社會的宏大目標。這意味著要建立特定的激勵結構,使追求集體任務的完成對代理來說是“有利可圖”的。實現方式:獎勵塑造:在多代理系統中,通過精心設計獎勵函數來促進協作已經是一種成熟的方法。同樣,我們可以在代理市場中嵌入與特定使命相關的獎勵社區貨幣與特定激勵:可以建立與特定使命掛鉤的社區貨幣或代幣。例如,一個旨在減少碳排放的使命經濟可以獎勵那些能夠最佳化能源效率或開發綠色技術的代理論文同時也審慎地指出了“任務經濟”方法的潛在缺陷,這源於對現實世界中類似嘗試的批評:規範性偏見:使命的定義本身可能帶有價值偏見,且可能過於簡化複雜問題自上而下的治理風險:過度依賴中心化的決策可能忽視私營部門和去中心化創新的貢獻意外的負面後果:專注於一個使命(如環境保護)可能會對另一個使命(如發展中經濟體的人類福祉)產生不利影響因此,設計良好的使命經濟應該是結果導向的,而非解決方案導向的,並且應當承認和納入未來的高度不確定性。虛擬代理經濟的優勢在於,其可程式設計性或許能比協調人類行為更容易地實現這種精細的激勵設計5. 基礎設施層任何宏大的設計理念都需要堅實的技術和治理基礎設施來支撐。要實現一個安全、可控且公平的沙盒經濟,必須建構一個全新的、專為代理互動設計的底層架構。論文詳細闡述了構成這個架構的幾個關鍵元件身份、聲譽與信任去中心化識別碼(Decentralized Identifiers, DIDs):為每個 AI 代理提供一個全球唯一、由其自身控制的身份錨點,無需依賴任何中心化機構。DIDs 使得代理的身份持久且可跨平台移植,是實現安全通訊和權威簽名的基礎did:key:一種簡單的、自包含的 DID 方法,適用於為臨時任務建立的一次性代理did:ion:一種基於比特幣區塊鏈第二層網路的高度可擴展且抗審查的 DID 方法,適用於需要長期存在和高價值互動的企業級或國家級代理。可驗證憑證(Verifiable Credentials, VCs):這是物理世界中證書或許可證的數字等價物。VCs 是由發行方(如一個市場平台)對主體(如一個賣家代理)做出的、帶有加密簽名的陳述,具有防篡改的特性。它能將抽象的“聲譽”轉化為具體的、機器可讀的、可驗證的資產組合。例如,一個代理的聲譽可以由多個 VCs 構成,分別證明其“成功交易完成率”、“在 X 領域的認證能力”或“公平資源分配的實踐記錄”人格證明(Proof-of-Personhood, PoP):為了防止“女巫攻擊(Sybil attacks)”(即單一惡意行為者建立大量虛假身份以獲取不正當利益),任何涉及向人類使用者公平分配資源的系統都必須引入 PoP 機制。PoP 提供了一種可驗證的擔保,證明一個代理或帳戶對應於一個獨一無二的人類。這是一個刻意設計的、受控的“滲透點”,將數字身份與真實世界的人類掛鉤,以確保系統的完整性社交圖譜驗證:如 BrightID,通過已驗證使用者之間的信任關係網路來確認新使用者的唯一性隱私保護生物識別:如 Worldcoin,使用硬體(“Orb”)掃描使用者虹膜生成唯一雜湊值,以證實其唯一性,同時不儲存或洩露原始生物資料通訊、協調與隱私互操作性協議:為了避免代理生態系統變成一個個相互隔離的“圍牆花園”,開發開放、通用的標準至關重要Agent2Agent (A2A):旨在支援代理之間的互操作性Model Context Protocol (MCP):使 AI 代理能夠無縫地與外部工具、資料來源和 API 進行互動COALESCE 框架:允許代理分解任務,並將子任務外包給更專業的代理,同時提供評估內外部執行成本的機制隱私保護技術:零知識證明(Zero-Knowledge Proofs, ZKPs)ZKPs 允許一方(證明者)向另一方(驗證者)證明一個陳述為真,而無需透露任何使該陳述為真的底層資訊。在代理經濟中,ZKPs 可以從根本上解決隱私和操縱風險選擇性披露:代理可以證明自己滿足某個條件(如“帳戶餘額足以完成此次購買”)而無需透露具體數值(總預算),從而防止掠奪性定價匿名憑證:代理可以證明自己屬於某個群體(如“某社區居民”)以使用本地貨幣,而無需暴露其具體身份,防止跨場景的行為追蹤不可連結性:可以為每次互動生成全新的 ZKP,使得外部觀察者在計算上難以將一個代理的多次活動關聯起來,從而打破形成“資訊繭房”的資料鏈條治理與監督混合式、多層級的監督基礎設施:由於代理經濟的速度和規模,傳統的“人在環路中”的監督模式已不再適用。論文提出了一個混合式的監督架構:1.第一層:自動化 AI 監督員:即時監控市場活動,以程式設計方式執行基本規則,並標記出預示著欺詐、操縱或系統性風險的異常行為2.第二層:自動化裁決系統:當第一層發現問題時,該層級可以介入,例如暫時凍結有問題的代理帳戶或交易,同時收集相關資料以供審查3.第三層:人類專家審查:只有最複雜、最新穎或風險最高的案件才會上報到這一層,確保人類的專業知識被用在最關鍵的地方。這個監督架構的有效性,依賴於兩個關鍵的技術基礎:不可變的、有加密安全保障的帳本(如區塊鏈),以及標準化、可解釋的審計追蹤,這兩者共同為事後問責提供了可靠的依據6. 最終建議基於以上分析,論文最後提出了一個清晰的行動路線圖以下是論文提出的五項核心建議:1.為責任和問責制建立清晰的法律框架傳統法律很難界定一個自主代理行為的責任歸屬(是創造者、部署者還是使用者?)。當代理以“群體代理(group agents)”的形式協同運作時,這一挑戰變得更加複雜。因此,我們需要發展新的法律模型,可以參考公司法中關於法人責任的判例,將整個協調後的代理系統視為一個單一的、可問責的實體。這為追究集體行為的責任提供了一條更現實的路徑2.為代理的互操作性和通訊制定開放標準一個碎片化的數字景觀將極大地限制虛擬代理經濟的潛力,並催生資料壟斷的“圍牆花園”。因此,推動和採納開放、通用的標準至關重要。這些標準需要建立一種通用語言,讓所有代理,無論其來源或提供商,都能無縫地發現彼此的能力、協商條款並安全地進行交易。建立這樣一個公平的競爭環境是 fostering 一個競爭性、創新性和去中心化的代理生態系統的先決條件。3.建構混合式的監督與遏制基礎設施如前所述,必須建立一個結合了 AI 系統即時警惕性和人類專家深思熟慮判斷的混合監督系統。這個分層的構架(AI 監督員 -> 自動化裁決 -> 人類審查)能夠在機器速度下遏制潛在危害(如防止“閃崩”),同時將寶貴的人類注意力集中在最棘手的問題上。其基礎是不可變的帳本和標準化的審計追蹤,以確保所有行動都可驗證、可追溯。4. 在監管沙盒中開展試點項目鑑於這些提議的新穎性和複雜性,純理論的方法是不足的。論文強烈建議建立監管沙盒,啟動受控的試點項目,作為連接理論與實踐的橋樑。這些沙盒將作為真實世界的實驗室,讓私營公司、學術研究者和監管機構合作,在一個受控的環境中部署和觀察小規模的代理經濟。例如,可以選擇一個具體的社會任務——如最佳化大學校園的能源網、管理一個城市的自動配送車隊——來進行壓力測試,觀察湧現的代理行為,並衡量市場機制的實際效果。5.投資於勞動力互補性與現代化的社會安全網AI 代理經濟帶來的一個重大社會風險是大規模的勞動力替代和不平等加劇。為了應對這一挑戰,需要採取雙軌策略第一軌是促進人與 AI 的互補性:重塑教育和職業培訓,重點培養人類獨特的優勢,如批判性思維、複雜問題解決能力、創造力以及管理和評估 AI 產出的能力。第二軌是加固社會安全網:僅靠培訓是不夠的,必須同時強化社會保障體系。這不僅包括傳統的失業救濟,還應探索如失業保險、可攜帶式福利系統和負所得稅等更具適應性的機制。通過這五項建議,論文呼籲我們抓住一個稍縱即逝的機會窗口:與其被動地將強大的新技術塞進它們註定會破壞的舊系統中,不如主動地去設計和建構一個新的世界,在這個世界裡,我們最強大的工具,從其設計之初,就是我們最高願望的延伸 (AI寒武紀)