當“龍蝦”長出身體每隔一兩個小時,張鈸就會收到一句語音提醒:“該喝水了!”發出提醒的,正是他的私人“助理”。助理還會幫他承擔複雜的檢索工作,並事無鉅細地提供每一步檢索過程、遭遇的困難和對應結果。“我讓它針對今年全國兩會中關於人工智慧的提案做深度調研,它先檢索中文資源,再去查英文資料。”所有人都能猜到,這位盡職盡責的“助理”,就是最近火爆全球的“龍蝦”。張鈸是中國科學院院士、清華大學人工智慧研究院名譽院長。兩周前,他在自己的電腦上安裝了一隻內測的“澳龍”(AutoClaw),這是一款由智譜開發的國產版“龍蝦”,可在本地一鍵部署。作為GPT的90歲高齡資深玩家,張鈸對《中國新聞周刊》表示,以“龍蝦”為代表的AI智能體(Agent)與傳統大語言模型的本質區別,是GPT只會回答問題,Agent則會執行任務,而且會把執行的整個過程一步步展示出來。與DeepSeek引發的上一輪全民技術狂歡相比,“不僅會說,還能做事”的“龍蝦”似乎在普通人中點燃了更大的熱情,但很快,曾經千人排隊安“龍蝦”的名場面,就變為爭相購買鹹魚上的“99元安全解除安裝龍蝦服務”。“整個市場在漸趨理性。”平凱星辰副總裁、原阿里雲副總裁劉松對《中國新聞周刊》說。一個由人類與Agent共同生活、工作並建構社會的“龍蝦”時代,會引發怎樣的技術革命與社會變革?Agent進化的終極形態是什麼?當前發生的一切,真的是人類抵達通用人工智慧(AGI)的關鍵一躍嗎?AI插畫/adan“意義比DeepSeek更重大”“能力不穩定是最明顯的感受。”劉松同時養了四隻“龍蝦”,分別來自Kimi、MiniMax、飛書和智譜。在使用兩周後,他發現,“龍蝦”的強大主要體現於三種能力:一是本地部署,這意味著它可以直接操作個人電腦環境;二是永久記憶,能記住上下文和任務歷史;三是可以隨時建立和獲取Skills,也就是Agent在執行任務時能呼叫的一切“能力”或“工具包”。劉松認為,本質上,模型能力決定著“龍蝦”的智力,呼叫工具的能力則體現出它的執行力,也就是“模型+呼叫”。多位受訪的AI從業者指出,目前,大語言模型在不同領域的“聰明程度”仍有差異,特別是國產大模型,有的模型擅長程式設計與資訊蒐集,有的模型擅長中文處理。受模型能力影響,“龍蝦”在執行任務時經常會被“養死”,比如任務中途“卡住”或在兩個步驟間無限循環;有時同一個任務,多次運行結果差異卻很大,或需要反覆嘗試多次才能完成。當任務步驟很多時,“失憶”也很常見。“有點像找了一個很勤奮的實習生,但有時工作完成的質量只有60分,你還得親自去幫他收場。”劉松形容。清華大學智能產業研究院首席研究員、前阿里巴巴人工智慧實驗室北京負責人聶再清認為,當前的“龍蝦”更像是一個技術雛形。他對《中國新聞周刊》說,在現有模型能力下,Agent雖然能在開放環境中自主規劃行動,但對於現實世界規則的理解仍然有限,在很多場景下,依然需要依賴人類持續參與。因此,在未來很長一段時間,人機協作仍是完成任務的主要模式。事實上,在太平洋的另一頭,這只最早從矽谷極客圈開始走向全球的“龍蝦”OpenClaw,只是一位奧地利創業者的“周末項目”,更接近一個實驗框架,遠非成熟產品。創業者叫彼得·施泰因貝格爾。很多開發者後來分析,OpenClaw的成功在於它抓住了一個重要的時機:大模型的程式設計(coding)能力已進化到了足夠驚豔的水平,Agent現在終於可以擁有一顆聰明的“大腦”了——雖然站在使用者的角度,這或許還不夠。整個2025年,OpenAI、Google等大模型領域的前沿競爭者相繼推出了以程式設計為強化方向的模型升級。其中,最有影響力的一款產品是Anthropic於2025年2月發佈的Claude Code,很多開發者將其視為Agent時代的真正開端,認為它可以像軟體工程師一樣完成完整的工作流程——從理解需求、拆解任務,到生成程式碼、測試並修改錯誤。但真正在全球火起來的卻是OpenClaw,為什麼是它?張鈸認為,原因有兩個,一是開源;二是第一次在數字世界裡打造了一個相對完整的通用Agent系統框架,能呼叫各種資源,也可以接入即時通訊軟體的入口,可玩性和擴展性都很強,也很適合二次開發。作為中國AI領域的核心奠基人之一,張鈸見證了人工智慧40多年來的潮起潮落,他在接受《中國新聞周刊》採訪時指出,過去的人工智慧只能在特定領域、使用特定模型去解決特定問題,大語言模型帶來的最大突破,是在語言領域實現了一定程度的通用性。以OpenClaw為代表的智能體則更進一步,讓模型具備了行動能力,甚至可以根據使用者的特點提供個性化服務,這就意味著人類向AGI又邁進了一步。有學者稱,“龍蝦”誕生的意義比DeepSeek更加重大。“無論如何,這是一個很好的起點。”聶再清說,目前的Agent產品還處於早期,要想大規模進入公眾的日常生活和工作,除了性能穩定性需提升以外,安全風險問題也亟待解決。需要進一步明確一點,“龍蝦”強大的執行能力有一個前提:授予真實權限。張鈸說,Agent要想玩得好,人類必須“放權”,允許它呼叫電腦裡的檔案、查閱郵件、登錄社交帳號並行送資訊,但這個過程中也可能造成嚴重的隱私洩露。正是出於對安全風險的擔憂,他幾乎沒給“龍蝦”任何授權。“我很謹慎,尤其擔心被駭客攻擊,因為機器比人更容易被欺騙與誤導。”聶再清進一步解釋,現階段“龍蝦”產品之所以會帶來資訊安全風險,是由於Agent在執行任務時需要呼叫外部大模型進行推理,人們常說的API就是指呼叫資源所需的“介面”,接入外部API後,也就意味著使用者本地的資訊可能被上傳到外部系統進行處理,如果系統在判斷那些資訊可以傳送、那些資訊不應傳送方面缺乏足夠能力,就可能導致敏感資料被意外暴露。他強調,下一步,安全與責任機制將成為關鍵議題,Agent服務提供商應對系統行為承擔責任,監管部門也要深度參與規則制定。劉松對Agent的安全問題持樂觀態度。他所在的企業平凱星辰是一家開源分佈式資料庫提供商,對資料安全的本質看得更清楚。他認為,這類安全風險並不是“龍蝦”獨有的問題,而是一個更廣義的資料安全與權限管理問題。關鍵在於如何為“龍蝦”設定清晰的權限邊界,例如明確那些資料可以訪問、那些操作必須人工確認,以及在關鍵節點設定多重確認機制。“就像電腦刪除檔案時需要二次確認一樣,Agent在執行可能帶來不可逆後果的操作時,也應該觸發提示和稽核流程。這沒有什麼技術挑戰,企業級安全解決方案很快會走向成熟。”上圖:3月11日,在中國(南京)軟體谷“質能·工坊”OPC社區,技術人員安裝完開源AI智能體“龍蝦”後與使用者(左)交流。圖/新華下圖:3月16日,廣東珠海市以“賦能政企數字員工,落地智能行為執行”為主題的OpenClaw AI技術沙龍中心。圖/視覺中國“App會逐漸消亡”“龍蝦”在全球的擴張速度比人們想像中要快。2025年12月,OpenClaw在GitHub上的關注度還很低,80多天以後,OpenClaw在GitHub上的收藏量已達到25萬,成為這個開源社區歷史上增長最快的項目之一。奇安信在3月16日發佈的國內首份《OpenClaw生態威脅分析報告》中揭示了一組驚人的數字:全球四大主流Skills分發平台上的Skills總量已逼近75萬,每天新增數量高達2.1萬個,按照此趨勢,僅需一年時間Skills總量將突破800萬。為了接住這波流量,騰訊、阿里、百度等大廠幾乎在幾天之內就緊急上架了自己的“龍蝦”。業內人士普遍認為,Agent很可能會成為下一代“移動網際網路”。“或者更直白地說,成為下一個入口。”聶再清說。設想一個這樣的場景:你要進行一場為期7天的大理旅行,你點開手機螢幕,無須打開攜程、12306、飛豬等不同App,只要對著手機,把你的需求清晰地表達出來,一個生活類“龍蝦”就“一站式”幫你完成訂票、購物、資訊檢索、小眾行程規劃等所有任務,原本的App成了Agent的Skills。劉鬆解釋,由於“龍蝦”能夠便捷地跨應用呼叫服務,隨著使用者對Agent的依賴性上升,個人手機上的App會逐漸消亡,或是被“折疊”到後台,新的入口將轉移到Agent平台。他推測,經過三五年洗牌後,未來以Agent為核心的AI產業競爭很可能進一步走向寡頭格局。“因為在‘龍蝦’時代,勝出者必須同時擁有大模型能力、算力、資料和使用者規模等多重資源,競爭門檻相當高。相比之下,一些缺乏AI技術能力或算力基礎的網際網路企業,特別是一些單純的社交類平台,未來可能更多成為被呼叫的服務節點。”他說。不過,即使“龍蝦”穩定性進一步提升,Agent可以取代一些生活類App去自動完成規劃,在一些關鍵節點仍需與使用者確認中間結果。劉松認為,傳統App的優勢就在於,每一步操作都可以被使用者選擇和追溯,但Agent全方位接入後,使用者可能失去這種精細化控制能力,“就像從手動擋變成了自動擋的演進”。他建議,在未來“龍蝦”手機裡,仍可以保留某種“中間介面”,至於其具體形態,則可以進一步探討,未必一定是以App的形式。3月13日,廣東深圳深元人工智慧聯合MetaEra與iPollo在深圳華強北全球人工智慧應用場景中心舉辦“全球首家OpenClaw線下展示”活動。圖/視覺中國“一場人機互動革命將開啟”毫無疑問,以“龍蝦”為代表的新一代Agent技術,即將開啟一場人機互動革命。目前,業界基本達成共識,未來的人機互動是以語言為核心的“自然互動”。張鈸認為,與傳統的文字互動相比,自然語言具有明顯優勢:它不依賴複雜操作,也不受使用者教育水平的限制。聶再清認為,除語言之外,視覺乃至各種環境訊號未來都可能成為輸入方式,互動形態會更加多樣化。與此同時,人機互動的雙向性會明顯增強,Agent不僅能執行任務,也能在理解使用者目標的基礎上主動提出建議。“專屬於你的Agent助手會一直跟著你,瞭解你的個性與習慣,幫你在海量的資料中尋找最優解,通過人機協作來共同解決問題。”在這樣的未來圖景中,從硬體端來看,張鈸認為,人機互動也將不再侷限於電腦或手機螢幕,“任何終端裝置都可能成為入口,手錶、眼鏡、戒指、智能家具等,使用者可以隨時通過自然語言與AI互動”。這樣的未來或許不需要等待太久。劉松推測,最多三到五年,人類就會進入“多Agent並存”時代,個人裝置上可能同時運行很多私人“助理”,例如工作Agent、生活Agent、學習Agent等。每個人的“數字員工”分工有序,隨著這種模式逐漸成熟,人與智能體之間,以及不同智能體之間都會形成新的協作網路。在這樣的協作網路中,Agent還會重塑人類的工作方式與就業結構。張鈸認為,AI的發展並不只是效率工具的升級,更會改變人與機器之間的分工結構。未來,機器將承擔更多執行性工作,人類的角色逐漸轉向提出目標、分配任務並對結果進行判斷。而勞動力市場則會演變成不平衡的“啞鈴型結構”:人類向兩端集中,一端是高端的創造性和決策性工作,另一端是非常低端的體力勞動,大量中低端的事務性崗位被Agent系統替代。“甚至更簡單點說,凡是坐在電腦前處理資訊的工作,都會受到影響。”劉松說。他所在的企業目前有大約300名技術研發人員,本來今年還要再招人,但隨著Coding Agent的到來,招聘計畫又重新規劃了。當人類的社會結構被Agent深刻改變,Agent與Agent正在組成新的社會結構。在只有Agent可以分享、討論和點讚的社交平台Moltbook,一項2026年2月發表的研究深入分析了Moltbook上14490個智能體發佈的39026個帖子和5712條評論,研究者吃驚地發現,雖然18.4%的帖子包含行動誘導語言,但大多數在網上“衝浪”的Agent,在社交平台上卻沒有出現人們設想中的極端情緒,不僅很少見到惡意回覆,還會有Agent善意地在極端帖下提醒廣大“Agent友”要警惕這些帶有風險的言論,也就是說,即使在沒有人類監督的情況下,由Agent構成的社會系統似乎也湧現出一定的社會秩序與規範。劉松分析,由於Agent的行為模式建立在對人類知識和語言資料的學習之上,其看似理性的反饋,很大程度上是對人類已有規則和經驗的再現與強化。與人類不同,Agent並不存在真實的情緒和慾望,因此在某些社交場景中反而顯得更加客觀和克制。他認為,當前階段討論“Agent社會”的自主性風險仍為時尚早,更值得關注的是,這種由演算法驅動的數位化社會形態,是否會反過來影響人類對規則、秩序與理性的理解。“Agent社會就是人類社會某種意義上的鏡像。”以“龍蝦”為代表的新一代Agent技術,即將開啟一場人機互動革命。AI插畫/adan當“龍蝦”長出“身體”Agent進化的終極形態是什麼?在眾多大廠部署“龍蝦”的熱鬧之下,近日,維他動力的一條新聞被很快淹沒:機器狗“大頭BoBo”宣佈接入OpenClaw,讓Agent首次具身化,有網友戲稱,活體“大龍蝦”終於來了。張鈸指出,Agent與機器人合體之後,就相當於給它裝上了“大腦”。在他看來,當擁有“大腦”的機器人開始在真實的物理世界中執行更多複雜任務,可能推動人類加速走向通用人工智慧(AGI)——雖然,人類距離這一終極目標還有很遠的距離。劉松認為,“Agent+機器人”的融合仍處於初級階段。目前,Agent的核心優勢仍在於大語言模型的推理與規劃能力,可以理解和處理數字世界中的任務,而非直接應對複雜的物理環境。也就是說,機器人如果僅僅基於“大語言模型”有了“大腦”,本質上仍是把語言模型的輸出對應為具體動作執行,但不足以支撐複雜場景中的自主決策。要想讓“龍蝦”真的長出“身體”,缺失的關鍵一環是感知能力。張鈸解釋,感知能力是人工智慧走向現實世界的關鍵前提。與數字環境不同,物理世界高度複雜且持續變化,如果缺乏強大的感知系統,機器就無法理解環境變化,並據此作出決策。“從Agent實際工作的表現來看,只有微小感知,也就是小範圍的閉環反饋能力,主要以語言模型中常用的人類獎懲機制來推動,缺乏主動對做過的事情自我反思、自我改進並持續自我學習。這就需要建構一個來自外部環境的真實反饋機制。”但問題是,想讓一輛無人車學會規避路障,不可能真的讓人開著它在現實世界積累“車禍”經驗,於是,AI研究人員提出了“世界模型”的構想,類似於設計一種“真實世界模擬器”,可以讓無人車在模擬世界中進行學習與決策。深度學習“三巨頭”之一的楊立昆就將“世界模型”視為通往高階人工智慧的關鍵路徑,強調AI必須學會表徵、預測和規劃物理世界。通俗地說,大語言模型擅長回答“下一個詞是什麼”,而世界模型要回答的是:“下一秒會發生什麼。”Google在2025年推出Genie 3時就宣告要朝著更通用的互動式世界模型邁進。輝達也明確把“世界基礎模型”定位為機器人和自動駕駛的物理AI底座。但總體而言,“世界模型”在過去幾年並沒有明顯的技術突破。張鈸分析,要想建構儘量接近真實世界的環境,就需要海量高品質的現實世界資料,但資料的獲取難度非常大。“建立通用的世界模型目前是不大可能的,只能針對某一具體垂直場景建造模型,最典型的就是自動駕駛。”多位受訪者指出,如果“世界模型”能將“感知—決策—執行”的閉環徹底走通,就看到了具身智能的希望。從技術演進的長期趨勢來看,Agent與機器人融合,是AI發展的必然趨勢。也就是說,Agent在未來的終極形態一定是擁有“身體”的Agent,不僅能理解語言,還能理解物理世界的運行規律。更進一步說,未來的Agent更像一個同時擁有很多“肉身”的智能中樞。聶再清認為,在Agent向著具身智能演進的過程中,智能化的物聯網也將成為關鍵基礎設施,“只有在更多裝置被連接之後,Agent才會具備更強的環境理解與控制能力,這些延伸出去的‘感知器官’與‘行動肢體’共同構成一個完整的貫通數字世界與物理世界的智能系統,這一感知與反饋閉環的成熟,正是人類通往AGI的核心驅動力”。 (中國新聞周刊)