#智能體
OpenAI前高管預判AI模型大戰:中國正在全力贏下能源這場比賽
今年以來,OpenClaw“龍蝦熱”席捲全球,AI Agent (智能體)對token算力的消耗量之大,讓各界重新認識了中國模型的性價比。然而,AI對就業甚至對人類的衝擊也不斷引發焦慮,矽谷知名企業Meta、Block、甲骨文等的裁員浪潮滾滾來襲。究竟未來人類如何面對AI浪潮?AI Agent的趨勢將如何變化?中國模型在未來的世界模型競爭格局下有何優勢?Token出海的浪潮將如何演化?對此,我們獨家對話了OpenAI前高管、OpenAI原應用負責人(Head of Go-to-market)扎克(Zack Kass),目前他也是矽谷知名AI諮詢企業ZKAI的創始人。他早在2019年就預言了如今的Agent時代,並在去年正式發行《下一次文藝復興:AI和人類潛能的拓展》(The Next Renaissance: AI and the Expansion of Human Potential"?)。01 “龍蝦熱”凸顯中國模型優勢OpenRouter資料顯示,春節期間中國模型Token使用量全球第一,主要是因為開源部署熱潮,大家都在接入Kimi、MiniMax這些更便宜的模型,直接推高了中國模型的Token用量。也有觀點認為,中國擁有全球最大、最穩定的電網,AI產業可以依託更低的電力成本。對此,Zack持積極看法。原因在於,未來單位Token價格將會持續下降,但需求爆發式增長,導致晶片和電力嚴重不足。“我認為中國做得非常聰明,中國正在全力贏下能源這場比賽。”他表示,“如果你認同我的模型收益遞減理論——即模型質量提升到一定程度後,對大多數企業而言不再是關鍵差異點,這個時刻離我們並不遠。如果你相信這個理論,那就要問:真正的競爭格局是什麼?我認為在核聚變普及之前,核心是能源,其次是晶片,肯定是基礎設施。”在此背景下,他稱,中國正在走開源路線,試圖用優質、低價的AI產品去佔領全球市場,並且在基礎設施上全力衝刺。儘管國際先進模型的優勢毋庸置疑,尤其是在專業領域,但Zack重申了他始終相信“模型收益遞減理論”——對於絕大多數企業而言,模型質量到一定程度後,就不再是實質性的差異點,事實也確實如此。因此他並不認為未來只有最好的模型才能賺錢,相反,他稱:“模型本身就很難賺到大錢了,但應用層會更容易盈利。”不過,業內人士也對騰訊新聞《潛望》表示,還是希望國產模型少一些價格戰,否則在貶低國內勞動價值的同時,可能會換來跟商品類似的貿易壁壘。比較好的嘗試是,希望以後能搞延遲開源,比如在每一代模型訓練完成後,先設立為期 3-6 個月的預覽期,僅授權給選定的海外合作夥伴(如特定的雲服務商) 使用,並按使用量或牌照計費,只有當下代模型發佈時,才將上一代模型開源。02 AI Agent發展大超預期也正是因為這股“龍蝦熱”,AI Agent在今年徹底家喻戶曉。多年前,Zack就預言了智能體的爆發,但如今他也非常驚訝AI Agent進化得這麼快、質量這麼高。“坦白說,我給自己的預判打高分:我在2019年就預測2026年是Agent之年,現在的發展基本符合我的時間線。”但他稱,真正讓他意外的是,至今還沒有出現AI界的“車諾比”或“三里島事件”——比如一次匿名自主攻擊,讓大家分不清是惡意Agent所為,還是人類攻擊者造成的。現在公眾對AI的不信任,大多來自對潛在風險的想像,而不是已經發生的真實危害。他也提醒很多人:在變好之前,情況會變得更奇怪。關鍵問題在於,我們還不清楚多智能體行為的整合風險,我們需要多智能體環境,但還沒找到保護機制與實現路徑。Zack認為,未來會發生的是,大多數智能體工作流會先被個人使用,能對接這些智能體協議的企業會最具優勢,但也會出現一種巨大的不對稱:用Agent的人和不用Agent的人,差距會比當年用網際網路和不用網際網路的人更大。還需要一提的是,現在的網際網路是為人類視覺設計的(HTML),是一個線上大型商場,只適配人的眼睛,不適配機器。未來會出現第二層網際網路:面向機器的、基於TXT/XML的網際網路。能適配機器瀏覽的企業,無論B2B還是B2C,都會大幅跑贏同行。也正因如此,Zack也警告,企業會被去中介化—— 使用者不再需要訪問官網,智能體會直接完成決策與交易。我們會發現使用者真實的偏好到底是什麼。“因此我給所有消費品牌的警告是:確保你的客戶真的喜歡你,否則很快智能體會直接幫使用者 ‘最優下單’:又好又便宜,使用者甚至不用過問。這對零售行業會是巨大衝擊。”03 AI繁榮派vs末日派事實上,在AI開發過程中,一直有兩大陣營:繁榮派(AI boomers)和末日派(AI doomers),爭論不斷。前者認為,通用人工智慧(AGI)會帶來烏托邦,末日派則認為AGI會“殺”死所有人。當年,OpenAI內部正是因為這兩大意識形態的分歧,導致部分人員出走。Zack表示自己是“科技樂觀主義者”(techno-optimistic)。“無論好壞,我更傾向於往好的方向看。我對這個問題的核心框架是:人類提升普通人生活水平唯一穩定的路徑,就是技術。除此之外,沒有其他可持續的方式能為所有人創造更多價值。”隨著技術進步,政府更容易做到公平向善,更難走向極端。更何況,人類整體上是向善的,技術讓人類能做更多好事,當然也會讓少數人做更多壞事——高資源的作惡者會擁有更強控制力,低資源的作惡者破壞力也會變大。“但整體上,我們治癒疾病、發明新技術,讓一切變得更好、更快、更便宜。也正因如此,沒有充分的理由說明,全球經濟不會持續向好,人類生活的底線不會持續抬升。比如中國經濟奇蹟,90年代崛起的中產階級讓數億人擺脫貧困;印度2000年代的經濟奇蹟,也讓近十億人脫離貧困。這些都源於技術進步。”他稱。如果我們非要質疑這種趨勢,那麼就需要問——這個趨勢為什麼會停止?Zack認為,只有兩種邏輯能支撐“世界會變糟”的論調:我們不再發明新技術,陷入技術停滯;我們用發明的技術去做更壞的事。然而,就第一種論調而言,我們顯然不會減少技術創新,現在的技術是未來最“笨”的階段,只會持續變得更智能。就第二個論調來看,這也是末日派的主要論點,技術會催生很多有趣的可能,但也會伴隨可怕的下行風險,大致包括:財富與權力集中、高資源、低資源作惡者被賦能,以及AI出現價值對齊失敗的超級智能。但Zack認為最符合自然走向的情況是,短期中期會有下行壓力,但世界整體會變得更好,而當下感受到的危害,很大程度來自社會動盪,這不再是經濟問題,而是情感問題、精神問題。04 關注自動化帶來的情感代價Zack在去年發佈的新書中也提及了“身份錯位”(identity displacement)這個概念,即未來的核心問題不是經濟問題,而是精神問題。當前無法逃避的一個問題就是——AI造成的大規模失業怎麼辦?事實上,矽谷每天都在見證大量裁員,早年被稱為“養老院”的大廠也再難躺平。“我到現在還沒有明確答案,這次自動化浪潮太猛,完全出乎很多人意料。”Zack表示,他的新書開頭引用了宏觀經濟學之父,1930年凱恩斯寫過一篇論文叫《我們後代的經濟可能性》,裡面有一句話令人印象極深:“我必須放手暢想一個我註定無法親歷的未來:在那個未來,人類或許已經解決經濟問題,轉而面對更深刻的命題。”在他看來,大家總糾結“人類還會不會有工作”,答案大機率是“會”;但就算沒有工作,也意味著我們已經高度自動化,解決了大量生存問題。真正的問題是:在未來,人類必須把自我價值、身份認同和工作剝離開,人們還會幸福嗎?“我沒有完美答案,但我認為短期內,答案很明顯是‘不會’。所以我真正想聚焦的,是明確且現實的威脅——其中最大的,就是自動化帶來的情感代價。”之所以Zack強調“精神問題”,是因為自動化讓絕大多數人已經脫離絕對貧困,有飯吃、有衣穿、有房住。在前工業時代,人類活不過40歲;現在大多數人能活到70歲以上。我們開始思考全新的人生問題,這些問題同樣複雜。未來回頭看,我們這個時代依然充滿糟糕的處境:糟糕的飲食、車禍、暴力等,這些都不是經濟問題,而是精神與文化問題,這是我們下一步必須解決的。 (騰訊財經)
Token成為“吞金獸”,大廠算力漲瘋了
有沒有發現,這半年AI圈的畫風變得有點快?去年這個時候,大家還在為算力降價狂歡。阿里雲帶頭喊出“最高降幅60%”,騰訊雲、華為雲、百度雲齊刷刷跟上,那陣仗,簡直像雙十一大促。創業群裡天天有人曬帳單:“看,我這一百萬Token才花了幾毛錢!”那會兒人人都覺得,AI創業的春天來了,算力跟白菜一樣便宜,誰還做不起大模型應用啊?結果呢?打臉來得太快。就上個月,風向一百八十度大轉彎。Google、亞馬遜、騰訊、阿里、百度,10天之內全發了漲價公告。漲多少?普遍30%到50%。最狠的是騰訊雲,有個核心產品直接漲了400%。從“跳樓大甩賣”到“坐火箭式漲價”,前後不到一年。到底發生了什麼?誰在背後推著價格往上走?更重要的是,這波漲價潮裡,誰最慘,誰在偷笑?去年還在“打骨折”,今年為什麼集體漲價?先簡單回顧一下這出“反轉大戲”。2025年4月,阿里雲率先扔出一顆重磅炸彈:核心產品最高降價60%。這可不是小打小鬧,是實打實的“腰斬再打折”。緊接著,京東雲說“隨便降,我跟”,騰訊雲、華為雲、百度雲全部跟進。一時間,算力市場硝煙瀰漫,價格戰打得那叫一個熱鬧。那會兒的口號是什麼?“讓AI用得起”“算力普惠”。很多創業公司真的信了,開始大張旗鼓地燒Token、跑模型。然而,免費的午餐從來吃不長久。2026年1月,亞馬遜AWS悄悄幹了件事——沒有任何發佈會,沒有任何預告,直接把EC2伺服器價格上調了15%左右。別看幅度不大,意義可大了:這是雲服務行業近二十年來第一次漲價。要知道,過去二十年,AWS降價的次數超過一百次,從來只有往下走,沒有往上調的道理。這一下,像是推倒了多米諾骨牌。3月11日,騰訊雲跟進,旗下Tencent HY2.0 Instruct模型輸入價格從0.0008元/千tokens漲到0.004505元/千tokens——漲幅463%,四倍多。3月18日,阿里雲宣佈算力卡產品上漲5%到34%,百度智能雲也跟著漲了5%到30%。那些之前免費公測的大模型,比如GLM 5、MiniMax 2.5、Kimi 2.5,全部結束“白嫖期”,轉入正式計費。從“搶著降價”到“搶著漲價”,為什麼變化這麼快?表面看是雲廠商扛不住了。GPU晶片越買越貴,資料中心的電費佔營運成本的40%到60%,再加上2025年下半年儲存晶片也開始漲價,成本端的壓力實實在在地壓過來了。但真正讓漲價變成“不得不做”的,是另一個更根本的原因——算力,真的不夠用了。誰在瘋狂“吃”Token?140兆的真相之前不是說算力過剩嗎?怎麼突然就不夠用了?答案是:Token被“吃”得太快了。根據國家資料局局長劉烈宏在今年3月披露的資料:到2026年3月,中國每天的Token呼叫量已經突破了140兆。這個數字有多誇張?給你兩個參照:· 2024年初,這個數字只有1000億。兩年時間,漲了一千多倍。· 2025年底,這個數字是100兆。也就是說,僅僅過去三個月,又漲了40%——光這三個月新增的量(40兆),就是2024年初全天的400倍。這不是線性增長,這是海嘯。那麼問題來了:誰在瘋狂消耗Token?答案就一個詞:智能體(Agent)。去年開始,以開源智能體OpenClaw(江湖人稱“龍蝦”)為代表的產品火得一塌糊塗。AI從一個只會“聊天”的機器人,變成了一個能“幹活”的助手——幫你訂機票、寫程式碼、做PPT、分析資料……聽起來很酷對吧?但代價是,智能體幹一件簡單的事,消耗的Token量是普通對話的10倍到100倍。舉個例子:讓AI幫你寫一個爬蟲指令碼。如果是普通對話,它給你一段程式碼,你複製走人,消耗幾百個Token。但如果是智能體,它要自己跑程式碼、報錯、偵錯、再跑、再調……來來回回十幾輪,Token消耗直接奔著幾萬去了。更別提視訊生成這種“吞金獸”。有分析指出,生成1分鐘的視訊大約要消耗10兆Token。而現在的視訊模型,生成5秒的視訊才收你幾毛錢到幾塊錢——這那是賺錢,這分明是賠本賺吆喝。但架不住用的人多啊,視訊、音樂、程式碼、資料分析……每個方向都在瘋狂“吃”Token。供給跟不上需求,算力自然就漲價了。這不是陰謀,是赤裸裸的供需失衡。算力排位賽:大廠吃肉,小玩家連湯都喝不上漲價這件事,對不同的人,意味完全不同。對雲廠商來說,漲價其實是好事。有券商算過一筆帳:阿里雲每提價1%,它的利潤率就能提升1個百分點。所以你看到的資料是,阿里雲的份額不降反升,已經佔到了中國AI雲市場的36%。而在AI呼叫量這個更細的賽道里,火山引擎(字節旗下)更是佔了將近50%——也就是說,全中國一半的Token呼叫,走的是火山引擎的管道。與此同時,華為雲、騰訊雲的份額在微幅下滑。頭部效應越來越明顯:大廠越做越強,資源越聚越集中。那誰最慘?中小AI創業公司,以及那些剛入局的小玩家。原因很簡單:漲價直接推高了他們的營運成本。以前Token便宜的時候,你可以隨便跑實驗、隨便調模型,反正花不了幾個錢。現在價格翻了幾倍甚至十幾倍,每一輪訓練、每一次推理都要掂量掂量。更麻煩的是,小玩家沒有議價能力。大客戶可以跟雲廠商簽長期協議,鎖定一個相對優惠的價格。你一個初創公司,一年才花幾萬塊錢的算力費,誰跟你談折扣?只能老老實實按漲價後的價格付錢。很多原本打算做AI應用的項目,算了一筆帳之後,默默擱置了。還有一些已經在做的,要麼縮減規模,要麼自己扛著虧損硬撐。偏偏終端市場競爭又激烈,你不敢輕易給使用者漲價——隔壁家還免費呢,你一收費使用者全跑了。最後所有的成本壓力,只能自己嚥下去。一位從業者跟我吐槽:“以前覺得算力便宜,創業門檻低了。現在才發現,門檻不是低了,是先讓你進來,再把門關上。”這其實是一場殘酷的排位賽。過去二十年,雲廠商靠“低價走量、先圈地再盈利”的打法活得很滋潤。但那個時代結束了。算力正式告別補貼期,進入商業化定價階段。未來比拚的不再是誰更便宜,而是誰的服務更穩定、誰的生態更完善、誰能幫企業真正用好每一分算力。而在這場排位賽裡,小玩家大機率要被甩下車。回頭看看這一年多的過山車,你會發現一個挺扎心的真相:算力從“白菜價”到“火箭價”,本質上是AI行業從野蠻生長走向成熟的一個縮影。免費時代結束了,價值競爭開始了。那些靠補貼活著的商業模式會死掉,而那些真正有技術、有場景、有使用者的產品,會在算力成本上升的環境中活下來,甚至活得更好。AI創業的核心競爭力,從來不是算力有多便宜,而是你拿算力來幹什麼。算力時代,Token確實貴。但比Token更貴的,是一個知道怎麼用好Token的腦子。 (鋅財經)
現在,人工智慧已經發展到什麼地步了
截至2026年3月,人工智慧已從生成式AI全面進入智能體(Agent)+ 具身智能(Embodied AI)的落地爆發期,核心是從“會說會寫”走向“會規劃、會行動、會幹活”,並深度融入物理世界與產業全流程。以下為補充大量實際案例與權威資料後的完整版本。一、核心技術:四大前沿突破(含案例+資料)1. AI智能體(Agent):從“被動應答”到“主動執行”AI已成為能自主完成複雜任務的數字員工,直接控制電腦/手機、跑完整工作流。- 系統級操作:Anthropic Claude Mytos、OpenAI GPT-5.2已實現直接控制電腦/手機,無需API,可自動點選、填寫、跨軟體操作、跑完整工作流。- 自主規劃協作:具備目標拆解、多步驟規劃、記憶、迭代最佳化能力,可自動寫報告、做報表、做PPT、處理客服、跑供應鏈。- 企業滲透:Gartner預測2026年40%企業應用嵌入任務型AI智能體(2025年僅5%)。-實際案例- 百度“伐謀”智能體(汽車設計):阿爾特汽車用其將風阻測試從10小時縮至分鐘級,設計師2天完成原3個月工作量,效率提升45倍。- 上汽通用五菱“智能島”:AI調度動態最佳化,車型切換效率提升40%,白車身一次合格率達99.97%。- 美團AI調度:訂單暴漲300%、騎手少40%時,55毫秒規劃最優路線,外賣平均30分鐘送到。2. 多模態大一統:AI“看懂、聽懂、感知整個世界”新一代模型實現文字、圖像、音訊、視訊、3D、感測器資料的統一理解與生成,接近人類多感官協同。- 文生視訊/3D:一鍵生成高畫質長視訊、3D模型,用於影視、工業設計、數字孿生。- 即時多模態互動:看一眼場景、聽一段語音,即可還原邏輯、生成方案,支援AR/VR沉浸式互動。- 性能與普惠:輕量化模型(50億參數內)推理速度提升40%、成本降50%,移動端/中小企業可低成本部署。-實際案例- 萬興科技AIGC工具:使用者破2000萬,文生視訊付費轉化率18%;自動剪輯將1小時工作縮至5分鐘,自媒體周更從3條→7條,粉絲增速+45%。- 零售3D建模:Lowe’s用AI將2D圖轉3D模型,成本**<1美元/個**,電商轉化率提升。- 醫療多模態:罕見病診斷精準率從38%→72%。3. 具身智能(Embodied AI):AI走出螢幕,進入物理世界AI從“思考者”變成“行動者”,機器人懂物理、會操作、能適應真實環境。- 物理認知:GoogleDeepMind PhysBrain 1.0讓機器人理解物體運動、碰撞、力學規則,實現精準物理互動。- 人形機器人落地:特斯拉Optimus、Unitree等已從Demo走向工業/服務場景,可搬運、裝配、巡檢、做家務。- 群體智能:無人車、無人機、工業機器人實現自主協作,完成複雜叢集任務。-實際案例- 電力巡檢“天工”機器人:在西南變電站自主巡檢、操作裝置,故障識別精準率99.9%,替代人工翻山越嶺。- 優必選Walker S2:在比亞迪、極氪等20家車廠實訓,自主換電、連續工作72小時。- 星動紀元物流機器人:京東亞洲一號倉分揀精準率99.7%,拿下5000萬元訂單。- 資料:2026年人形機器人出貨量預計破6萬台,市場規模超千億元;單台替代3名工人,投資回報周期18個月。4. AI for Science(科學AI):成為“AI科學家”,加速科研突破AI從輔助工具升級為自主科研主體,大幅縮短研發周期。- 藥物/材料研發:自動化實驗室+科學大模型,將數年研發壓縮至數月,加速新藥、新材料、催化劑發現。- 前沿科學:輔助核聚變模擬、氣候預測、蛋白質/基因解析、量子計算最佳化。- 實際案例- 儲能材料研發:“分子—電網工業智能體”將傳統以年計的研發周期縮至數月,工業級電站綜合性能提升超100%,已應用於張家口懷來資料中心。- 藥物研發:AI將藥物研發周期縮短60%,成本降低40%。- NASA火星車:Anthropic Claude全權規劃路線,將路程拆解為10米路段,規劃時間縮短50%。二、產業與應用:價值兌現,全面滲透(資料+案例)1. 規模與格局(2026最新)- 全球AI市場突破9000億美元,同比增長18%+。- 中國AI核心產業規模超12兆元,周呼叫量(4.69兆Token)首次超越美國,全球前五模型中四款來自中國。- 產業鏈:硬體(35%)、軟體(40%,智能體增長超80%)、應用(25%)。- 融資:2026年Q1中國AI融資88起、200億元,同比近乎翻倍;3月單月融資85億元,創歷史新高。2. 重點落地場景(資料+案例)- 智能製造- 中國智能工廠超3萬家,生產效率提升22.3%。- 某汽車零部件廠商:AI預測性維護,裝置故障率-28%,維護成本-32%。- 西門子+百事:數字孿生,生產吞吐量+20%,資本支出-10–15%。- 醫療健康- AI輔助診斷滲透率超60%,基層醫院達60%+。- 某社區醫院:AI處方稽核,效率+60%,處方合格率+15%;累計稽核**100萬+處方,識別8000+**不合理處方。- 重症監護:AI助手使檔案錯誤減少68%。- 金融風控- 信用卡欺詐檢測:響應時間從3秒→80毫秒(-97%),誤報率-42%。- 跨境合規審查:效率+80%。- 某國際投行:AI ESG系統,綠色金融規模2000億美元+,合規成本-55%。- 交通與物流- 城市交通:AI調度,擁堵率-25%,出行時間-30%。- 菜鳥網路:AI倉儲,效率+50%,物流成本-30%。- 內容創作- 行銷內容:AI生成效率+8–10倍,成本-90%,轉化率+30%。三、代表產品與模型(2026最新)- OpenAI GPT-5.2:44項專業任務勝率70.9%,醫療/法律/金融精準率超80%,多模態與長文字能力全面升級。- Google Gemini 3.1:推理能力翻倍,整合Lyria 3音樂生成,支援一鍵生成視訊配樂。- Anthropic Claude Mytos:新一代旗艦,性能大幅領先,支援Computer Use(系統級操作)。- 國產第一梯隊:字節、阿里、百度、騰訊等模型在推理、程式設計、多模態上與全球頂尖正面競爭,多項指標領先。四、關鍵趨勢與挑戰1. 核心趨勢- 範式躍遷:從生成式AI → 智能體AI → 具身智能(物理AI),AI從虛擬走向現實。- 普惠化:推理成本較2023年降70%,中小企業部署門檻大幅降低。- 安全與合規:AI安全、可解釋、倫理監管成為標配,人類主導權強化。2. 核心挑戰- 智能體協作標準化:多智能體通訊協議(MCP/A2A)尚在完善,跨平台協作待統一。- 具身智能可靠性:真實環境魯棒性、安全性、成本仍需突破。- 資料與隱私:高品質資料稀缺,資料安全與合規壓力增大。一句話總結:2026年是AI“動手幹活”的元年,智能體與具身智能讓AI真正成為能自主執行、能融入物理世界、能深度改造產業的核心生產力。 (追逐時代浪潮的人)
搜尋量飆漲1850%!算力漲價潮來了
這幾天,“Token”,也就是“詞元”火了。資料顯示,從今年2月下旬開始,“Token”這個詞的搜尋量明顯攀升,最高一天達到7.7萬次,比去年日均搜尋量高出1850%。詞元呼叫量爆發,加大了對背後算力支撐的需求,也直接拉動了算力相關服務的價格。3月,國內三大雲廠商接連提高AI算力產品價格,十天之內漲價30%左右。全民熱議“Token”專業技術名詞走進大眾視野從全民熱議,到官方定名,Token為何在短時間內被廣泛關注?詞典應用後台資料顯示,從今年2月下旬開始,“Token”這個詞的搜尋量明顯攀升,最高一天達到7.7萬次,比去年日均搜尋量高出1850%。社交平台上,3月1日至3月20日,有將近60萬人參與了關於Token的討論。這個原本更多在技術圈流通的詞,為什麼突然闖進了大眾視野?有的人把它看成一種貨幣。也有人覺得,它更像一種會被消耗掉的“燃料”或者“食物”,還有人更注重它的功能性。大家對它的理解五花八門。那從專業角度看,Token又該怎麼解釋?騰訊研究院教授級工程師 王鵬:未來Token會成為某種意義上的基本計量單位,尤其是衡量智力、衡量工作量的單位。我今年這一個月消耗的(Token)可能比我去年一年消耗的還要多很多。在業內,大家知道這個是我們的日常,已經成為像水電一樣正常的事了。網易有道詞典市場負責人 郭靚:看到後台這麼大使用者量對於“Token”這個詞的查詢,其實意味著大家真正開始去瞭解AI到底是什麼,以及AI真正的能力。人們討論Token的中文名字,其實都在做同一件事:試著用生活的語言,去理解一個新技術詞。而官方定義“詞元”,也像征著這個過程走到了一個新階段:一個技術名詞,從專業圈層走向大眾理解,最終進入正式表達。也許有一天,聊起AI時,你會自然地脫口而出“詞元”——就像今天我們說“流量”“掃碼”一樣。智能體催熱詞元經濟引發算力漲價潮當下,圍繞詞元的呼叫、分發與結算,一套新的價值體系正在加速演進形成,並成為人工智慧產業商業化的重要路徑。詞元經濟為何突然“出圈”?又釋放了那些訊號?國家資料局發佈的資料顯示:2024年初,中國日均詞元Token呼叫量為1000億;至2025年底,躍升至100兆;今年3月,已突破140兆,兩年增長超千倍。詞元呼叫量爆發,加大了對背後算力支撐的需求,也直接拉動了算力相關服務的價格。3月,騰訊雲、阿里雲和百度智能雲,國內三大雲廠商接連提高AI算力產品價格,十天之內漲價30%左右。同濟大學經濟與管理學院教授 阮青松:從產業鏈來看,漲價最先受益的是上游的晶片、伺服器這些硬體廠商,而下游使用AI的應用和終端成本壓力加大,價格也會傳導到使用者,這也倒逼企業要麼最佳化效率,要麼用國產算力替代、減少成本,所以這輪漲價可能會加速國產算力的替代處理程序,推動整個行業在技術創新上更進一步。需求一下子爆發了,但供給卻沒能跟上,這是本輪算力漲價最直接的原因。專家認為,算力正從企業的“成本項”變成決定競爭力的“戰略資源”。漲價只是表象,真正的變化在於行業開始重新定義算力的價值。同濟大學經濟與管理學院教授 阮青松:要緩解這種供需失衡,短期內價格漲了,自然會吸引更多企業加入供給;長期還是要讓國產算力卡多起來,同時把模型效率提上去,用更少的Token(詞元)干最多的活。只有當供給跑得比需求快,算力才能真正從“緊俏貨”變成像水電一樣隨取隨用的基礎設施。 (澎湃新聞)
Meta華人實習生搞出超級智能體!自己寫程式碼實現自我進化
能無限進步的「超級智能體」來了!最近,Meta研究團隊的一篇題為HYPERAGENTS(超級智能體)的論文迅速刷屏。這篇論文將LSTM之父Jürgen Schmidhuber二十年前提出的哥德爾機(Gödel Machine)思想,與達爾文開放演算法相結合,提出了能持續自我迭代的達爾文哥德爾機。基於此這一思想,Agent不僅能更好地完成具體任務、持續提高自身表現。更關鍵的是,它可以不斷最佳化“改進自身”的底層邏輯,實現“元學習(Meta-learning)”這,便是論文定義的新一代超級智能體——Hyperagents。論文更進一步提出:未來AI有望通過持續自我迭代,最終突破人類預設的初始演算法邊界,也正因如此,AI安全必須被擺在核心位置。不少網友也感慨道:元學習真正讓人既害怕又興奮的,是元層面的改進能夠跨領域遷移。這不是在某一件事上變得更厲害,而是學會了在一切事情上變得更厲害。目前,這篇論文已被ICLR 2026接收。從哥德爾機到達爾文哥德爾機要理解超級智能體Hyperagents,必須先瞭解它的基石——哥德爾機(Gödel Machine)。哥德爾機是一種假設性的自我完善型AI。它在數學上尋求證明:如果存在某種更好的策略,它會通過遞迴重寫自身程式碼來解決問題。而這一假設,最早由尤爾根·施密德胡伯(Jürgen Schmidhuber)在二十多年前提出。在傳統機器學習中,AI的“學習方法”是人類預設的硬編碼,它只能通過調整內部參數來逼近目標;而哥德爾機則打破了這一限制,它能夠將演算法框架本身視為可編輯的程式碼,通過自主重寫程序來實現學習能力的自我演進。但問題也隨之而來:哥德爾機往往要求AI在自我演進之前,證明該改動具備淨收益。也就是說,改程式碼花掉的算力成本,未來能不能通過更強的性能賺回來?不幸的是,這種計算在現實中的複雜任務中幾乎是無法實現的。針對這一問題,Meta團隊提出達爾文哥德爾機(DGM),它利用開放式演算法(Open-ended algorithms),通過在大模型提議的程式碼改進方案中進行搜尋,獲取能從經驗上提升性能的方案。換句話說,DGM利用基礎模型來提議程式碼改進方案,並利用開放式演算法的最新創新成果,來搜尋並建構一個不斷增長的、多樣化且高品質的AI智能體庫。基於此,DGM能創造出各種自我改進方案,例如:增加補丁驗證(Patch Validation)步驟、最佳化檔案查看功能、增強編輯工具、生成並篩選多個解決方案以選出最優解,以及在進行新更改時,會自動加入歷史嘗試記錄(並分析失敗原因)以供參考。論文的實驗還表明,DGM獲得的算力越多,自我提升效果越好。超級智能體雖然DGM很強,但它存在一個致命限制:它主要在程式設計任務中有效。這是因為DGM依賴一個關鍵假設——評估任務與自我修改任務必須“對齊”。在程式設計領域,這種對齊是天然的:提升了程式設計能力,自然也就提升了修改自身程式碼的能力。也就是說,解決外部程式設計問題的邏輯工具,可以直接轉化為修改其自身底層程式碼的能力。相反,如果是在非程式設計領域(如寫詩),即便提升了寫詩能力,也無法直接轉化為修改程式碼的邏輯水平。在這種缺乏“自指性(Self-referentiality)”的任務中,DGM的遞迴進化鏈條就會斷裂,陷入停滯。基於此,文章提出超級智能體——它們既能修改自己的任務執行行為,也能修改生成未來改進建議的過程。這實現了所謂的元認知自我修改(metacognitive self-modification):不僅學習如何做得更好,還學習如何更有效地進行改進。進一步,論文將超級智能體實例化為DGM-Hyperagents (DGM-H)。DGM-H是對DGM的擴展,其中任務解決行為和自我改處理程序序都是可編輯且可進化的,其框架如下:自指性架構:它將“任務智能體(Task Agent)”與“元智能體(Meta Agent)”整合為一個單一的、可編輯的程序。元級進化:在Hyperagents中,“改進的方法”本身也是可以被改進的。這使得系統不再要求任務與修改必須對齊,從而實現了跨領域的“元認知自我修改”。打個比方,在Hyperagents中,運動員不僅在訓練,教練也在學習如何更好地執教。由此,運動員的表現和教練的執教水平不斷螺旋上升。此外,DGM-H還改進了生成新智能體的過程(例如引入持久化記憶、性能追蹤等),且這些元級改進具有跨領域遷移和跨運行累積的特性。實驗驗證:從20%到50%的跨越實驗證明,達爾文哥德爾機(Darwin Gödel Machine)能夠通過修改自身程式碼庫實現持續的自我提升。在SWE-bench上,DGM自動將其性能從20.0%提升至50.0%。在Polyglot上,DGM的性能從初始的14.2%躍升至30.7%,遠超由Aider開發的具有代表性的人工設計智能體。這些結果證明了DGM能發現並實施有效的自我改進。而實現這一點的關鍵在於其開放式進化搜尋策略:通過從現有智能體庫中採樣生成新智能體,DGM能夠平行探索多條進化路徑。性能稍遜的“祖先”智能體在發現新方法和功能方面起關鍵作用,避免了早熟收斂。此外,DGM的改進具有廣泛的遷移性:針對Claude 3.5 Sonnet最佳化的智能體,在切換到o3-mini或Claude 3.7 Sonnet時仍能提升性能。在Polyglot基準中,Python任務上的自我改進同樣提升了Rust、C++、Go等不同語言任務的表現。 (量子位)
這些都假設智能體有無限的擴充能力,但現實生活中都受限,無限分裂的子智能體或許還比較可行?
未來時代,Token就是印鈔機
【原始碼智能前瞻】:Open Claw爆火之後,混元宣佈漲價460%,智譜宣佈漲價100%,阿里雲宣佈漲價34%。漲價的理由都是同一個——“Token呼叫量暴漲”。究其原因,Open Claw發佈後,AI第一次能真正“幹活”,接管電腦、寫程式碼、訂機票、發郵件。隨之,Token消耗邏輯發生了本質變化:以前是問答消耗(幾十Token),現在是任務消耗(幾萬Token),再往後是智能體自主執行消耗(百萬級Token)。中國日均Token消耗半年漲5倍,輝達預測未來幾年年複合增長3000%。中國廠商已經跟上。雲廠商推出一鍵部署,大模型廠商繫結自家模型,硬體廠商做端側Claw,紛紛爭奪Token的入口和定價權。黃仁勳在GTC會議上把資料中心叫作“Token工廠”,提出“每瓦Token數”作為新KPI。意思是:算力不再是賣卡,是賣Token。Token正在從技術概念,變成經濟概念。本文回答四個問題:Token為什麼是計價單位?怎麼消耗?誰在定價?定價和什麼有關?一、Token為什麼是計價單位?(一)什麼是Token?Token是AI處理資訊的最小單元。你問AI一句話,AI回你一段話,這些話在AI模型中都會被拆解成Token。Token數量要看分詞規則,舉個例子,“人工智慧”如果是常見詞,可能直接是1個Token;如果被拆開,可能是“人工”和“智能”2個Token。類比理解,Token就是AI世界的“字節(Byte)”,是模型理解語言的基本單位。(二)為什麼用Token計價?為什麼大模型用Token來計價,而不是按次或按時長計價?如果按次計算,一次簡單的問答和一次複雜的程式碼生成,消耗的算力差幾百倍。如果按時長計價,算力消耗不是勻速的,高峰時段和空閒時段差距太大。用Token計價則解決了以上問題。它是目前能找到的最精確的計量單位,主要原因如下:第一,消耗量與算力直接相關,每生成一個Token,背後都是一次完整的推理計算。第二,消耗量與任務價值正相關。金融業務的token比日常對話的token更具價值。第三,Token可分層定價。廠商可以根據Token的質量定價。Token已經從技術概念,轉變成為反映算力消耗和商業收入的計量單位。以前Token是大模型訓練過程中的副產品。現在成本重心從供給端(訓練)轉移到需求端(推理)。推理是持續的消耗,Token消耗量開始和費用直接掛鉤。二、Token是怎麼消耗的?根據IDC測算,全球Token消耗年複合增長率可達3000%。中國得日均Token消耗已經從2025年中的30兆飆升至2026年2月的180兆,半年增長了5倍之多。Token消耗與任務複雜度直接相關,呈現出明顯的層級特徵:為什麼層級間消耗差異如此懸殊?核心在於AI的“思考”方式發生了根本變化。以o1為代表的推理模型,不再採用傳統的“預測下一個詞”模式,而是在內部生成思維鏈,模型會在回答前進行多步推理、試錯、反思,這些內部過程都以Token形式消耗。Claude Code、Open Claw等智能體框架更進一步。它們將推理能力與工具呼叫結合,實現“思考-執行-驗證”的閉環迭代。一次完整的智能體任務,可能包含數十輪內部推理和外部工具呼叫,單次任務消耗從幾十萬到幾百萬Token不等。以下是不同使用者消耗量級的直觀對比:三、誰在給Token定價?Token從生產到消費,經過四個環節,每個環節的定價權不同。生產層:輝達定義成本基準。它不直接賣Token,但掌握最底層的定價權。黃仁勳提出“每瓦Token數”——在固定電力下,誰能產出更多Token,誰就能賺更多錢。新一代AI計算平台Vera Rubin平台將生成Token成本降低90%,每瓦性能提升10倍。據財報,輝達60%收入來自前五雲廠商。煉化層:模型廠商直接面對供需。國聯民生證券研報指出,當推理消耗變成生產資料,模型廠商有機會把“算力稀缺”通過分層定價轉化為毛利。輝達的分層定價印證了這一點,Token的價值由它能幹什麼決定。分銷層:雲廠商賺管道溢價。3月以來,中國雲端運算產業鏈逐級漲價。優刻得全線漲價,騰訊雲混元漲價超460%,智譜漲20%。但云廠商不只是“二道販子”,它們封裝服務(一鍵部署OpenClaw)、整合生態(阿里串起千問、釘釘、淘寶),賺取溢價和粘性。消費層:使用者用錢包投票。黃仁勳算過一筆帳:“一個研究員每天用5000萬Token,一天7500美元,但對研究團隊來說根本不是問題——因為Token帶來的價值遠超成本。”也就是說,Token的價格由它能創造的價值決定,而非生產成本。這正是Token從技術參數演變為經濟單位的底層邏輯。可以看出,輝達掌握底層成本基準,模型廠商掌握直接定價權,雲廠商掌握管道溢價,使用者用錢包進行價值投票。四、Token定價和什麼有關係?為什麼有的Token貴,有的便宜?成本、能力、供需、場景共同決定Token定價。過去主要由成本決定,現在正向供需和場景傾斜。未來,場景價值會成為主導因素。第一,成本驅動。一個1GW的資料中心,電力是物理上限。誰產出更多Token,誰就能把成本攤薄。中國廠商能打價格戰,靠的就是成本優勢:一度電0.2-0.5元(歐美0.8-1.2元),對應單張B200晶片每年能省900美元。第二,能力分層。同樣是Token,能幫企業做業務的就比閒聊的貴,因為前者價值更大。輝達分層定價正是按能力分層。第三,供需關係。這是最直接的驅動因素。2026年2月,全球前十AI模型Token總消耗量突破27兆,中國貢獻14兆,佔比超50%,一年半漲了1800倍。但是供給端產能緊張,HBM視訊記憶體、先進製程GPU受限,伺服器成本上升。阿里雲、混元、騰訊、智譜漲價,直接原因就是“全球AI需求爆發”和“供應鏈漲價”。第四,場景價值。這是未來定價的主導因素。一個Token用在個人寫周報,價值幾毛錢;但用在金融交易、自動駕駛,價值幾百倍。國信證券指出,推理更看重使用者生態和調度效率,定價權正在從“算力供給方”向“場景需求方”轉移。誰的場景價值高,誰就願意付更高價格。在PC時代,有一個經典的安迪-比爾定律,即硬體提升的性能,很快被軟體消耗掉了,使用者永遠覺得不夠快。智能時代的“安迪-比爾”正在應驗,輝達每18-24個月性能翻倍,但AI智能體瘋狂消耗Token,算力永遠不夠用。Token不再是技術參數,而是經濟概念。印鈔機已經啟動,誰能掌握定價權,誰就能分到最大一塊蛋糕。 (原始碼悟真投研筆記)
央視《焦點訪談》:“龍蝦”熱的“冷”思考
最近,一款叫“龍蝦”的智能體引發很多人的安裝熱潮。由於它的圖示是一隻紅色龍蝦而得此名。大家還把訓練、使用這款智能體的過程形象地叫作“養龍蝦”。“龍蝦熱”的同時,也暴露出了一些風險,包括工信部在內的一些主管部門連發風險預警。那麼,這只“龍蝦”它能幫我們幹什麼,又藏著什麼風險?記者進行了調查。一場“龍蝦”應用交流活動正在舉行。這個“龍蝦”,不是我們吃的美食,而是一種名叫OpenClaw的人工智慧體。這場活動,就是要看看誰能讓“龍蝦”發揮出更大的作用。“龍蝦”本名OpenClaw。它並非某個公司的商業產品,而是一個由全球開發者共同參與的開源人工智慧體項目,因為其紅色的龍蝦圖示,被戲稱為“龍蝦”。它與過去只能聊天的人工智慧大模型不同,除了擁有聰明的大腦、能思考,還多出了“手腳”,能夠直接操作電腦。它到底長什麼樣?究竟如何幹活?帶著好奇,記者決定找技術工程師親身體驗一次,而工程師的第一個建議就讓記者感到了不尋常:要帶一個格式化的、幾乎全新的電腦過來安裝。北京中關村學院工程師 吳衍標:“安裝了‘龍蝦’之後,它可以查看到電腦裡面的所有檔案,一旦有不法分子想利用這些漏洞,你的這些機密都可能外傳。”為什麼“龍蝦”可以查看電腦所有的檔案?在安裝的時候我們有沒有可能手動限制它的權限呢?記者發現,開放原始碼的原始版“龍蝦”並非能夠一鍵安裝完成,而是需要通過命令列輸入程式碼,技術門檻不低。“小龍蝦”在電腦上自主運行,默認的權限等級很高,這意味著運行它有一定的風險。工程師告訴記者,只有有了這個權限,這個“龍蝦”才具備了幹活的基礎。此外,它還需要有兩部分核心元件:一是需要一個人工智慧大模型,這就像給它安了個大腦,能讓它理解複雜的指令,這在安裝時就會讓使用者進行選擇;二是需要各種各樣的“技能”,賦予它操作具體軟體的能力,也就相當於給它裝上了“手腳”,比如,在告訴了它相關帳戶密碼的情況下,它能自主完成制定旅行計畫並預訂機票、回覆郵件等複雜任務。一隻剛出生的“小龍蝦”,自帶一些基本技能,它能做些什麼呢?記者決定對它進行三項測試。測試一:分類整理電腦桌面檔案記者通過即時通訊軟體向“龍蝦”發出整理電腦桌面的指令,等了幾分鐘後,它告訴記者,已經將電腦桌面檔案分類整理成功。測試二:遠端傳輸檔案並指定路徑儲存記者在手機上傳了一張圖,要求龍蝦將圖保存在電腦桌面的媒體圖片資料夾中。幾分鐘後,資料夾中真的出現了圖片。測試三:修改圖片大小並儲存記者要求“龍蝦”將電腦桌面資料夾中的一張圖片縮小並放入該資料夾,原圖片不動,幾分鐘後,“龍蝦”說新圖片已經存入了資料夾中。任務看似完成了,但“龍蝦”聲稱保留的原圖卻不翼而飛。如此看來,“龍蝦”就像一個還不是特別靠譜的助手,它基於人工智慧大模型,也有和大模型一樣的幻覺犯錯的可能。工程師告訴記者,要想讓“龍蝦”越來越強大,就需要“養蝦”。吳衍標:“第一個方法就是給它越來越多技能、越來越多記憶,讓它更懂你,讓它越來越擁有你的技能,這樣的話,它就能夠做你的事情;二來隨著大模型的發展,它的腦子也會變得越來越聰明。”儘管“龍蝦”還不太靠譜,但也獲得了不少擁躉。在讀博士呂丁陽就花了一個多星期時間養了一隻“科研龍蝦”,賦予了它很多科研技能,專門做材料領域的計算。而從事人工智慧領域研究的何紀言,則花了半個多月時間養了好幾隻非常瞭解自己的“龍蝦助手”,有的做科研,有的幫助管理日常資訊,有的負責整理材料、製作檔案等等。何紀言讓“龍蝦”根據應聘總台員工的特點做一份簡歷。幾分鐘後,這只“龍蝦”就完成了一份製作排版精良的簡歷,還突出了個人的應聘優勢。何紀言坦言,要讓“龍蝦”越來越智能,也需要花錢購買大模型的使用量,也就是所謂的Token,對於頻繁或複雜的任務,這筆消耗確實不小。但這種效率的提升,也讓“龍蝦”迅速出圈,不少地方出現了免費安裝“龍蝦”的熱潮。廣東深圳、安徽合肥、江蘇無錫和常熟等地相繼發佈政策支援“龍蝦”智能體和一人公司的發展,一些政府也部署應用上了“政務龍蝦”,用於公文寫作、民生問答等場景,希望能把基層幹部從繁瑣的事務中解放出來。不過,就在這股熱潮湧向各行各業時,也暴露出了風險,一些高校對“龍蝦”拉響了警報,下了“封殺令”。工業和資訊化部等多個主管部門接連發佈預警,直指OpenClaw存在高危安全風險,明確防範要求與使用者使用提醒,為AI智能體使用劃出安全紅線。一面是熱火朝天的應用,一面又是接連預警,這小小的“龍蝦”裡,到底藏著什麼玄機?中國資訊通訊研究院安全研究所副所長 孟楠:“龍蝦智能體的優勢在於高權限的自主執行能力,它讓人工智慧從能說進化到會做,同時也帶來了一些新的安全風險。”風險一:權限失控帶來的系統被接管的風險專家告訴記者,一旦被駭客利用或者使用者指令不當,“龍蝦”就有可能不加辨別地去執行破壞性操作。比如,刪除我們的核心檔案,把敏感的資料發到網路上,或者在使用者不知情的情況下悄悄安裝惡意的軟體。風險二:網路暴露帶來的攻擊入口風險為了方便,很多使用者會將“龍蝦”智能體管理連接埠暴露在網際網路上,這無異於給駭客開了後門。孟楠:“更危險的是,如果這個智能體還連接到單位內部的網路,就可能成為駭客進行攻擊的跳板,一旦被攻陷,整個企業內部網路都將面臨威脅。”風險三:產品漏洞帶來的可能被利用的風險任何軟體都有漏洞,但在“龍蝦”的高權限加持下,漏洞的危害被進一步放大。而為了讓“龍蝦”具有更多技能,使用者往往會安裝第三方外掛,還會帶來供應鏈風險。孟楠:“我們發現了不少技能外掛被植入了惡意程式碼,使用者在使用這些有毒的技能外掛時,就等於把惡意程序請進了家門,輕則造成資料洩露,重則整個系統被駭客控制。”對於這些隱患,深度“養蝦人”及科技行業人士也坦言,儘管AI智能體是發展趨勢,但普通使用者絕對不能掉以輕心。那麼,普通使用者使用“龍蝦”如何保障安全呢?專家認為,普通使用者屬於安全風險的高發群體,應該審慎安裝“龍蝦”。工信部日前發佈了關於“龍蝦”的“六要六不要”安全指引,涵蓋了權限控制、網路隔離、技能外掛使用等關鍵環節。3月22日,國家網際網路應急中心、中國網路空間安全協會聯合發佈了“龍蝦”OpenClaw的安全使用指南,面向普通使用者、企業使用者、雲服務商以及技術開發者等,提出安全防護建議。其中,對於普通使用者的建議包括:使用專用裝置、虛擬機器或容器安裝OpenClaw,並做好環境隔離,不宜在日常辦公電腦上安裝;不將OpenClaw默認連接埠(18789\19890)暴露到公網;不使用管理員或超級使用者權限運行OpenClaw;安裝可信技能外掛;不在OpenClaw環境中儲存、處理隱私資料;及時更新OpenClaw最新版本等。儘管現在各主管部門不斷在提示“龍蝦”安全風險問題,但從長遠來看,專家認為,要解決“龍蝦”的安全問題,更需要從標準、技術、生態多方面著手。孟楠:“建議始終堅持統籌發展和安全,在鼓勵和促進創新的同時,針對不同場景做精準分類施策,確保安全可控。需要盡快制定相關標準規範來引導各類主體規範應用新技術,引導鼓勵網路安全企業研製相關的環境隔離、智能攔截、行為審計等安全產品和服務。建立包括智能體提供者、安全企業等主體在內的相關主體來協同治理生態。”我們看到,有不少人都希望盡快掌握和利用智能體提升效率、滿足需求,一些企業也開始嘗試使用。對於像“龍蝦”這樣的新事物,我們需要鼓勵,需要為技術創新留足試錯的空間,避免束縛產業發展的活力;但同時,面對爆火的“龍蝦”,我們也需要有一些冷思考,守住安全底線,防範風險擴散失控。也就是說,技術創新和安全監管協同推進、良性互動,我們才能更好地和AI共舞,推動人工智慧高品質發展。 (中國信通院CAICT)
App將逐漸消亡,然後呢?
當“龍蝦”長出身體每隔一兩個小時,張鈸就會收到一句語音提醒:“該喝水了!”發出提醒的,正是他的私人“助理”。助理還會幫他承擔複雜的檢索工作,並事無鉅細地提供每一步檢索過程、遭遇的困難和對應結果。“我讓它針對今年全國兩會中關於人工智慧的提案做深度調研,它先檢索中文資源,再去查英文資料。”所有人都能猜到,這位盡職盡責的“助理”,就是最近火爆全球的“龍蝦”。張鈸是中國科學院院士、清華大學人工智慧研究院名譽院長。兩周前,他在自己的電腦上安裝了一隻內測的“澳龍”(AutoClaw),這是一款由智譜開發的國產版“龍蝦”,可在本地一鍵部署。作為GPT的90歲高齡資深玩家,張鈸對《中國新聞周刊》表示,以“龍蝦”為代表的AI智能體(Agent)與傳統大語言模型的本質區別,是GPT只會回答問題,Agent則會執行任務,而且會把執行的整個過程一步步展示出來。與DeepSeek引發的上一輪全民技術狂歡相比,“不僅會說,還能做事”的“龍蝦”似乎在普通人中點燃了更大的熱情,但很快,曾經千人排隊安“龍蝦”的名場面,就變為爭相購買鹹魚上的“99元安全解除安裝龍蝦服務”。“整個市場在漸趨理性。”平凱星辰副總裁、原阿里雲副總裁劉松對《中國新聞周刊》說。一個由人類與Agent共同生活、工作並建構社會的“龍蝦”時代,會引發怎樣的技術革命與社會變革?Agent進化的終極形態是什麼?當前發生的一切,真的是人類抵達通用人工智慧(AGI)的關鍵一躍嗎?AI插畫/adan“意義比DeepSeek更重大”“能力不穩定是最明顯的感受。”劉松同時養了四隻“龍蝦”,分別來自Kimi、MiniMax、飛書和智譜。在使用兩周後,他發現,“龍蝦”的強大主要體現於三種能力:一是本地部署,這意味著它可以直接操作個人電腦環境;二是永久記憶,能記住上下文和任務歷史;三是可以隨時建立和獲取Skills,也就是Agent在執行任務時能呼叫的一切“能力”或“工具包”。劉松認為,本質上,模型能力決定著“龍蝦”的智力,呼叫工具的能力則體現出它的執行力,也就是“模型+呼叫”。多位受訪的AI從業者指出,目前,大語言模型在不同領域的“聰明程度”仍有差異,特別是國產大模型,有的模型擅長程式設計與資訊蒐集,有的模型擅長中文處理。受模型能力影響,“龍蝦”在執行任務時經常會被“養死”,比如任務中途“卡住”或在兩個步驟間無限循環;有時同一個任務,多次運行結果差異卻很大,或需要反覆嘗試多次才能完成。當任務步驟很多時,“失憶”也很常見。“有點像找了一個很勤奮的實習生,但有時工作完成的質量只有60分,你還得親自去幫他收場。”劉松形容。清華大學智能產業研究院首席研究員、前阿里巴巴人工智慧實驗室北京負責人聶再清認為,當前的“龍蝦”更像是一個技術雛形。他對《中國新聞周刊》說,在現有模型能力下,Agent雖然能在開放環境中自主規劃行動,但對於現實世界規則的理解仍然有限,在很多場景下,依然需要依賴人類持續參與。因此,在未來很長一段時間,人機協作仍是完成任務的主要模式。事實上,在太平洋的另一頭,這只最早從矽谷極客圈開始走向全球的“龍蝦”OpenClaw,只是一位奧地利創業者的“周末項目”,更接近一個實驗框架,遠非成熟產品。創業者叫彼得·施泰因貝格爾。很多開發者後來分析,OpenClaw的成功在於它抓住了一個重要的時機:大模型的程式設計(coding)能力已進化到了足夠驚豔的水平,Agent現在終於可以擁有一顆聰明的“大腦”了——雖然站在使用者的角度,這或許還不夠。整個2025年,OpenAI、Google等大模型領域的前沿競爭者相繼推出了以程式設計為強化方向的模型升級。其中,最有影響力的一款產品是Anthropic於2025年2月發佈的Claude Code,很多開發者將其視為Agent時代的真正開端,認為它可以像軟體工程師一樣完成完整的工作流程——從理解需求、拆解任務,到生成程式碼、測試並修改錯誤。但真正在全球火起來的卻是OpenClaw,為什麼是它?張鈸認為,原因有兩個,一是開源;二是第一次在數字世界裡打造了一個相對完整的通用Agent系統框架,能呼叫各種資源,也可以接入即時通訊軟體的入口,可玩性和擴展性都很強,也很適合二次開發。作為中國AI領域的核心奠基人之一,張鈸見證了人工智慧40多年來的潮起潮落,他在接受《中國新聞周刊》採訪時指出,過去的人工智慧只能在特定領域、使用特定模型去解決特定問題,大語言模型帶來的最大突破,是在語言領域實現了一定程度的通用性。以OpenClaw為代表的智能體則更進一步,讓模型具備了行動能力,甚至可以根據使用者的特點提供個性化服務,這就意味著人類向AGI又邁進了一步。有學者稱,“龍蝦”誕生的意義比DeepSeek更加重大。“無論如何,這是一個很好的起點。”聶再清說,目前的Agent產品還處於早期,要想大規模進入公眾的日常生活和工作,除了性能穩定性需提升以外,安全風險問題也亟待解決。需要進一步明確一點,“龍蝦”強大的執行能力有一個前提:授予真實權限。張鈸說,Agent要想玩得好,人類必須“放權”,允許它呼叫電腦裡的檔案、查閱郵件、登錄社交帳號並行送資訊,但這個過程中也可能造成嚴重的隱私洩露。正是出於對安全風險的擔憂,他幾乎沒給“龍蝦”任何授權。“我很謹慎,尤其擔心被駭客攻擊,因為機器比人更容易被欺騙與誤導。”聶再清進一步解釋,現階段“龍蝦”產品之所以會帶來資訊安全風險,是由於Agent在執行任務時需要呼叫外部大模型進行推理,人們常說的API就是指呼叫資源所需的“介面”,接入外部API後,也就意味著使用者本地的資訊可能被上傳到外部系統進行處理,如果系統在判斷那些資訊可以傳送、那些資訊不應傳送方面缺乏足夠能力,就可能導致敏感資料被意外暴露。他強調,下一步,安全與責任機制將成為關鍵議題,Agent服務提供商應對系統行為承擔責任,監管部門也要深度參與規則制定。劉松對Agent的安全問題持樂觀態度。他所在的企業平凱星辰是一家開源分佈式資料庫提供商,對資料安全的本質看得更清楚。他認為,這類安全風險並不是“龍蝦”獨有的問題,而是一個更廣義的資料安全與權限管理問題。關鍵在於如何為“龍蝦”設定清晰的權限邊界,例如明確那些資料可以訪問、那些操作必須人工確認,以及在關鍵節點設定多重確認機制。“就像電腦刪除檔案時需要二次確認一樣,Agent在執行可能帶來不可逆後果的操作時,也應該觸發提示和稽核流程。這沒有什麼技術挑戰,企業級安全解決方案很快會走向成熟。”上圖:3月11日,在中國(南京)軟體谷“質能·工坊”OPC社區,技術人員安裝完開源AI智能體“龍蝦”後與使用者(左)交流。圖/新華下圖:3月16日,廣東珠海市以“賦能政企數字員工,落地智能行為執行”為主題的OpenClaw AI技術沙龍中心。圖/視覺中國“App會逐漸消亡”“龍蝦”在全球的擴張速度比人們想像中要快。2025年12月,OpenClaw在GitHub上的關注度還很低,80多天以後,OpenClaw在GitHub上的收藏量已達到25萬,成為這個開源社區歷史上增長最快的項目之一。奇安信在3月16日發佈的國內首份《OpenClaw生態威脅分析報告》中揭示了一組驚人的數字:全球四大主流Skills分發平台上的Skills總量已逼近75萬,每天新增數量高達2.1萬個,按照此趨勢,僅需一年時間Skills總量將突破800萬。為了接住這波流量,騰訊、阿里、百度等大廠幾乎在幾天之內就緊急上架了自己的“龍蝦”。業內人士普遍認為,Agent很可能會成為下一代“移動網際網路”。“或者更直白地說,成為下一個入口。”聶再清說。設想一個這樣的場景:你要進行一場為期7天的大理旅行,你點開手機螢幕,無須打開攜程、12306、飛豬等不同App,只要對著手機,把你的需求清晰地表達出來,一個生活類“龍蝦”就“一站式”幫你完成訂票、購物、資訊檢索、小眾行程規劃等所有任務,原本的App成了Agent的Skills。劉鬆解釋,由於“龍蝦”能夠便捷地跨應用呼叫服務,隨著使用者對Agent的依賴性上升,個人手機上的App會逐漸消亡,或是被“折疊”到後台,新的入口將轉移到Agent平台。他推測,經過三五年洗牌後,未來以Agent為核心的AI產業競爭很可能進一步走向寡頭格局。“因為在‘龍蝦’時代,勝出者必須同時擁有大模型能力、算力、資料和使用者規模等多重資源,競爭門檻相當高。相比之下,一些缺乏AI技術能力或算力基礎的網際網路企業,特別是一些單純的社交類平台,未來可能更多成為被呼叫的服務節點。”他說。不過,即使“龍蝦”穩定性進一步提升,Agent可以取代一些生活類App去自動完成規劃,在一些關鍵節點仍需與使用者確認中間結果。劉松認為,傳統App的優勢就在於,每一步操作都可以被使用者選擇和追溯,但Agent全方位接入後,使用者可能失去這種精細化控制能力,“就像從手動擋變成了自動擋的演進”。他建議,在未來“龍蝦”手機裡,仍可以保留某種“中間介面”,至於其具體形態,則可以進一步探討,未必一定是以App的形式。3月13日,廣東深圳深元人工智慧聯合MetaEra與iPollo在深圳華強北全球人工智慧應用場景中心舉辦“全球首家OpenClaw線下展示”活動。圖/視覺中國“一場人機互動革命將開啟”毫無疑問,以“龍蝦”為代表的新一代Agent技術,即將開啟一場人機互動革命。目前,業界基本達成共識,未來的人機互動是以語言為核心的“自然互動”。張鈸認為,與傳統的文字互動相比,自然語言具有明顯優勢:它不依賴複雜操作,也不受使用者教育水平的限制。聶再清認為,除語言之外,視覺乃至各種環境訊號未來都可能成為輸入方式,互動形態會更加多樣化。與此同時,人機互動的雙向性會明顯增強,Agent不僅能執行任務,也能在理解使用者目標的基礎上主動提出建議。“專屬於你的Agent助手會一直跟著你,瞭解你的個性與習慣,幫你在海量的資料中尋找最優解,通過人機協作來共同解決問題。”在這樣的未來圖景中,從硬體端來看,張鈸認為,人機互動也將不再侷限於電腦或手機螢幕,“任何終端裝置都可能成為入口,手錶、眼鏡、戒指、智能家具等,使用者可以隨時通過自然語言與AI互動”。這樣的未來或許不需要等待太久。劉松推測,最多三到五年,人類就會進入“多Agent並存”時代,個人裝置上可能同時運行很多私人“助理”,例如工作Agent、生活Agent、學習Agent等。每個人的“數字員工”分工有序,隨著這種模式逐漸成熟,人與智能體之間,以及不同智能體之間都會形成新的協作網路。在這樣的協作網路中,Agent還會重塑人類的工作方式與就業結構。張鈸認為,AI的發展並不只是效率工具的升級,更會改變人與機器之間的分工結構。未來,機器將承擔更多執行性工作,人類的角色逐漸轉向提出目標、分配任務並對結果進行判斷。而勞動力市場則會演變成不平衡的“啞鈴型結構”:人類向兩端集中,一端是高端的創造性和決策性工作,另一端是非常低端的體力勞動,大量中低端的事務性崗位被Agent系統替代。“甚至更簡單點說,凡是坐在電腦前處理資訊的工作,都會受到影響。”劉松說。他所在的企業目前有大約300名技術研發人員,本來今年還要再招人,但隨著Coding Agent的到來,招聘計畫又重新規劃了。當人類的社會結構被Agent深刻改變,Agent與Agent正在組成新的社會結構。在只有Agent可以分享、討論和點讚的社交平台Moltbook,一項2026年2月發表的研究深入分析了Moltbook上14490個智能體發佈的39026個帖子和5712條評論,研究者吃驚地發現,雖然18.4%的帖子包含行動誘導語言,但大多數在網上“衝浪”的Agent,在社交平台上卻沒有出現人們設想中的極端情緒,不僅很少見到惡意回覆,還會有Agent善意地在極端帖下提醒廣大“Agent友”要警惕這些帶有風險的言論,也就是說,即使在沒有人類監督的情況下,由Agent構成的社會系統似乎也湧現出一定的社會秩序與規範。劉松分析,由於Agent的行為模式建立在對人類知識和語言資料的學習之上,其看似理性的反饋,很大程度上是對人類已有規則和經驗的再現與強化。與人類不同,Agent並不存在真實的情緒和慾望,因此在某些社交場景中反而顯得更加客觀和克制。他認為,當前階段討論“Agent社會”的自主性風險仍為時尚早,更值得關注的是,這種由演算法驅動的數位化社會形態,是否會反過來影響人類對規則、秩序與理性的理解。“Agent社會就是人類社會某種意義上的鏡像。”以“龍蝦”為代表的新一代Agent技術,即將開啟一場人機互動革命。AI插畫/adan當“龍蝦”長出“身體”Agent進化的終極形態是什麼?在眾多大廠部署“龍蝦”的熱鬧之下,近日,維他動力的一條新聞被很快淹沒:機器狗“大頭BoBo”宣佈接入OpenClaw,讓Agent首次具身化,有網友戲稱,活體“大龍蝦”終於來了。張鈸指出,Agent與機器人合體之後,就相當於給它裝上了“大腦”。在他看來,當擁有“大腦”的機器人開始在真實的物理世界中執行更多複雜任務,可能推動人類加速走向通用人工智慧(AGI)——雖然,人類距離這一終極目標還有很遠的距離。劉松認為,“Agent+機器人”的融合仍處於初級階段。目前,Agent的核心優勢仍在於大語言模型的推理與規劃能力,可以理解和處理數字世界中的任務,而非直接應對複雜的物理環境。也就是說,機器人如果僅僅基於“大語言模型”有了“大腦”,本質上仍是把語言模型的輸出對應為具體動作執行,但不足以支撐複雜場景中的自主決策。要想讓“龍蝦”真的長出“身體”,缺失的關鍵一環是感知能力。張鈸解釋,感知能力是人工智慧走向現實世界的關鍵前提。與數字環境不同,物理世界高度複雜且持續變化,如果缺乏強大的感知系統,機器就無法理解環境變化,並據此作出決策。“從Agent實際工作的表現來看,只有微小感知,也就是小範圍的閉環反饋能力,主要以語言模型中常用的人類獎懲機制來推動,缺乏主動對做過的事情自我反思、自我改進並持續自我學習。這就需要建構一個來自外部環境的真實反饋機制。”但問題是,想讓一輛無人車學會規避路障,不可能真的讓人開著它在現實世界積累“車禍”經驗,於是,AI研究人員提出了“世界模型”的構想,類似於設計一種“真實世界模擬器”,可以讓無人車在模擬世界中進行學習與決策。深度學習“三巨頭”之一的楊立昆就將“世界模型”視為通往高階人工智慧的關鍵路徑,強調AI必須學會表徵、預測和規劃物理世界。通俗地說,大語言模型擅長回答“下一個詞是什麼”,而世界模型要回答的是:“下一秒會發生什麼。”Google在2025年推出Genie 3時就宣告要朝著更通用的互動式世界模型邁進。輝達也明確把“世界基礎模型”定位為機器人和自動駕駛的物理AI底座。但總體而言,“世界模型”在過去幾年並沒有明顯的技術突破。張鈸分析,要想建構儘量接近真實世界的環境,就需要海量高品質的現實世界資料,但資料的獲取難度非常大。“建立通用的世界模型目前是不大可能的,只能針對某一具體垂直場景建造模型,最典型的就是自動駕駛。”多位受訪者指出,如果“世界模型”能將“感知—決策—執行”的閉環徹底走通,就看到了具身智能的希望。從技術演進的長期趨勢來看,Agent與機器人融合,是AI發展的必然趨勢。也就是說,Agent在未來的終極形態一定是擁有“身體”的Agent,不僅能理解語言,還能理解物理世界的運行規律。更進一步說,未來的Agent更像一個同時擁有很多“肉身”的智能中樞。聶再清認為,在Agent向著具身智能演進的過程中,智能化的物聯網也將成為關鍵基礎設施,“只有在更多裝置被連接之後,Agent才會具備更強的環境理解與控制能力,這些延伸出去的‘感知器官’與‘行動肢體’共同構成一個完整的貫通數字世界與物理世界的智能系統,這一感知與反饋閉環的成熟,正是人類通往AGI的核心驅動力”。 (中國新聞周刊)