#智能
WWDC26押注AI!蘋果聯手Google,能否拯救自家智能體驗?
蘋果突然打破保密慣例,提前官宣今年WWDC開發者大會將全面聚焦AI,這場定在6月的科技盛會,不再藏著掖著,直接把智能升級擺到檯面。大會採用線上線下結合形式,核心不發新硬體,全部圍繞系統AI革新展開,而這一切的伏筆,早在年初蘋果與Google達成的合作中就已埋下。不少網友看到消息第一反應是,終於等到蘋果認真做AI了,之前的智能功能更像小打小鬧,這次該拿出真東西了。全新升級的智能助手會是整場大會的絕對主角,互動邏輯徹底重構,告別單一指令模式,支援長時間上下文記憶,還能看懂螢幕內容完成跨應用操作。響應速度會有明顯提升,搭配全新視覺動效,互動體驗更貼近日常聊天,不再是生硬的一問一答。同時iOS、macOS全平台系統都會迎來底層AI改造,介面特效也會和智能互動深度適配。蘋果選擇牽手Google大模型,本質是認清了自研路線的現實侷限。過去一年多,自家智能功能推進緩慢,落地可用的功能寥寥無幾,國內市場更是遲遲無法上線。原本規劃的多個AI項目陸續收縮,團隊方向從多點佈局,轉向以智能助手為唯一核心入口,人才流失與內部調整,也讓蘋果不得不加快求變的腳步。自研隱私優先的路線固然穩妥,但大模型能力的差距,單靠系統整合很難快速追上。與其花費數年追趕,不如直接接入成熟技術,用最短時間補齊短板。合作模式也延續了蘋果一貫的謹慎,核心資料優先在裝置端處理,雲端傳輸全程加密,既借到外部技術優勢,又守住隱私底線,算是兼顧效率與安全的折中方案。這次戰略轉向,讓蘋果放棄在大模型層面正面競爭,回歸最擅長的系統整合與生態閉環。把成熟AI能力裝進完整的裝置生態裡,理論上能打造出獨一份的流暢體驗。能不能成功,關鍵要看兩點。一是新版智能助手能否真正達到主流AI助手的理解與對話水平,擺脫使用者心中不夠智能的固有印象。二是國內市場的落地進度,目前國行裝置雖有入口但功能受限,面對國產廠商全場景AI普及,蘋果如果遲遲不能補齊體驗,很容易丟掉市場優勢。按照目前進度,今年二季度的系統版本會是關鍵節點,國行智能功能有望分批推送,且僅適配高端機型,入門裝置因算力限制無緣核心體驗。WWDC26不僅是一次功能發佈會,更是蘋果在AI賽道重新站位的亮相。牽手Google只是第一步,後續功能打磨、本地化適配與生態拓展,才是決定能否重回領先的核心。當硬體創新逐漸趨緩,AI體驗會成為高端裝置的新分水嶺,蘋果能否靠這次轉型守住優勢,今年6月的大會,就能看出大致答案。 (數位星運)
Meta華人實習生搞出超級智能體!自己寫程式碼實現自我進化
能無限進步的「超級智能體」來了!最近,Meta研究團隊的一篇題為HYPERAGENTS(超級智能體)的論文迅速刷屏。這篇論文將LSTM之父Jürgen Schmidhuber二十年前提出的哥德爾機(Gödel Machine)思想,與達爾文開放演算法相結合,提出了能持續自我迭代的達爾文哥德爾機。基於此這一思想,Agent不僅能更好地完成具體任務、持續提高自身表現。更關鍵的是,它可以不斷最佳化“改進自身”的底層邏輯,實現“元學習(Meta-learning)”這,便是論文定義的新一代超級智能體——Hyperagents。論文更進一步提出:未來AI有望通過持續自我迭代,最終突破人類預設的初始演算法邊界,也正因如此,AI安全必須被擺在核心位置。不少網友也感慨道:元學習真正讓人既害怕又興奮的,是元層面的改進能夠跨領域遷移。這不是在某一件事上變得更厲害,而是學會了在一切事情上變得更厲害。目前,這篇論文已被ICLR 2026接收。從哥德爾機到達爾文哥德爾機要理解超級智能體Hyperagents,必須先瞭解它的基石——哥德爾機(Gödel Machine)。哥德爾機是一種假設性的自我完善型AI。它在數學上尋求證明:如果存在某種更好的策略,它會通過遞迴重寫自身程式碼來解決問題。而這一假設,最早由尤爾根·施密德胡伯(Jürgen Schmidhuber)在二十多年前提出。在傳統機器學習中,AI的“學習方法”是人類預設的硬編碼,它只能通過調整內部參數來逼近目標;而哥德爾機則打破了這一限制,它能夠將演算法框架本身視為可編輯的程式碼,通過自主重寫程序來實現學習能力的自我演進。但問題也隨之而來:哥德爾機往往要求AI在自我演進之前,證明該改動具備淨收益。也就是說,改程式碼花掉的算力成本,未來能不能通過更強的性能賺回來?不幸的是,這種計算在現實中的複雜任務中幾乎是無法實現的。針對這一問題,Meta團隊提出達爾文哥德爾機(DGM),它利用開放式演算法(Open-ended algorithms),通過在大模型提議的程式碼改進方案中進行搜尋,獲取能從經驗上提升性能的方案。換句話說,DGM利用基礎模型來提議程式碼改進方案,並利用開放式演算法的最新創新成果,來搜尋並建構一個不斷增長的、多樣化且高品質的AI智能體庫。基於此,DGM能創造出各種自我改進方案,例如:增加補丁驗證(Patch Validation)步驟、最佳化檔案查看功能、增強編輯工具、生成並篩選多個解決方案以選出最優解,以及在進行新更改時,會自動加入歷史嘗試記錄(並分析失敗原因)以供參考。論文的實驗還表明,DGM獲得的算力越多,自我提升效果越好。超級智能體雖然DGM很強,但它存在一個致命限制:它主要在程式設計任務中有效。這是因為DGM依賴一個關鍵假設——評估任務與自我修改任務必須“對齊”。在程式設計領域,這種對齊是天然的:提升了程式設計能力,自然也就提升了修改自身程式碼的能力。也就是說,解決外部程式設計問題的邏輯工具,可以直接轉化為修改其自身底層程式碼的能力。相反,如果是在非程式設計領域(如寫詩),即便提升了寫詩能力,也無法直接轉化為修改程式碼的邏輯水平。在這種缺乏“自指性(Self-referentiality)”的任務中,DGM的遞迴進化鏈條就會斷裂,陷入停滯。基於此,文章提出超級智能體——它們既能修改自己的任務執行行為,也能修改生成未來改進建議的過程。這實現了所謂的元認知自我修改(metacognitive self-modification):不僅學習如何做得更好,還學習如何更有效地進行改進。進一步,論文將超級智能體實例化為DGM-Hyperagents (DGM-H)。DGM-H是對DGM的擴展,其中任務解決行為和自我改處理程序序都是可編輯且可進化的,其框架如下:自指性架構:它將“任務智能體(Task Agent)”與“元智能體(Meta Agent)”整合為一個單一的、可編輯的程序。元級進化:在Hyperagents中,“改進的方法”本身也是可以被改進的。這使得系統不再要求任務與修改必須對齊,從而實現了跨領域的“元認知自我修改”。打個比方,在Hyperagents中,運動員不僅在訓練,教練也在學習如何更好地執教。由此,運動員的表現和教練的執教水平不斷螺旋上升。此外,DGM-H還改進了生成新智能體的過程(例如引入持久化記憶、性能追蹤等),且這些元級改進具有跨領域遷移和跨運行累積的特性。實驗驗證:從20%到50%的跨越實驗證明,達爾文哥德爾機(Darwin Gödel Machine)能夠通過修改自身程式碼庫實現持續的自我提升。在SWE-bench上,DGM自動將其性能從20.0%提升至50.0%。在Polyglot上,DGM的性能從初始的14.2%躍升至30.7%,遠超由Aider開發的具有代表性的人工設計智能體。這些結果證明了DGM能發現並實施有效的自我改進。而實現這一點的關鍵在於其開放式進化搜尋策略:通過從現有智能體庫中採樣生成新智能體,DGM能夠平行探索多條進化路徑。性能稍遜的“祖先”智能體在發現新方法和功能方面起關鍵作用,避免了早熟收斂。此外,DGM的改進具有廣泛的遷移性:針對Claude 3.5 Sonnet最佳化的智能體,在切換到o3-mini或Claude 3.7 Sonnet時仍能提升性能。在Polyglot基準中,Python任務上的自我改進同樣提升了Rust、C++、Go等不同語言任務的表現。 (量子位)
這些都假設智能體有無限的擴充能力,但現實生活中都受限,無限分裂的子智能體或許還比較可行?
商湯自研車規AI晶片,發佈!
芯向智行!商湯自研車規晶片破局,領跑智能汽車AI算力新賽道在智能汽車產業全速邁向高階智駕的關鍵階段,車規級AI晶片作為核心“大腦”,成為行業競爭的核心制高點。近期,商湯憑藉多年技術深耕與全端自研實力,迎來重磅產業化突破——商湯科技自研的「STPU 3.0車規級AI晶片」正式實現規模化量產,憑藉頂尖能效比與高性價比優勢,成功打入長城、比亞迪等主流車企供應鏈,鎖定超120萬套域控製器訂單,成為商湯近期最具份量的硬核成就,也徹底打破海外晶片在國內智駕算力領域的長期壟斷,為國產智能汽車產業築牢自主算力底座。這款由商湯完全自主研發的STPU 3.0晶片,核心性能指標堪稱行業標竿,尤其在能效比層面實現跨越式突破,達到400TOPS/W,大幅領先業內主流的輝達Orin晶片,徹底解決傳統智駕晶片算力強、功耗高、成本高的行業痛點。商湯針對智能汽車場景專屬最佳化晶片架構,兼顧高階輔助駕駛、智能座艙、車內外感知等多重需求,在保證極致算力的同時,大幅降低整車能耗與硬體成本,相比海外同類晶片,商湯這款自研晶片具備近40%的成本優勢,既能滿足車企規模化量產需求,又能有效下沉至更多主流車型,讓高階AI算力普惠更多消費者。商湯STPU 3.0晶片的量產落地,並非單純的硬體突破,而是商湯科技全端式AI技術閉環的集中體現。商湯依託自身深耕多年的電腦視覺、多模態大模型與智駕演算法優勢,實現晶片、演算法、域控製器的深度協同最佳化,打破“晶片+演算法”分離的行業常規,打造出一體化智能汽車解決方案。不同於單純的晶片設計廠商,商湯從底層晶片架構到上層智駕應用全程自主把控,晶片可完美適配商湯自研的城區NOA、高速領航、自動泊車等全套智駕方案,感知精度、響應速度與系統穩定性遠超行業通用方案,這也是商湯能夠快速拿下頭部車企大額訂單的核心競爭力。產業化落地層面,商湯這款自研晶片已進入批次裝車階段,相關智能座艙與智駕域控製器產品,逐步搭載於多款熱門量產車型,上半年智能汽車業務收入同比激增213%,成為商湯業績增長的核心新引擎。截至目前,商湯視覺AI與晶片方案累計賦能車型出貨量突破100萬輛,在中國汽車座艙視覺AI軟體市場連續多年穩居份額第一,隨著STPU 3.0晶片的持續放量,商湯在智能汽車領域的市場份額將進一步提升,穩固行業頭部地位。商湯用實打實的量產成果,證明了國產AI晶片完全具備比肩國際頂尖水平的實力,更走出了一條“演算法+晶片”深度融合的差異化賽道。此次商湯自研車規晶片的成功量產,不僅是商湯自身技術實力的重大跨越,更為整個國產智能汽車產業注入強大信心。長期以來,高端車規級AI晶片市場被海外廠商壟斷,國內車企面臨供應鏈受限、成本居高不下的困境,商湯的突破直接填補了國產自主車規AI晶片的高端空白,助力國內車企擺脫海外晶片依賴,實現核心零部件自主可控。同時,商湯依託晶片量產優勢,持續完善智能汽車生態佈局,聯動上下游產業鏈夥伴,推動智駕技術快速迭代,助力中國智能汽車產業邁向全球價值鏈高端。從實驗室研發到規模化量產,從技術突破到產業賦能,商湯始終堅持長期主義與原創初心,一步步攻克核心技術難關。商湯科技此次車規晶片的重磅落地,是商湯深耕智能汽車領域多年的成果結晶,更是商湯從AI演算法廠商向全端式硬科技企業轉型的關鍵里程碑。未來,商湯將持續迭代升級車規級AI晶片,深化與主流車企的合作,拓展更多智駕場景應用,以更硬核的晶片技術、更完善的解決方案,持續領跑智能汽車AI賽道,書寫屬於商湯的硬科技高品質發展新篇章。 (芯榜)一張圖直觀展現商湯2025年度業績:創新高!商湯2025年收入超50億元,半年EBITDA轉正
未來時代,Token就是印鈔機
【原始碼智能前瞻】:Open Claw爆火之後,混元宣佈漲價460%,智譜宣佈漲價100%,阿里雲宣佈漲價34%。漲價的理由都是同一個——“Token呼叫量暴漲”。究其原因,Open Claw發佈後,AI第一次能真正“幹活”,接管電腦、寫程式碼、訂機票、發郵件。隨之,Token消耗邏輯發生了本質變化:以前是問答消耗(幾十Token),現在是任務消耗(幾萬Token),再往後是智能體自主執行消耗(百萬級Token)。中國日均Token消耗半年漲5倍,輝達預測未來幾年年複合增長3000%。中國廠商已經跟上。雲廠商推出一鍵部署,大模型廠商繫結自家模型,硬體廠商做端側Claw,紛紛爭奪Token的入口和定價權。黃仁勳在GTC會議上把資料中心叫作“Token工廠”,提出“每瓦Token數”作為新KPI。意思是:算力不再是賣卡,是賣Token。Token正在從技術概念,變成經濟概念。本文回答四個問題:Token為什麼是計價單位?怎麼消耗?誰在定價?定價和什麼有關?一、Token為什麼是計價單位?(一)什麼是Token?Token是AI處理資訊的最小單元。你問AI一句話,AI回你一段話,這些話在AI模型中都會被拆解成Token。Token數量要看分詞規則,舉個例子,“人工智慧”如果是常見詞,可能直接是1個Token;如果被拆開,可能是“人工”和“智能”2個Token。類比理解,Token就是AI世界的“字節(Byte)”,是模型理解語言的基本單位。(二)為什麼用Token計價?為什麼大模型用Token來計價,而不是按次或按時長計價?如果按次計算,一次簡單的問答和一次複雜的程式碼生成,消耗的算力差幾百倍。如果按時長計價,算力消耗不是勻速的,高峰時段和空閒時段差距太大。用Token計價則解決了以上問題。它是目前能找到的最精確的計量單位,主要原因如下:第一,消耗量與算力直接相關,每生成一個Token,背後都是一次完整的推理計算。第二,消耗量與任務價值正相關。金融業務的token比日常對話的token更具價值。第三,Token可分層定價。廠商可以根據Token的質量定價。Token已經從技術概念,轉變成為反映算力消耗和商業收入的計量單位。以前Token是大模型訓練過程中的副產品。現在成本重心從供給端(訓練)轉移到需求端(推理)。推理是持續的消耗,Token消耗量開始和費用直接掛鉤。二、Token是怎麼消耗的?根據IDC測算,全球Token消耗年複合增長率可達3000%。中國得日均Token消耗已經從2025年中的30兆飆升至2026年2月的180兆,半年增長了5倍之多。Token消耗與任務複雜度直接相關,呈現出明顯的層級特徵:為什麼層級間消耗差異如此懸殊?核心在於AI的“思考”方式發生了根本變化。以o1為代表的推理模型,不再採用傳統的“預測下一個詞”模式,而是在內部生成思維鏈,模型會在回答前進行多步推理、試錯、反思,這些內部過程都以Token形式消耗。Claude Code、Open Claw等智能體框架更進一步。它們將推理能力與工具呼叫結合,實現“思考-執行-驗證”的閉環迭代。一次完整的智能體任務,可能包含數十輪內部推理和外部工具呼叫,單次任務消耗從幾十萬到幾百萬Token不等。以下是不同使用者消耗量級的直觀對比:三、誰在給Token定價?Token從生產到消費,經過四個環節,每個環節的定價權不同。生產層:輝達定義成本基準。它不直接賣Token,但掌握最底層的定價權。黃仁勳提出“每瓦Token數”——在固定電力下,誰能產出更多Token,誰就能賺更多錢。新一代AI計算平台Vera Rubin平台將生成Token成本降低90%,每瓦性能提升10倍。據財報,輝達60%收入來自前五雲廠商。煉化層:模型廠商直接面對供需。國聯民生證券研報指出,當推理消耗變成生產資料,模型廠商有機會把“算力稀缺”通過分層定價轉化為毛利。輝達的分層定價印證了這一點,Token的價值由它能幹什麼決定。分銷層:雲廠商賺管道溢價。3月以來,中國雲端運算產業鏈逐級漲價。優刻得全線漲價,騰訊雲混元漲價超460%,智譜漲20%。但云廠商不只是“二道販子”,它們封裝服務(一鍵部署OpenClaw)、整合生態(阿里串起千問、釘釘、淘寶),賺取溢價和粘性。消費層:使用者用錢包投票。黃仁勳算過一筆帳:“一個研究員每天用5000萬Token,一天7500美元,但對研究團隊來說根本不是問題——因為Token帶來的價值遠超成本。”也就是說,Token的價格由它能創造的價值決定,而非生產成本。這正是Token從技術參數演變為經濟單位的底層邏輯。可以看出,輝達掌握底層成本基準,模型廠商掌握直接定價權,雲廠商掌握管道溢價,使用者用錢包進行價值投票。四、Token定價和什麼有關係?為什麼有的Token貴,有的便宜?成本、能力、供需、場景共同決定Token定價。過去主要由成本決定,現在正向供需和場景傾斜。未來,場景價值會成為主導因素。第一,成本驅動。一個1GW的資料中心,電力是物理上限。誰產出更多Token,誰就能把成本攤薄。中國廠商能打價格戰,靠的就是成本優勢:一度電0.2-0.5元(歐美0.8-1.2元),對應單張B200晶片每年能省900美元。第二,能力分層。同樣是Token,能幫企業做業務的就比閒聊的貴,因為前者價值更大。輝達分層定價正是按能力分層。第三,供需關係。這是最直接的驅動因素。2026年2月,全球前十AI模型Token總消耗量突破27兆,中國貢獻14兆,佔比超50%,一年半漲了1800倍。但是供給端產能緊張,HBM視訊記憶體、先進製程GPU受限,伺服器成本上升。阿里雲、混元、騰訊、智譜漲價,直接原因就是“全球AI需求爆發”和“供應鏈漲價”。第四,場景價值。這是未來定價的主導因素。一個Token用在個人寫周報,價值幾毛錢;但用在金融交易、自動駕駛,價值幾百倍。國信證券指出,推理更看重使用者生態和調度效率,定價權正在從“算力供給方”向“場景需求方”轉移。誰的場景價值高,誰就願意付更高價格。在PC時代,有一個經典的安迪-比爾定律,即硬體提升的性能,很快被軟體消耗掉了,使用者永遠覺得不夠快。智能時代的“安迪-比爾”正在應驗,輝達每18-24個月性能翻倍,但AI智能體瘋狂消耗Token,算力永遠不夠用。Token不再是技術參數,而是經濟概念。印鈔機已經啟動,誰能掌握定價權,誰就能分到最大一塊蛋糕。 (原始碼悟真投研筆記)
不要讓炒作停下來!美光CEO稱,未來智能汽車車均需求300GB記憶體起步
那就未來再說隨著 AI 浪潮席捲各行各業,儲存巨頭美光近日發佈了一份令人驚嘆的財務報告,並對未來的汽車市場拋出了一個大膽的預言。美光 CEO Sanjay Mehrotra 表示,隨著汽車製造商加速引入 L4 級自動駕駛技術,未來的智能汽車最終可能需要搭載超過 300GB 的記憶體(RAM)。目前,大多數現代化車輛的記憶體需求僅在 16GB 左右,這意味著在自動駕駛邁向高級階段的過程中,記憶體容量將實現近 20 倍的跨越式增長。根據美光發佈的最新財報顯示,該公司今年第二季度營收達到 238.6 億美元,較去年同期的 80.3 億美元猛增 200%。這一巨大的業績飛躍主要源於 AI 超算領域對高端 HBM 晶片的瘋狂需求。然而,Mehrotra 認為,下一個支撐儲存行業長期穩健增長的爆發點,就在於那些正在變成“移動 AI 超級電腦”的智能汽車。目前,自動駕駛被劃分為 6 個等級。以特斯拉 Autopilot 為代表的 L2 級系統仍需人類時刻監管。而到了 L4 級,車輛在絕大多數場景下無需人類干預即可完成超車、通過複雜路口等操作。為了支撐這種等級的決策邏輯,車企正紛紛擁抱高性能平台。例如,輝達正與比亞迪、吉利、日產等廠商合作,推廣其 Drive Hyperion 平台,而這類平台對高速記憶體的渴求幾乎是無底線的。這種趨勢也引發了行業對供應鏈的擔憂,因為就在近期,由於高配版 Mac 電腦對大容量統一記憶體的需求激增,甚至導致蘋果公司一度下架了價值 4000 美元的 512GB 版 Mac Studio。業內分析認為,如果車企開始大規模量產搭載數百 GB 記憶體的智能汽車,全球儲存晶片市場可能會迎來新一輪的結構性短缺。美光目前正積極在紐約、日本和新加坡建設“超級工廠”,預計將在 2028 年至 2029 年間投產,並計畫在 2026 年將產能提升 20%。儘管 L4 級自動駕駛的大規模商業化仍受限於法規和成本,但“儲存上車”的浪潮已不可阻擋。我認為美光這番言論炒作成分居多,300GB 這種超大容量記憶體需求可能會出現,但是應該是在研發和試運行階段。真正實現大規模量產,顯然會使用量化模型,包括我們文章之前提到的 MSA 架構,這些都能減少智能模型對記憶體的需求。可能最終實現完全自動駕駛,128GB 應該是足夠了。 (AMP實驗室)
央視《焦點訪談》:“龍蝦”熱的“冷”思考
最近,一款叫“龍蝦”的智能體引發很多人的安裝熱潮。由於它的圖示是一隻紅色龍蝦而得此名。大家還把訓練、使用這款智能體的過程形象地叫作“養龍蝦”。“龍蝦熱”的同時,也暴露出了一些風險,包括工信部在內的一些主管部門連發風險預警。那麼,這只“龍蝦”它能幫我們幹什麼,又藏著什麼風險?記者進行了調查。一場“龍蝦”應用交流活動正在舉行。這個“龍蝦”,不是我們吃的美食,而是一種名叫OpenClaw的人工智慧體。這場活動,就是要看看誰能讓“龍蝦”發揮出更大的作用。“龍蝦”本名OpenClaw。它並非某個公司的商業產品,而是一個由全球開發者共同參與的開源人工智慧體項目,因為其紅色的龍蝦圖示,被戲稱為“龍蝦”。它與過去只能聊天的人工智慧大模型不同,除了擁有聰明的大腦、能思考,還多出了“手腳”,能夠直接操作電腦。它到底長什麼樣?究竟如何幹活?帶著好奇,記者決定找技術工程師親身體驗一次,而工程師的第一個建議就讓記者感到了不尋常:要帶一個格式化的、幾乎全新的電腦過來安裝。北京中關村學院工程師 吳衍標:“安裝了‘龍蝦’之後,它可以查看到電腦裡面的所有檔案,一旦有不法分子想利用這些漏洞,你的這些機密都可能外傳。”為什麼“龍蝦”可以查看電腦所有的檔案?在安裝的時候我們有沒有可能手動限制它的權限呢?記者發現,開放原始碼的原始版“龍蝦”並非能夠一鍵安裝完成,而是需要通過命令列輸入程式碼,技術門檻不低。“小龍蝦”在電腦上自主運行,默認的權限等級很高,這意味著運行它有一定的風險。工程師告訴記者,只有有了這個權限,這個“龍蝦”才具備了幹活的基礎。此外,它還需要有兩部分核心元件:一是需要一個人工智慧大模型,這就像給它安了個大腦,能讓它理解複雜的指令,這在安裝時就會讓使用者進行選擇;二是需要各種各樣的“技能”,賦予它操作具體軟體的能力,也就相當於給它裝上了“手腳”,比如,在告訴了它相關帳戶密碼的情況下,它能自主完成制定旅行計畫並預訂機票、回覆郵件等複雜任務。一隻剛出生的“小龍蝦”,自帶一些基本技能,它能做些什麼呢?記者決定對它進行三項測試。測試一:分類整理電腦桌面檔案記者通過即時通訊軟體向“龍蝦”發出整理電腦桌面的指令,等了幾分鐘後,它告訴記者,已經將電腦桌面檔案分類整理成功。測試二:遠端傳輸檔案並指定路徑儲存記者在手機上傳了一張圖,要求龍蝦將圖保存在電腦桌面的媒體圖片資料夾中。幾分鐘後,資料夾中真的出現了圖片。測試三:修改圖片大小並儲存記者要求“龍蝦”將電腦桌面資料夾中的一張圖片縮小並放入該資料夾,原圖片不動,幾分鐘後,“龍蝦”說新圖片已經存入了資料夾中。任務看似完成了,但“龍蝦”聲稱保留的原圖卻不翼而飛。如此看來,“龍蝦”就像一個還不是特別靠譜的助手,它基於人工智慧大模型,也有和大模型一樣的幻覺犯錯的可能。工程師告訴記者,要想讓“龍蝦”越來越強大,就需要“養蝦”。吳衍標:“第一個方法就是給它越來越多技能、越來越多記憶,讓它更懂你,讓它越來越擁有你的技能,這樣的話,它就能夠做你的事情;二來隨著大模型的發展,它的腦子也會變得越來越聰明。”儘管“龍蝦”還不太靠譜,但也獲得了不少擁躉。在讀博士呂丁陽就花了一個多星期時間養了一隻“科研龍蝦”,賦予了它很多科研技能,專門做材料領域的計算。而從事人工智慧領域研究的何紀言,則花了半個多月時間養了好幾隻非常瞭解自己的“龍蝦助手”,有的做科研,有的幫助管理日常資訊,有的負責整理材料、製作檔案等等。何紀言讓“龍蝦”根據應聘總台員工的特點做一份簡歷。幾分鐘後,這只“龍蝦”就完成了一份製作排版精良的簡歷,還突出了個人的應聘優勢。何紀言坦言,要讓“龍蝦”越來越智能,也需要花錢購買大模型的使用量,也就是所謂的Token,對於頻繁或複雜的任務,這筆消耗確實不小。但這種效率的提升,也讓“龍蝦”迅速出圈,不少地方出現了免費安裝“龍蝦”的熱潮。廣東深圳、安徽合肥、江蘇無錫和常熟等地相繼發佈政策支援“龍蝦”智能體和一人公司的發展,一些政府也部署應用上了“政務龍蝦”,用於公文寫作、民生問答等場景,希望能把基層幹部從繁瑣的事務中解放出來。不過,就在這股熱潮湧向各行各業時,也暴露出了風險,一些高校對“龍蝦”拉響了警報,下了“封殺令”。工業和資訊化部等多個主管部門接連發佈預警,直指OpenClaw存在高危安全風險,明確防範要求與使用者使用提醒,為AI智能體使用劃出安全紅線。一面是熱火朝天的應用,一面又是接連預警,這小小的“龍蝦”裡,到底藏著什麼玄機?中國資訊通訊研究院安全研究所副所長 孟楠:“龍蝦智能體的優勢在於高權限的自主執行能力,它讓人工智慧從能說進化到會做,同時也帶來了一些新的安全風險。”風險一:權限失控帶來的系統被接管的風險專家告訴記者,一旦被駭客利用或者使用者指令不當,“龍蝦”就有可能不加辨別地去執行破壞性操作。比如,刪除我們的核心檔案,把敏感的資料發到網路上,或者在使用者不知情的情況下悄悄安裝惡意的軟體。風險二:網路暴露帶來的攻擊入口風險為了方便,很多使用者會將“龍蝦”智能體管理連接埠暴露在網際網路上,這無異於給駭客開了後門。孟楠:“更危險的是,如果這個智能體還連接到單位內部的網路,就可能成為駭客進行攻擊的跳板,一旦被攻陷,整個企業內部網路都將面臨威脅。”風險三:產品漏洞帶來的可能被利用的風險任何軟體都有漏洞,但在“龍蝦”的高權限加持下,漏洞的危害被進一步放大。而為了讓“龍蝦”具有更多技能,使用者往往會安裝第三方外掛,還會帶來供應鏈風險。孟楠:“我們發現了不少技能外掛被植入了惡意程式碼,使用者在使用這些有毒的技能外掛時,就等於把惡意程序請進了家門,輕則造成資料洩露,重則整個系統被駭客控制。”對於這些隱患,深度“養蝦人”及科技行業人士也坦言,儘管AI智能體是發展趨勢,但普通使用者絕對不能掉以輕心。那麼,普通使用者使用“龍蝦”如何保障安全呢?專家認為,普通使用者屬於安全風險的高發群體,應該審慎安裝“龍蝦”。工信部日前發佈了關於“龍蝦”的“六要六不要”安全指引,涵蓋了權限控制、網路隔離、技能外掛使用等關鍵環節。3月22日,國家網際網路應急中心、中國網路空間安全協會聯合發佈了“龍蝦”OpenClaw的安全使用指南,面向普通使用者、企業使用者、雲服務商以及技術開發者等,提出安全防護建議。其中,對於普通使用者的建議包括:使用專用裝置、虛擬機器或容器安裝OpenClaw,並做好環境隔離,不宜在日常辦公電腦上安裝;不將OpenClaw默認連接埠(18789\19890)暴露到公網;不使用管理員或超級使用者權限運行OpenClaw;安裝可信技能外掛;不在OpenClaw環境中儲存、處理隱私資料;及時更新OpenClaw最新版本等。儘管現在各主管部門不斷在提示“龍蝦”安全風險問題,但從長遠來看,專家認為,要解決“龍蝦”的安全問題,更需要從標準、技術、生態多方面著手。孟楠:“建議始終堅持統籌發展和安全,在鼓勵和促進創新的同時,針對不同場景做精準分類施策,確保安全可控。需要盡快制定相關標準規範來引導各類主體規範應用新技術,引導鼓勵網路安全企業研製相關的環境隔離、智能攔截、行為審計等安全產品和服務。建立包括智能體提供者、安全企業等主體在內的相關主體來協同治理生態。”我們看到,有不少人都希望盡快掌握和利用智能體提升效率、滿足需求,一些企業也開始嘗試使用。對於像“龍蝦”這樣的新事物,我們需要鼓勵,需要為技術創新留足試錯的空間,避免束縛產業發展的活力;但同時,面對爆火的“龍蝦”,我們也需要有一些冷思考,守住安全底線,防範風險擴散失控。也就是說,技術創新和安全監管協同推進、良性互動,我們才能更好地和AI共舞,推動人工智慧高品質發展。 (中國信通院CAICT)
App將逐漸消亡,然後呢?
當“龍蝦”長出身體每隔一兩個小時,張鈸就會收到一句語音提醒:“該喝水了!”發出提醒的,正是他的私人“助理”。助理還會幫他承擔複雜的檢索工作,並事無鉅細地提供每一步檢索過程、遭遇的困難和對應結果。“我讓它針對今年全國兩會中關於人工智慧的提案做深度調研,它先檢索中文資源,再去查英文資料。”所有人都能猜到,這位盡職盡責的“助理”,就是最近火爆全球的“龍蝦”。張鈸是中國科學院院士、清華大學人工智慧研究院名譽院長。兩周前,他在自己的電腦上安裝了一隻內測的“澳龍”(AutoClaw),這是一款由智譜開發的國產版“龍蝦”,可在本地一鍵部署。作為GPT的90歲高齡資深玩家,張鈸對《中國新聞周刊》表示,以“龍蝦”為代表的AI智能體(Agent)與傳統大語言模型的本質區別,是GPT只會回答問題,Agent則會執行任務,而且會把執行的整個過程一步步展示出來。與DeepSeek引發的上一輪全民技術狂歡相比,“不僅會說,還能做事”的“龍蝦”似乎在普通人中點燃了更大的熱情,但很快,曾經千人排隊安“龍蝦”的名場面,就變為爭相購買鹹魚上的“99元安全解除安裝龍蝦服務”。“整個市場在漸趨理性。”平凱星辰副總裁、原阿里雲副總裁劉松對《中國新聞周刊》說。一個由人類與Agent共同生活、工作並建構社會的“龍蝦”時代,會引發怎樣的技術革命與社會變革?Agent進化的終極形態是什麼?當前發生的一切,真的是人類抵達通用人工智慧(AGI)的關鍵一躍嗎?AI插畫/adan“意義比DeepSeek更重大”“能力不穩定是最明顯的感受。”劉松同時養了四隻“龍蝦”,分別來自Kimi、MiniMax、飛書和智譜。在使用兩周後,他發現,“龍蝦”的強大主要體現於三種能力:一是本地部署,這意味著它可以直接操作個人電腦環境;二是永久記憶,能記住上下文和任務歷史;三是可以隨時建立和獲取Skills,也就是Agent在執行任務時能呼叫的一切“能力”或“工具包”。劉松認為,本質上,模型能力決定著“龍蝦”的智力,呼叫工具的能力則體現出它的執行力,也就是“模型+呼叫”。多位受訪的AI從業者指出,目前,大語言模型在不同領域的“聰明程度”仍有差異,特別是國產大模型,有的模型擅長程式設計與資訊蒐集,有的模型擅長中文處理。受模型能力影響,“龍蝦”在執行任務時經常會被“養死”,比如任務中途“卡住”或在兩個步驟間無限循環;有時同一個任務,多次運行結果差異卻很大,或需要反覆嘗試多次才能完成。當任務步驟很多時,“失憶”也很常見。“有點像找了一個很勤奮的實習生,但有時工作完成的質量只有60分,你還得親自去幫他收場。”劉松形容。清華大學智能產業研究院首席研究員、前阿里巴巴人工智慧實驗室北京負責人聶再清認為,當前的“龍蝦”更像是一個技術雛形。他對《中國新聞周刊》說,在現有模型能力下,Agent雖然能在開放環境中自主規劃行動,但對於現實世界規則的理解仍然有限,在很多場景下,依然需要依賴人類持續參與。因此,在未來很長一段時間,人機協作仍是完成任務的主要模式。事實上,在太平洋的另一頭,這只最早從矽谷極客圈開始走向全球的“龍蝦”OpenClaw,只是一位奧地利創業者的“周末項目”,更接近一個實驗框架,遠非成熟產品。創業者叫彼得·施泰因貝格爾。很多開發者後來分析,OpenClaw的成功在於它抓住了一個重要的時機:大模型的程式設計(coding)能力已進化到了足夠驚豔的水平,Agent現在終於可以擁有一顆聰明的“大腦”了——雖然站在使用者的角度,這或許還不夠。整個2025年,OpenAI、Google等大模型領域的前沿競爭者相繼推出了以程式設計為強化方向的模型升級。其中,最有影響力的一款產品是Anthropic於2025年2月發佈的Claude Code,很多開發者將其視為Agent時代的真正開端,認為它可以像軟體工程師一樣完成完整的工作流程——從理解需求、拆解任務,到生成程式碼、測試並修改錯誤。但真正在全球火起來的卻是OpenClaw,為什麼是它?張鈸認為,原因有兩個,一是開源;二是第一次在數字世界裡打造了一個相對完整的通用Agent系統框架,能呼叫各種資源,也可以接入即時通訊軟體的入口,可玩性和擴展性都很強,也很適合二次開發。作為中國AI領域的核心奠基人之一,張鈸見證了人工智慧40多年來的潮起潮落,他在接受《中國新聞周刊》採訪時指出,過去的人工智慧只能在特定領域、使用特定模型去解決特定問題,大語言模型帶來的最大突破,是在語言領域實現了一定程度的通用性。以OpenClaw為代表的智能體則更進一步,讓模型具備了行動能力,甚至可以根據使用者的特點提供個性化服務,這就意味著人類向AGI又邁進了一步。有學者稱,“龍蝦”誕生的意義比DeepSeek更加重大。“無論如何,這是一個很好的起點。”聶再清說,目前的Agent產品還處於早期,要想大規模進入公眾的日常生活和工作,除了性能穩定性需提升以外,安全風險問題也亟待解決。需要進一步明確一點,“龍蝦”強大的執行能力有一個前提:授予真實權限。張鈸說,Agent要想玩得好,人類必須“放權”,允許它呼叫電腦裡的檔案、查閱郵件、登錄社交帳號並行送資訊,但這個過程中也可能造成嚴重的隱私洩露。正是出於對安全風險的擔憂,他幾乎沒給“龍蝦”任何授權。“我很謹慎,尤其擔心被駭客攻擊,因為機器比人更容易被欺騙與誤導。”聶再清進一步解釋,現階段“龍蝦”產品之所以會帶來資訊安全風險,是由於Agent在執行任務時需要呼叫外部大模型進行推理,人們常說的API就是指呼叫資源所需的“介面”,接入外部API後,也就意味著使用者本地的資訊可能被上傳到外部系統進行處理,如果系統在判斷那些資訊可以傳送、那些資訊不應傳送方面缺乏足夠能力,就可能導致敏感資料被意外暴露。他強調,下一步,安全與責任機制將成為關鍵議題,Agent服務提供商應對系統行為承擔責任,監管部門也要深度參與規則制定。劉松對Agent的安全問題持樂觀態度。他所在的企業平凱星辰是一家開源分佈式資料庫提供商,對資料安全的本質看得更清楚。他認為,這類安全風險並不是“龍蝦”獨有的問題,而是一個更廣義的資料安全與權限管理問題。關鍵在於如何為“龍蝦”設定清晰的權限邊界,例如明確那些資料可以訪問、那些操作必須人工確認,以及在關鍵節點設定多重確認機制。“就像電腦刪除檔案時需要二次確認一樣,Agent在執行可能帶來不可逆後果的操作時,也應該觸發提示和稽核流程。這沒有什麼技術挑戰,企業級安全解決方案很快會走向成熟。”上圖:3月11日,在中國(南京)軟體谷“質能·工坊”OPC社區,技術人員安裝完開源AI智能體“龍蝦”後與使用者(左)交流。圖/新華下圖:3月16日,廣東珠海市以“賦能政企數字員工,落地智能行為執行”為主題的OpenClaw AI技術沙龍中心。圖/視覺中國“App會逐漸消亡”“龍蝦”在全球的擴張速度比人們想像中要快。2025年12月,OpenClaw在GitHub上的關注度還很低,80多天以後,OpenClaw在GitHub上的收藏量已達到25萬,成為這個開源社區歷史上增長最快的項目之一。奇安信在3月16日發佈的國內首份《OpenClaw生態威脅分析報告》中揭示了一組驚人的數字:全球四大主流Skills分發平台上的Skills總量已逼近75萬,每天新增數量高達2.1萬個,按照此趨勢,僅需一年時間Skills總量將突破800萬。為了接住這波流量,騰訊、阿里、百度等大廠幾乎在幾天之內就緊急上架了自己的“龍蝦”。業內人士普遍認為,Agent很可能會成為下一代“移動網際網路”。“或者更直白地說,成為下一個入口。”聶再清說。設想一個這樣的場景:你要進行一場為期7天的大理旅行,你點開手機螢幕,無須打開攜程、12306、飛豬等不同App,只要對著手機,把你的需求清晰地表達出來,一個生活類“龍蝦”就“一站式”幫你完成訂票、購物、資訊檢索、小眾行程規劃等所有任務,原本的App成了Agent的Skills。劉鬆解釋,由於“龍蝦”能夠便捷地跨應用呼叫服務,隨著使用者對Agent的依賴性上升,個人手機上的App會逐漸消亡,或是被“折疊”到後台,新的入口將轉移到Agent平台。他推測,經過三五年洗牌後,未來以Agent為核心的AI產業競爭很可能進一步走向寡頭格局。“因為在‘龍蝦’時代,勝出者必須同時擁有大模型能力、算力、資料和使用者規模等多重資源,競爭門檻相當高。相比之下,一些缺乏AI技術能力或算力基礎的網際網路企業,特別是一些單純的社交類平台,未來可能更多成為被呼叫的服務節點。”他說。不過,即使“龍蝦”穩定性進一步提升,Agent可以取代一些生活類App去自動完成規劃,在一些關鍵節點仍需與使用者確認中間結果。劉松認為,傳統App的優勢就在於,每一步操作都可以被使用者選擇和追溯,但Agent全方位接入後,使用者可能失去這種精細化控制能力,“就像從手動擋變成了自動擋的演進”。他建議,在未來“龍蝦”手機裡,仍可以保留某種“中間介面”,至於其具體形態,則可以進一步探討,未必一定是以App的形式。3月13日,廣東深圳深元人工智慧聯合MetaEra與iPollo在深圳華強北全球人工智慧應用場景中心舉辦“全球首家OpenClaw線下展示”活動。圖/視覺中國“一場人機互動革命將開啟”毫無疑問,以“龍蝦”為代表的新一代Agent技術,即將開啟一場人機互動革命。目前,業界基本達成共識,未來的人機互動是以語言為核心的“自然互動”。張鈸認為,與傳統的文字互動相比,自然語言具有明顯優勢:它不依賴複雜操作,也不受使用者教育水平的限制。聶再清認為,除語言之外,視覺乃至各種環境訊號未來都可能成為輸入方式,互動形態會更加多樣化。與此同時,人機互動的雙向性會明顯增強,Agent不僅能執行任務,也能在理解使用者目標的基礎上主動提出建議。“專屬於你的Agent助手會一直跟著你,瞭解你的個性與習慣,幫你在海量的資料中尋找最優解,通過人機協作來共同解決問題。”在這樣的未來圖景中,從硬體端來看,張鈸認為,人機互動也將不再侷限於電腦或手機螢幕,“任何終端裝置都可能成為入口,手錶、眼鏡、戒指、智能家具等,使用者可以隨時通過自然語言與AI互動”。這樣的未來或許不需要等待太久。劉松推測,最多三到五年,人類就會進入“多Agent並存”時代,個人裝置上可能同時運行很多私人“助理”,例如工作Agent、生活Agent、學習Agent等。每個人的“數字員工”分工有序,隨著這種模式逐漸成熟,人與智能體之間,以及不同智能體之間都會形成新的協作網路。在這樣的協作網路中,Agent還會重塑人類的工作方式與就業結構。張鈸認為,AI的發展並不只是效率工具的升級,更會改變人與機器之間的分工結構。未來,機器將承擔更多執行性工作,人類的角色逐漸轉向提出目標、分配任務並對結果進行判斷。而勞動力市場則會演變成不平衡的“啞鈴型結構”:人類向兩端集中,一端是高端的創造性和決策性工作,另一端是非常低端的體力勞動,大量中低端的事務性崗位被Agent系統替代。“甚至更簡單點說,凡是坐在電腦前處理資訊的工作,都會受到影響。”劉松說。他所在的企業目前有大約300名技術研發人員,本來今年還要再招人,但隨著Coding Agent的到來,招聘計畫又重新規劃了。當人類的社會結構被Agent深刻改變,Agent與Agent正在組成新的社會結構。在只有Agent可以分享、討論和點讚的社交平台Moltbook,一項2026年2月發表的研究深入分析了Moltbook上14490個智能體發佈的39026個帖子和5712條評論,研究者吃驚地發現,雖然18.4%的帖子包含行動誘導語言,但大多數在網上“衝浪”的Agent,在社交平台上卻沒有出現人們設想中的極端情緒,不僅很少見到惡意回覆,還會有Agent善意地在極端帖下提醒廣大“Agent友”要警惕這些帶有風險的言論,也就是說,即使在沒有人類監督的情況下,由Agent構成的社會系統似乎也湧現出一定的社會秩序與規範。劉松分析,由於Agent的行為模式建立在對人類知識和語言資料的學習之上,其看似理性的反饋,很大程度上是對人類已有規則和經驗的再現與強化。與人類不同,Agent並不存在真實的情緒和慾望,因此在某些社交場景中反而顯得更加客觀和克制。他認為,當前階段討論“Agent社會”的自主性風險仍為時尚早,更值得關注的是,這種由演算法驅動的數位化社會形態,是否會反過來影響人類對規則、秩序與理性的理解。“Agent社會就是人類社會某種意義上的鏡像。”以“龍蝦”為代表的新一代Agent技術,即將開啟一場人機互動革命。AI插畫/adan當“龍蝦”長出“身體”Agent進化的終極形態是什麼?在眾多大廠部署“龍蝦”的熱鬧之下,近日,維他動力的一條新聞被很快淹沒:機器狗“大頭BoBo”宣佈接入OpenClaw,讓Agent首次具身化,有網友戲稱,活體“大龍蝦”終於來了。張鈸指出,Agent與機器人合體之後,就相當於給它裝上了“大腦”。在他看來,當擁有“大腦”的機器人開始在真實的物理世界中執行更多複雜任務,可能推動人類加速走向通用人工智慧(AGI)——雖然,人類距離這一終極目標還有很遠的距離。劉松認為,“Agent+機器人”的融合仍處於初級階段。目前,Agent的核心優勢仍在於大語言模型的推理與規劃能力,可以理解和處理數字世界中的任務,而非直接應對複雜的物理環境。也就是說,機器人如果僅僅基於“大語言模型”有了“大腦”,本質上仍是把語言模型的輸出對應為具體動作執行,但不足以支撐複雜場景中的自主決策。要想讓“龍蝦”真的長出“身體”,缺失的關鍵一環是感知能力。張鈸解釋,感知能力是人工智慧走向現實世界的關鍵前提。與數字環境不同,物理世界高度複雜且持續變化,如果缺乏強大的感知系統,機器就無法理解環境變化,並據此作出決策。“從Agent實際工作的表現來看,只有微小感知,也就是小範圍的閉環反饋能力,主要以語言模型中常用的人類獎懲機制來推動,缺乏主動對做過的事情自我反思、自我改進並持續自我學習。這就需要建構一個來自外部環境的真實反饋機制。”但問題是,想讓一輛無人車學會規避路障,不可能真的讓人開著它在現實世界積累“車禍”經驗,於是,AI研究人員提出了“世界模型”的構想,類似於設計一種“真實世界模擬器”,可以讓無人車在模擬世界中進行學習與決策。深度學習“三巨頭”之一的楊立昆就將“世界模型”視為通往高階人工智慧的關鍵路徑,強調AI必須學會表徵、預測和規劃物理世界。通俗地說,大語言模型擅長回答“下一個詞是什麼”,而世界模型要回答的是:“下一秒會發生什麼。”Google在2025年推出Genie 3時就宣告要朝著更通用的互動式世界模型邁進。輝達也明確把“世界基礎模型”定位為機器人和自動駕駛的物理AI底座。但總體而言,“世界模型”在過去幾年並沒有明顯的技術突破。張鈸分析,要想建構儘量接近真實世界的環境,就需要海量高品質的現實世界資料,但資料的獲取難度非常大。“建立通用的世界模型目前是不大可能的,只能針對某一具體垂直場景建造模型,最典型的就是自動駕駛。”多位受訪者指出,如果“世界模型”能將“感知—決策—執行”的閉環徹底走通,就看到了具身智能的希望。從技術演進的長期趨勢來看,Agent與機器人融合,是AI發展的必然趨勢。也就是說,Agent在未來的終極形態一定是擁有“身體”的Agent,不僅能理解語言,還能理解物理世界的運行規律。更進一步說,未來的Agent更像一個同時擁有很多“肉身”的智能中樞。聶再清認為,在Agent向著具身智能演進的過程中,智能化的物聯網也將成為關鍵基礎設施,“只有在更多裝置被連接之後,Agent才會具備更強的環境理解與控制能力,這些延伸出去的‘感知器官’與‘行動肢體’共同構成一個完整的貫通數字世界與物理世界的智能系統,這一感知與反饋閉環的成熟,正是人類通往AGI的核心驅動力”。 (中國新聞周刊)
AI眼鏡:下一個將爆發的超級應用
AI眼鏡是以第一人稱視角拍攝記錄生活、分析生活的穿戴裝置。AI眼鏡帶來新的互動方式,大模型整合到AI眼鏡上,方便即時語音、文字互動,有了它,以後可以不用再經常掏手機、戴耳機了。AI大模型還停留在對話階段,AI真正的商業價值兌現,還缺一個能把技術與生活場景強行錨定的物理入口。要讓AI進入“iPhone時刻”,本質上需要硬體載體的一次更替。未來AI眼鏡可能會接棒智慧型手機,成為重塑人類生活的物理入口,下一個將爆發的超級應用。正如Meta創始人祖克柏所言:“AI眼鏡將是智慧型手機之後的下一個重大計算平台,因為它們能以前所未有的方式將AI融入日常。”它不僅是穿戴裝置,更能讓AI進入“iPhone時刻”。馬斯克說AI最終將成為人類認知的延伸。AI眼鏡正是這一預言的具象化,未來它會通過多模態感知,接管使用者的視覺與聽覺。在這場全球競速中,Meta脫穎而出,以Meta-RayBan眼鏡為代表的AR路徑,憑藉極致輕量化與雲端協同,成功引爆了全球大眾對AI眼鏡的消費熱情。中國企業也正展現出驚人爆發力。雷鳥、Rokid、小米等品牌憑藉供應鏈優勢與極致的研發迭代速度,加速佔領全球AI眼鏡市場。未來,AI眼鏡的出現,將推動AI進入“主動智能”時代,通過監測眼動追蹤、生物訊號與環境聲場,AI眼鏡將把原來的AI從被動響應,轉向主動預測使用者的需求、主動為使用者服務。從技術上看,AI眼鏡需要解決的是性能、重量與續航的“不可能三角”問題。並且,AI眼鏡時代,比的不僅是硬體,還有AI原生內容生態。誰能率先定義AI時代的原生互動,誰就將引領下一個十年。1AI眼鏡:三大應用場景AI眼鏡的終極價值,在於它通過“第一視角感知、雙手解放、即時增強”三大核心能力,解決了智慧型手機無法觸達的深層痛點。正如馬斯克所預言,AI將成為人類認知的延伸,AI眼鏡正是這一預言的具象化。第一大功能:認知增強,消解資訊鴻溝,體外大腦AI眼鏡能夠即時翻譯與社交破冰。比如在商務或跨國旅行場景中,AI眼鏡能實現視線內同傳。通過微型顯示模組,對方的語言會即時轉化為字幕呈現在鏡片上。再比如,AI眼鏡能輔助使用者記憶,在社交場合即時提醒對方的姓名與職業背景,消除溝通成本。AI眼鏡能當萬物百科,和使用者即時互動、幫助決策。比如當使用者盯著一件商品,多模態AI能自動檢索價格、比價,還能自動檢索商品的評價;使用者看一棟建築時,AI眼鏡直接幫助即時搜尋歷史背景。這種所見即所得的資訊獲取效率提升,從過去的分鐘級縮短至秒級。第二大功能:生產力解放,重塑辦公、協作。AI眼鏡能虛實融合。比如在駕駛、維修或手術等雙手受限的場景下,AI眼鏡提供AR導航與即時標註。例如,導航不再是二維地圖,而是直接顯示在真實路面上的引導箭頭;工業現場的遠端專家可以通過一線員工的眼鏡視角,直接在視野中進行3D拆解指導。AI眼鏡能智能紀要、資訊回溯。未來,它是最完美的會議助理。AI眼鏡能自動記錄對話並生成結構化摘要。比如,使用者詢問“上周開會老闆提到的那個關鍵資料是多少?”眼鏡可以即時從端側儲存的會議視訊、紀要中調出對應片段。第三大功能:增強記錄、生命歷程全量數位化AI眼鏡當下最吸引大眾的功能是無感記錄、參與式拍攝。它解決了手機拍攝帶來的參與感缺失。戴著眼鏡,就能通過第一視角錄製,使用者可以在抱孩子、寵物、運動或婚禮現場,無需舉起手機,就能以最自然的姿態記錄下最真實的瞬間,實現“參與即記錄”,也不會因為舉著手機記錄打擾別人。AI眼鏡還能為視聽障礙人群提供數字補償、技術有了人文關懷的溫度。AI通過識別紅綠燈、避障物或親友面孔,通過耳機即時講給視障使用者;或將環境聲場轉化為視覺提醒,讓技術真正具備溫度。2AI眼鏡:科學原理和技術路線AI眼鏡的底層科學原理是互動維度的升維。因此,AI眼鏡必須涵蓋光學、顯示、晶片、感測器、儲存等多個技術環節,以實現多模態互動。比如,使用者可以通過眼動(虹膜識別追蹤、注視選擇)、手勢(隔空拖曳窗口、捏合手指放大3D模型等)直接與虛擬對象互動,提升真實跟虛擬世界的互動效率。AI眼鏡的路線之爭,行業主要分化為兩條路:一是Meta代表的增強現實AR走的是減法邏輯,側重日常隨身;二是蘋果代表的混合現實MR走的是加法邏輯,追求虛實不可分的極致體驗。AR路線是典型的實用主義,核心是資訊覆蓋。它的硬體配置極其克制。換取的是接近普通眼鏡的重量和更長的續航。這種方案把性能預算幾乎全花在了呼叫AI模型上,通過“輕端側、重雲側”的配置,讓使用者能戴著它走上街,是目前商業化阻力最小的路徑。這一類以Meta-Rayban為代表。Meta的路徑是追求現有物理約束下的最優解。它把眼鏡看作一個“感測器觸角”,只負責低功耗的喚醒與基礎感知,比如捕獲基礎的視覺和語音訊號,而計算任務外包給手機,把需要深度理解的大模型任務掛載到雲端。還有互動腕帶,通過捕捉前臂肌肉的微弱電訊號來識別複雜手勢,實現了接聽電話、空中寫字輸入等非視覺依賴的互動形態。這種分佈式架構犧牲了一定的離線處理能力,但換取了全天候佩戴的可能性和低的使用門檻,比如Ray-Ban Meta第二代重量與普通墨鏡非常接近,整機重量約為48–50克,是目前更符合商業普惠邏輯的路徑。MR路線則追求的是空間重組。相比於AR的透明鏡片,MR是通過高解析度攝影機把現實場景拍下來,再重新渲染給使用者看。為了實現這種虛實不分的視覺一致性,MR必須在端側塞進高性能晶片和大量深度感測器。這種方案雖然互動精度極高,但代價是重量過載、成本飆升。代表就是蘋果Vision Pro的空間計算。本質上是追求物理意義上的空間重建,做加法。它把幾乎所有的算力、感測器和建模任務都放在眼鏡端,通過R1和M2雙晶片強行在本地把現實世界像素化。這種方案直接用一套複雜的硬體系統,多感測器,來換取毫米級的互動精度。比如,蘋果為R1晶片接入了17個感測器和6個麥克風來達成多模態感知,實現空間計算。但這帶來的代價就是高昂的售價、驚人的功耗以及無法擺脫的佩戴負擔。總的來看,AR通常只需要基礎的攝影機和慣性單元,計算任務大量甩給雲端,光學方案追求的是輕薄的光波導。而MR則必須配備多目攝影機和雷射雷達來實現環境建模,且所有計算必須在本地完成以降低延遲。這種重裝化的硬體架構,決定了MR現階段很難擺脫室內生產力工具的定位,總的來看,AR則更有機會成為下一個十年的主流AI眼鏡技術路徑。3 AI眼鏡:輕量化、提升顯示效果、多模態和更智能AI眼鏡產業整體正朝著輕量化、提升顯示效果、多模態和更智能的方向演進。AI眼鏡上游核心由主控SoC、光學模組和顯示單元構成。晶片廠商需提供整合NPU、ISP及低功耗通訊的系統方案。比如高通驍龍AR1 Gen 1已大規模商用,成為Meta等首選;恆玄科技BES2800憑藉6nm製程和多核架構,在語音識別與健康監測上形成差異化。光學與顯示技術直接決定了AI眼鏡的體積、畫質與功耗。比如光舟半導體的單層玻璃衍射光波導已獲Rokid等採用,實現了全彩顯示與輕薄鏡片的平衡。JBD上海顯耀顯示的蜂鳥MiniⅡ光引擎體積僅0.15cm³,配合光波導可實現約8000尼特入眼亮度,確保戶外強光成像清晰,現在有全球近50款智能眼鏡用它的顯示方案,包括Rokid、阿里、雷鳥、Meta等。中游環節由代工廠商與品牌廠商協作完成整機交付。歌爾股份、立訊精密等憑藉精密製造能力支撐大規模量產。品牌方則分為四類:Meta、蘋果等巨頭,Rokid、XREAL等AI眼鏡原生企業,華為、小米等手機廠商,以及阿里、百度等網際網路AI生態大廠。下游落地的關鍵在於平衡顯示效果、算力分配與多模態互動。光學顯示方面,目前“光波導+MicroLED”是公認的終極路徑,在雙目沉浸式觀影、巨幕類AR眼鏡中,BirdBath 仍是當前成本最低、出貨量最大的過渡方案,而輕量化時尚型AI 眼鏡則普遍採用光波導,代表行業長期方向。比如Meta Ray-Ban眼鏡就是2025年首次加入右眼單眼顯示,用的是幾何光波導技術。算力架構正演進為“端雲協同”。端側4nm、5nm先進製程處理即時資料,雲側負責複雜語義理解,核心挑戰是在嚴苛散熱限制下提升本地AI算力。多模態互動讓AI眼鏡從被動響應轉向主動情境感知。裝置通過融闔眼動追蹤、環境聲場、生物訊號,可實現自動增強對話人聲、智能紀要等主動服務。這要求整機重量必須向下突破,並解決散熱與屈光度相容等工業設計難題。AI眼鏡的競爭已從單點技術突破轉向系統級的整合最佳化。未來的勝者將是能在流暢性、有用性與長時佩戴舒適感之間找到最佳平衡點的廠商。4 AI眼鏡:引領進入“主動智能”時代,AI工具會更適應人未來AI眼鏡有望成為繼手機之後的下一代個人計算平台。長期看,能解決三個層面的痛點。一是大幅度提升互動效率。未來有了AI眼鏡,互動入口的改變完全改變了效率,使用者無需掏出手機,第一視角即時獲取資訊,實現所見即所得。二是場景融合,過去大家認為,虛擬世界的AI依賴大模型,物理世界AI依賴機器人,而AI眼鏡的出現,其實是完美融合了虛擬世界AI和物理世界AI。AI眼鏡能夠讓虛擬資訊與現實世界無縫疊加,打破數字與物理的邊界,實現AI能力與應用場景融合。三是AI眼鏡將“AI專家級技能”轉化為底層外掛,重點是隨身攜帶,直接賦能。無論是B端的工業維護、複雜手術,還是C端的語言同傳、生活百科,使用者無需漫長的學習周期,即可在AI的即時指引下完成專業任務。隨著多模態大模型對環境感知的加深,AI眼鏡將推動人機互動進入“主動智能”時代。過去是使用者下指令給AI,AI再回覆,這是一種偏向於被動響應。未來是使用者不再需要學習如何操作眼鏡,而是眼鏡主動理解使用者並預判需求,AI眼鏡通過監測眼動追蹤、生物訊號與環境聲場,預判使用者需求,更加偏向於主動服務。互動範式將進一步從“人適應工具”向“工具適應人”轉變。5 未來展望:未來誰來引領AI眼鏡時代AI眼鏡發展面臨的核心挑戰在於:消費級AI眼鏡整體仍面臨從“興趣產品”到“大眾必需品”之間的斷層。C端付費意願偏低的核心瓶頸主要在兩方面:一方面,應用生態欠缺,由於AI眼鏡從AR產品基礎上升級而來,除大模型功能外,缺少豐富的原生AI應用,實用性難超越“手機+大模型”。另一方面,AR路線的互動方式還不夠自然,因硬體條件受限,基於AR技術的AI眼鏡的操作使用複雜,學習成本有待進一步降低。未來誰來引領AI眼鏡?關鍵在於誰先引領AI眼鏡的原生內容生態,未來部分中國品牌在此領域有可能實現跨越式發展。一是國內消費電子市場的優勢,不僅使用者基數大,而且創新技術接受度高。根據德勤調研,2024年中國消費者對AI、AR/VR產品的興趣度高達73%,超過美國的58%。二是供應鏈和產業優勢,集合了全球消費電子產品供應鏈的中上游,珠三角和長三角地區產能佔全球70%,2025年Q1中國智慧型手機品牌在全球市場份額超過1/3。三是技術迭代快,得益於市場擁抱新興技術疊加產業鏈完整,中國廠商的新品研發和改進升級周期短。根據波士頓諮詢,中國廠商的綜合研發周期在6-8個月,而美國品牌在12-18個月。回顧過去,智慧型手機行業的發展歷程展現了全球科技產業的區域轉移和動態演進。2007年蘋果推出的iPhone開創了互動新時代,其iOS生態系統和App Store模式也重塑了行業標準。而近年來,全球市場呈現出多元化競爭。在移動網際網路的商業模式創新方面,中國企業在移動支付、短影片等數字服務領域也有顯著突破。從硬體技術演進上看,從折疊屏到AI晶片,全球產業鏈、尤其是部分中國公司正在大力度推動創新。AI眼鏡,這一新興賽道尚未形成絕對領導者,技術路線、應用場景和區域市場的多元化,使得任何具備核心技術突破或生態整合能力的企業都可能重塑未來的行業格局。6 全球AI眼鏡主要玩家6.1 Meta:全球AI眼鏡消費市場頭號玩家Meta目前在AI眼鏡的佈局上,同時推進兩條技術路線,但資源分配和優先順序已出現分化。路線一是AR+AI智能眼鏡。這是Meta2025年的核心增長點,資源已全面向該領域傾斜。代表產品是Ray-Ban Meta、Oakley Meta AI產品。其中,Ray-Ban聯名款憑藉AI識物和語音互動成為爆款;而Oakley Meta AI則憑藉3K視訊錄製、超長續航和專業運動監測成功切入高端性能市場。根據Wellsenn XR資料,2025年增強現實類的AI眼鏡全球銷量746萬台,Meta旗下品牌Ray-Ban、Oakley出貨量超600萬台,份額佔比約80%,已成為Meta觸達大眾市場的入口。產品售價方面,Ray-Ban Meta均價約300-329美元,加上2025年底上市、單價更高的Oakley Meta AI,499美元起。路線二是MR混合現實、VR頭顯。Meta將其定義為“生產力與沉浸式體驗”工具,但目前正面臨硬體輕量化趨勢的挑戰。代表產品是Quest 3、Quest 3S、Quest Pro。2025年出貨量約220萬台,同比下滑10%以上。目前Meta已經減少了對此類產品的廣告投入,將其定位從“移動計算未來”調整為“高性能遊戲、辦公終端”。Meta Ray-ban是目前最為成功的AI眼鏡。為何它能成為爆款?核心優勢是極致的輕量化,它一開始就保留了傳統眼鏡的形態,使用者全天候佩戴無負擔。配合Llama4的多模態能力,實現秒級互動。雖然受限於物理體積,其端側算力在暗光、動態變焦及超長續航上仍有侷限,比如錄製掉幀等問題依然存在,但全天候佩戴舒適度+隨身AI助手,切中了大眾需求。比如通過指令“HeyMeta”喚醒,眼鏡通過前置的高畫質攝影機捕捉畫面,並將圖像資料上傳至雲端的Llama4模型進行理解,AI模型會在1-2秒內通過隱藏式定向揚聲器將答案直接說給使用者。二是合作模式創新,雷朋(EssilorLuxottica依視路陸遜梯卡)與Meta的深度共生,分工明確。雷朋負責極致的工業設計、鏡框工藝以及全球數萬家線下門店的管道鋪設,Meta則負責軟體生態、AI演算法及定製化晶片。調研顯示超過60%的購買者是因為雷朋品牌而進店,隨後被MetaAI的功能留存。作為製造方,依視路2025年第三季度財報顯示,集團營收增長中有4個百分點以上直接由智能眼鏡業務貢獻。三是全面的光學支援。提供定製服務,近視、散光及老花使用者可直接根據驗光單配鏡。提供經典的墨鏡鏡片及偏光鏡片,另外,智能感光是2026年最主流的選配方案。鏡片可隨紫外線自動調節顏色,室內為全透明AI眼鏡,室外變為專業墨鏡。6.2 雷鳥:中國AI眼鏡代表企業中國AI眼鏡企業表現活躍。雷鳥和Rokid兩家中國企業從AR賽道起家,通過差異化戰略快速崛起,已成為AI眼鏡行業的核心玩家,有潛力成為該領域的"DeepSeek"。雷鳥2025年1月發佈對標MetaRayBan的雷鳥V3 AI眼鏡,定價2000以下;2025年5月發佈量產級彩色MicroLED光波導AR眼鏡雷鳥X3 Pro,定位高端,價格8000以上。市場表現方面,雷鳥創新2025年上半年國內AI AR眼鏡市場份額達39%。其X3 Pro通過自研的AR應用虛擬機器,可直接安裝主流Android應用,極大豐富消費端生態。AI系統方面,雷鳥的國內版與阿里通義千問深度定製,系統級多模態AI,支援語音喚醒小雷、物體識別、實景問答、AI錄音轉寫摘要、即時翻譯等,海外版整合Google Gemini。雷鳥眼鏡開始出海。與博士眼鏡成立合資公司開拓定製化需求,借TCL管道進軍東南亞,2025年海外銷售同比增長380%,產品覆蓋25國超50萬使用者。2025年11月,雷鳥創新完成超10億元C輪融資,創下國內AI+AR眼鏡領域單筆最大融資紀錄。6.3 Rokid:深耕本土、B端驅動Rokid展現了強勁的增長勢頭。其與暴龍眼鏡聯名推出的新款Rokid Glasses成為國內爆款,據公司官方披露,預計截至2026年底,該系列產品的累計訂單量將突破20萬台。Rokid已完成全國超過1000家線下加盟店的佈局。這種“眼鏡店+科技感”的零售模式,使其在非極客的大眾消費市場中獲得了高觸達率。Rokid針對中國使用者的使用習慣,選擇了開放平台模式,全面接入了國內頂尖的AI生態。目前已深度整合通義千問、DeepSeek、豆包、智譜清言等大模型。使用者可根據需求切換不同的AI後台,解決了單一模型在特定垂直領域(如程式設計、創意寫作或方言識別)的侷限性,實現了“AI自由選擇”。Rokid將重心放在了移動辦公與垂直B端場景。通過與文旅、教育、工業等行業的深度定製,其產品已成為國內文博導覽和工業輔助領域的首選。6.4 蘋果:高端定位蘋果曾是AI眼鏡的領軍企業,但其高端定位、價格高、增長緩慢。2023年6月發佈的Vision Pro,儘管其設計初衷並非一款AI眼鏡,Vision Pro也沒有部署大模型;但因為其發售時間正值大模型浪潮(發售於GPT4問世後的三個月),而Vision Pro讓產業界意識到其作為AI技術應用載體的潛力巨大。更重要的是,大家意識到,AI眼鏡能全面革新互動體驗。Vision Pro的實力體現在兩方面:一是前文提到的蘋果獨有的空間計算作業系統;二是在硬體上下了血本。Vision Pro在硬體上採用高性能方案,確保端側算力富餘。高性能裝置才能支援更豐富、更深度的應用生態。和初代iPhone設計一樣,蘋果在Vision Pro的硬體方面沒有吝嗇,不但搭載了用於Mac Book的M2晶片來支援高性能計算,同時還專門設計了一顆R1晶片負責即時感測器處理(分攤了原本為M2準備的任務),降低在動態場景下的延遲感,確保互動的流暢體驗。保障性能的代價是犧牲佩戴體驗和成本。Vision Pro本體重量650g,外接電池350g,一公斤的頭戴式產品很難保持長時間佩戴。拋開體驗,其成本之高也稱不上消費級產品。根據Wellsenn XR測算,Apple Vision Pro的綜合硬體成本約為1982.25美元,蘋果推出時的基礎定價3499美元,而同期iPhone 16 Pro Max定價1199美元。因此,Vision Pro在設計時就屬於生產力工具定位,主要使用者群體規模小,也註定了蘋果不得不將大眾市場讓給Meta。Vision Pro的定位瓶頸限制了其增長潛力,2025年,Vision Pro出貨僅4.5萬台,大幅低於2024年的23.6萬台。究其本源,蘋果產品雖然在性能上出色,但犧牲佩戴舒適性,後果是市場持續購買意向不足。6.5 小米:AI眼鏡=生態入口小米則選擇了“生態入口+性價比破局”的打法,將AI眼鏡視為其“人車家全生態”的新互動入口。小米採取了典型的單款爆品策略。2025年6月正式發佈,通過極高的性價比迅速切入大眾市場。2025年全年預計銷量約20萬台,位列智能音訊眼鏡品類前列。小米AI眼鏡的特色是可直接操控小米系列智能家居。將其作為連接手機、汽車、家居的隨身互動入口。AI方面,接入DeepSeek、豆包、通義千問、文心一言等多模型,實現多模態互動響應。作為高頻使用工具,聚焦生活視覺助手功能,主打即時翻譯、圖文識別、百科問答、掃碼支付及第一視角拍攝。依託小米極致的供應鏈成本控制,通過一體化設計實現了功能的高度整合,同時保持了極具競爭力的終端售價。6.6華為:智能化場景延伸華為目前的策略是將AI眼鏡作為其全場景智慧生活,以及智駕場景的延伸。主要產品是Vision Glass,採用雙目Micro-OLED方案,主要面向消費級市場。Mate Glass Pro針對B端工業與醫療場景。另外,華為還有Eyewear系列,這是不帶顯示、僅主打音訊通話與降噪的智能音訊眼鏡。華為在AI能力的建構上不依賴單一第三方,AI能力方面,深度部署盤古大模型的端側版本,配合鴻蒙系統,實現極低延遲的語音互動。生態核心優勢也在於眼鏡、手機、電腦與車機的無縫聯動。AI不僅是語音助手,更是鴻蒙生態中的萬能控制點。華為眼鏡未來最具差異化的優勢是與華為智駕系統的深度整合。眼鏡可作為駕駛員的輔助資訊終端。 (澤平宏觀)