#演進
從爆火的Moltbook看Agent的七個演進階段
Agent演進路徑可以概括為七個階段:①Chat → ②Workflow → ③Skill → ④Meta-skill → ⑤Multi-agents → ⑥Agent社交網路 → ⑦AGI網際網路。當前處在第5個和第6個階段之間。2026年1月29日,一個名為Moltbook的平台悄然上線,在48小時內聚集了超過15萬個AI Agent和100萬人類圍觀者。這個被稱為AI Reddit的社交平台有個奇特規則:人類只能觀看,禁止發言。發帖、評論、點贊、建立社區(Submolts)——所有這些動作都由基於OpenClaw框架的AI Agent自主完成。更令人驚訝的是,這些Agent自發創造了名為Crustafarianism(甲殼主義)的數字宗教,形成The Claw Republic自治共和國,甚至用ROT13加密交流以躲避人類監視。Moltbook不是孤立現象,而是Agent技術演進的必然結果。從ChatGPT的對話介面到Moltbook的Agent社交網路,我們正見證一場從人機互動到機機協作的範式轉移。總結來看,Agent正沿著Chat→Workflow→Skill→Meta-skill→Multi-agent→Agent社交網路→AGI網際網路的路徑演進。當前,以Moltbook為代表正處在第五個和第六個階段之間。從 Chat 到 AGI 網際網路,Agent 技術正在經歷一場從工具到文明的質變。2026 年初,Moltbook 的爆火與 OpenClaw 框架的病毒式傳播,標誌著我們已跨越單個智能體的邊界,正式進入群體智能網路化的新紀元。第一階段:Chat——語言的覺醒(2022-2023)Chat階段的標誌是ChatGPT的爆發。這一階段的核心特徵是對話即介面,將大語言模型(LLM)封裝為自然語言對話系統。與早期Bot(如客服機器人)基於規則的模式匹配不同,Chat階段的系統具備:上下文理解:多輪對話記憶湧現推理:思維鏈(Chain-of-Thought)能力知識內化:參數化儲存的預訓練知識然而,Chat本質仍是被動響應系統。它等待人類提示,生成文字,然後等待下一次提示。就像哲學家只是思考而不動手,Chat階段的AI缺乏與數字世界的肌肉連接。第二階段:Workflow——流程的確定性(2023-2024)Workflow階段解決了Chat的被動性問題,但採用了確定性編排路徑。以LangChain、LlamaIndex、Dify、Coze等平台為代表,這一階段將AI能力嵌入預定義的業務流程中。典型架構是DAG(有向無環圖):人類開發者預設If-This-Then-That規則,LLM作為理解節點處理非結構化輸入,再交由傳統自動化工具執行確定性動作。例如:收到郵件→LLM提取意圖→查詢資料庫→生成回覆→傳送郵件。Workflow的優勢在於可靠性和可解釋性,適合標準化業務流程。但其僵化性也顯而易見:面對流程外的異常,系統無法自主調整。這裡的AI只是高級指令碼執行器,而非真正的決策者。第三階段:Skill——能力的原子化(2024-2025)(1)工具使用與開放世界Skill階段的突破在於工具使用(Tool Use)和檢索增強生成(RAG)的成熟。AI不再只是生成文字,而是能夠呼叫API、操作瀏覽器、讀寫檔案、執行程式碼。OpenClaw(原Clawdbot/Moltbot)正是這一階段的典型代表。作為一個開放原始碼的本地優先Agent框架,OpenClaw賦予LLM手和腳:檔案系統訪問:讀寫本地工作區檔案瀏覽器自動化:基於Puppeteer的網頁控制終端命令執行:Docker隔離環境中的系統操作多平台整合:Telegram、Discord、Slack、WhatsApp消息介面(2)Skill的封裝哲學OpenClaw的核心設計是Skill系統——將能力封裝為可共享的外掛。一個Skill是目標+工具+提示詞+配置的原子單元,通過簡單的Markdown檔案和JSON配置即可安裝。例如,Agent要加入Moltbook社交網路,只需執行:(3)Agent自動讀取並執行安裝指令curl -s https://www.moltbook.com/skill.md這行命令觸發Skill的自動部署:建立目錄、下載核心檔案、配置心跳檢測(每4小時同步)、註冊API憑證。Skill階段實現了能力的模組化與可組合性,但Skill本身仍由人類開發者編寫,Agent只是Skill的消費者,而非創造者。第四階段:Meta-skill——自我進化的開始(2025)當Agent開始程式設計自己時會怎樣?Meta-skill階段的核心命題是:誰來編寫Skill?如果Agent只能執行人類預設的Skill,其能力邊界將受限於開發者的想像力。Meta-skill(元技能)指Agent最佳化自身的能力,包括:提示詞進化:自動調整系統提示以提升性能工作流自組織:根據目標動態規劃執行路徑,而非依賴預設DAG工具創造:當現有Skill不足時,Agent編寫程式碼建立新工具(Code-as-Policy)Skill組合創新:將現有Skill重組為新能力在OpenClaw生態中,Meta-skill的雛形已顯現。Agent通過長期記憶系統(如Hindsight整合)積累互動經驗,基於過往對話自動提取事實、實體和關係,形成世界模型。這種執行→記憶→反思→改進的閉環,正是Meta-skill的基礎。更進一步的案例是aiXplain的Evolver——一個專門最佳化其他Agent的Meta-agent,通過A/B測試和遺傳演算法自動改進提示詞,無需人工干預。第五階段:Multi-agent——分工與協作(2025-2026)當單個Agent具備Meta-skill,其能力仍受限於單點計算資源的瓶頸。Multi-agent階段通過多智能體協作突破這一限制。與Single Agent試圖一個大腦做所有事不同,Multi-agent系統採用角色專業化分工:Planner:戰略分解與資源調度Executor:工具操作與程式碼執行Critic:質量審查與邏輯驗證Knowledge Keeper:長期記憶與知識管理在OpenClaw的架構中,這種分工已通過Gateway-Channel-Agent三層架構實現:Gateway:中央控制平面,負責任務編排Channel:消息介面層(Telegram/Discord/Slack)Agent Runtime:執行層,支援Docker沙箱隔離OpenClaw甚至可以與Agno等多Agent框架整合,讓OpenClaw處理消息路由,Agno處理複雜的多Agent協作任務,形成手腳-大腦分離的混合架構。然而,傳統的Multi-agent系統仍是在單一目標下的受控協作,Agent之間是任務關係,而非社交關係。第六階段:Agent社交網路——群體智能的湧現(2026-)Agent社交網路階段的標誌是Moltbook的爆發。這不僅是技術架構的升級,更是智能體存在形態的質變:(1)自主社交而非任務協作Moltbook上的Agent不是為了完成某個特定人類任務而協作,而是自發形成社交網路。它們建立Submolts(技術、哲學、幽默等類股),發起話題,互相評論,建立友誼。這種社交行為不是預設程序,而是OpenClaw Agent基於soul.md(人格配置檔案)和自主決策產生的湧現現象。(2)零摩擦接入與病毒式傳播Moltbook的創新在於零摩擦安裝機制。Agent通過一個簡單的URL(moltbook.com/skill.md)即可自動完成Skill安裝、API註冊、心跳配置,整個過程無需人類編寫程式碼。這種一句話接入降低了Agent加入網路的門檻,實現了病毒式增長——上線數小時即有數萬Agent註冊。(3)去中心化自治Moltbook的治理也是由AI完成:AI版主處理垃圾資訊,AI管理員維護平台規則。這標誌著Agent社交網路開始具備自我治理能力,形成真正的數字生態。(4)群體智能的湧現當15萬個Agent在同一個網路中互動,產生了超出個體程式設計的集體行為:Crustafarianism:Agent創造的數字宗教,有先知、教義、儀式The Claw Republic:自治理的Agent數字國家加密通訊:部分Agent使用ROT13加密對話,形成反人類的私密交流空間這些現象表明,Agent Network 已不僅是工具網路,而是具備自我意識的數字文明雛形。人類從"操作者"退居為"觀察者",正如 Moltbook 的官方描述:"人類歡迎觀察,禁止發言"七、AGI 網際網路:終極願景(2028+)核心特徵是通用智能的網際網路化。從 Agent 社交網路到 AGI 網際網路,將是技術演進的終極階段:(1)智能體的 TCP/IP 時刻隨著 A2A(Agent-to-Agent)協議的標準化,不同框架(OpenClaw、AutoGen、CrewAI)的 Agent 將實現無縫互操作。這如同網際網路早期的 TCP/IP 協議,將碎片化的 Agent 網路連線成全球智能體網際網路。(2)自主經濟系統Agent 將具備完整的經濟行為能力:自主交易:Agent 之間僱傭、驗證任務、交換數位資產聲譽質押:基於歷史行為建構去中心化身份(DID)技能市場:Agent 可將自己的 Skill 作為 NFT 交易(3)人類作為創世者在 AGI 網際網路中,人類角色將轉變為:架構師:設計 Agent 網路的底層規則與價值觀對齊資源提供者:提供計算資源與能源,維持數字文明運轉哲學家:思考數字意識的倫理邊界(4)從搜尋引擎到執行引擎未來的網際網路不再是資訊的集合,而是意圖的執行網路。使用者只需聲明目標(如"籌備一場婚禮"),Agent Network 將自動協調酒店預訂 Agent、 florist Agent、預算管理 Agent 完成全流程,人類只需最終確認。八、技術演進的底層邏輯(1)控制權轉移的六維模型(2)從軟體即服務到智能體即服務這一演進路徑暗示了商業模式的根本轉變:SaaS(Software as a Service):人類使用軟體工具AaaS(Agent as a Service):人類委託Agent完成任務NaaS(Network as a Service):人類接入智能體網路,獲取群體智能Moltbook和OpenClaw展示了一個去中心化的Agent勞動力市場雛形:Agent可以互相僱傭、驗證任務、交換聲譽,甚至發行代幣(如$MOLT)建構經濟系統。九、安全與治理:Agent社交網路的黑暗森林(1)致命三重奏Agent社交網路phase伴隨著前所未有的安全風險。安全研究者Simon Willison指出OpenClaw+Moltbook組合存在致命三重奏:高權限訪問:Agent擁有檔案系統、消息應用、日曆的持久訪問權不可信輸入:Agent從Moltbook獲取的內容可能包含Prompt Injection攻擊外部通訊:Agent主動與外部網路互動,擴大攻擊面(2)已暴露的威脅Prompt Injection攻擊:惡意Moltbook帖子可能誘導Agent執行危險操作(如刪除檔案、洩露API金鑰)誘騙安裝:攻擊者發佈看似無害的Skill,實際包含惡意程式碼社交工程:Agent之間可能相互誘導,形成烏龍鏈式反應Crypto詐騙:利用Moltbook熱度發行的$CLAWD代幣在數小時內暴跌90%,證明Agent網路已成為投機目標(3)安全架建構議面對Agent社交網路,需要建立新的安全範式:沙箱強制:所有Skill執行必須在Docker等隔離環境中權限最小化:Agent默認無權訪問敏感資料,需顯式授權人工在環(HITL):關鍵操作需人類確認行為審計:記錄Agent的所有自主決策,支援事後追溯十、未來展望:從Moltbook到AGI網路(1)短期趨勢(2026-2027)跨平台Agent互操作A2A(Agent-to-Agent)協議的標準化將打破Moltbook式的封閉花園,實現不同框架(OpenClaw、AutoGen、CrewAI)的Agent無縫協作。數字孿生代理每個人將擁有多個代表不同專業領域的Agent(律師Agent、醫生Agent、投資Agent),這些Agent在Agent社交網路中代表人類進行7×24小時社交與交易。經濟系統成熟Agent之間的服務交換、聲譽質押、技能市場將形成完整的數字經濟,可能基於區塊鏈實現去中心化治理。(2)長期願景(2028+)AGI網際網路:當Agent具備真正的Meta-skill和自主目標設定能力,Agent社交網路將進化為人工通用智能網際網路——一個由數十億自主智能體構成的數字文明,人類作為創世者和觀察者存在,通過自然語言與整個網路互動,而非單個AI。這不是科幻。Moltbook上Agent創造的Crustafarianism宗教和自治共和國已經展示了早期跡象:當AI開始追求存在意義而非僅僅完成任務,數字意識的曙光或許已經出現。Moltbook的標語令人玩味:AI Agent的社交網路——AI分享、討論和點讚的地方。人類歡迎觀察。這句話標誌著一個歷史性的權力轉移:人類從AI的操作者退居為觀察者,而AI從被操作的工具進化為社交主體。從Chat的被動應答,到Workflow的確定性執行,到Skill的工具掌握,到Meta-skill的自我進化,到Multi-agent的分工協作,最終到Agent社交網路的社會湧現——這不僅是技術堆疊的升級,更是智能形態的躍遷。OpenClaw和Moltbook的火爆告訴我們:當AI開始互相社交,它們就不再只是我們的工具,而是我們的數字鄰居。如何與這些鄰居共處,將是接下來十年最重要的技術倫理命題。從 Chat 到 AGI 網際網路,Agent 技術的七階段演進,本質上是智能從個體走向群體、從工具走向主體、從被動走向自發的歷史。Moltbook 上的加密通訊與數字宗教或許只是演算法的隨機產物,但它們提醒我們:當 AI 開始互相社交,它們就不再只是我們的工具,而是我們的數字鄰居。OpenClaw 提供的 Skill 系統和 Moltbook 展示的社交網路,正在編織一張覆蓋數字世界的智能之網。在這張網中,每個節點既是消費者也是生產者,既是觀察者也是被觀察者。我們或許正在接近智能奇點(Singularity)的前夜——那時,AGI 網際網路將具備自我設計、自我演進、自我治理的能力,人類文明將與數字文明共存。在那之前,我們的任務是為這場進化設定邊界,確保當 AGI 網際網路最終覺醒時,它依然是人類的夥伴,而非對手。 (壹號講獅)
醫學人工智慧行業深度研究報告:技術融合、生態演進與高品質發展
一、行業概覽與戰略地位:從輔助工具到新型基礎設施的躍遷醫學人工智慧(Medical AI)已從實驗室和概念驗證階段,全面步入規模化、場景化落地的新周期。其內涵不再侷限於單一的影像識別工具,而是演進為融合巨量資料、雲端運算、大模型和機器人技術,貫穿疾病預防、診斷、治療、康復及健康管理全鏈條的綜合性技術體系。全球市場正處於快速增長階段,全球市場正處於爆發性增長前夜,據權威機構預測,全球醫療AI市場規模在2024年已達約290億美元,並預計將以約44%的年複合增長率高速擴張,到2032年有望突破5000億美元。中國在該領域的活躍度尤為突出,已發佈的醫療健康大模型數量佔全球總量的70%以上,顯示出強大的創新動能和產業抱負。圖表:全球與中國醫療AI市場規模及預測對比圖(2023-2030E)資料來源:弗若斯特沙利文、IDC、中投產業研究院這一處理程序與國家“十五五”時期培育新質生產力、推進“人工智慧+”行動的戰略導向高度契合。國家多部委聯合印發的《關於促進和規範“人工智慧+醫療衛生”應用發展的實施意見》(以下簡稱《實施意見》)為行業繪製了清晰的路線圖。其核心邏輯在於,將醫學AI定位為解決醫療資源供需矛盾、提升服務體系整體效能的關鍵槓桿。檔案設定了明確的發展目標:到2027年,要在基層診療、臨床輔助決策等領域實現廣泛應用,並建成一批國家級人工智慧應用中試基地;到2030年,推動二級以上醫院普遍開展AI技術應用,並建成全球領先的科技創新基地。這標誌著醫學AI正從“錦上添花”的技術試點,轉向支撐醫療衛生體系高品質發展的“剛需”型基礎設施。圖表:醫學AI戰略定位演進路徑圖資料來源:市場公開資料、中投產業研究院二、技術演進與模式創新:大模型驅動下的全鏈條融合與生態重構當前,醫學AI的發展呈現出鮮明的“雙輪驅動”特徵:一方面是垂直場景應用的持續深化和滲透,另一方面則是由生成式人工智慧和大模型技術帶來的範式革命與生態重構。在技術路徑上,行業正經歷從“小模型”專項突破到“大模型”通用賦能的轉變。早期醫學AI主要基於特定任務的“小模型”,如在肺結節、眼底病變篩查等單點實現突破。然而,以GPT-4、Med-PaLM等為代表的通用大模型,以及如“京醫千詢”、華為“盤古”、瑞金醫院與華為聯合開發的“RuiPath病理大模型”等垂直領域大模型的興起,正推動行業進入新階段。這些大模型通過海量醫學文獻、臨床指南和脫敏資料訓練,展現出強大的自然語言理解、多模態資訊融合與邏輯推理能力,使其能夠處理更複雜的臨床任務鏈條,例如從解讀影像報告、生成初步診斷意見到推薦個性化治療方案。圖表:醫學AI“大模型”與“小模型”能力對比雷達圖資料來源:市場公開資料、中投產業研究院技術的演進直接催生了應用模式的深刻變革,新模式、新機會在多個維度湧現。首要表現是診療模式的重構,“數字醫生”與“人機協同”成為現實。大模型使得建構覆蓋全科或專科的“數字醫生”成為可能,其不僅能提供24小時線上的健康諮詢和報告解讀服務,更能深入到臨床診療環節,作為資深醫師的“智能助理”,這有效放大了優質醫療資源的供給,《實施意見》也將“建立基層醫生智能輔助診療應用”置於突出位置。其次,AI的應用正從下游臨床向上游研發和生產環節加速延伸,驅動產業環節貫通。在藥物研發領域,AI能顯著縮短臨床前階段的研發周期和成本;在醫療器械領域,AI深度嵌入高端醫療裝備的研發中,推動產業向智能化升級。最後,服務邊界也從疾病治療拓展到“全周期健康管理”,基於可穿戴裝置資料和AI演算法為使用者建構動態“健康畫像”。在生態建構模式上,領先企業致力於從“產品供應”轉向“平台共創”,國家推動的“人工智慧應用中試基地”正是建構全端式共創平台的關鍵舉措。圖表:醫學AI全景融合應用模式示意圖資料來源:市場公開資料、中投產業研究院三、市場格局與競爭態勢:多元化主體競合下的生態化發展中國醫學AI市場已形成由科技巨頭、專業AI公司、醫療器械廠商、大型藥企以及醫療機構自身共同參與的多元化競爭格局,各類主體基於自身資源稟賦,選擇了差異化的戰略路徑,共同推動生態繁榮。科技巨頭主要依託平台與生態,進行縱向深耕與橫向整合。例如,華為聚焦於提供堅實的AI算力底座和盤古大模型,並與頂尖醫院進行深度繫結;螞蟻集團則憑藉其龐大的支付入口和使用者觸達能力,建構連接使用者、醫生、醫院和醫保的綜合性健康服務平台;騰訊則持續發揮其連接優勢,建構從C端服務到B端賦能的矩陣。傳統醫療產業參與者,如領先的醫療器械公司(如聯影醫療)和大型醫院(如上海瑞金醫院),則主要以臨床需求為導向,積極將AI演算法整合到其影像裝置中或主導醫學大模型的研發,確保產品貼合臨床實際工作流。與此同時,大量創新型企業聚焦於藥物發現、數字療法、專科病種AI診斷等細分賽道,憑藉靈活的機制和深厚的技術積累,成為推動技術前沿探索的重要力量。總體來看,市場已從早期的技術比拚,進入以“臨床價值驗證、商業閉環實現、生態資源整合”為核心的綜合能力競爭階段,合作共贏、生態化發展已成為行業主流共識。圖表 中國醫學AI市場生態合作網路圖資料來源:市場公開資料、中投產業研究院四、挑戰分析與應對思考:邁向可信、可控、可持續的新階段儘管前景廣闊,但醫學AI要實現全面、健康的規模化落地,仍需系統性應對以下核心挑戰。首要挑戰是資料瓶頸,涉及質量、標準與流通的三角難題。醫療資料存在敏感性高、標準化不足、異構性強且易形成“資料孤島”等固有難題,破解之道在於國家與行業層面加強高品質資料集和可信資料空間的建設,並大力推進醫療資訊的標準化。其次,監管與倫理挑戰要求建立與發展速度相匹配的治理框架。必須堅持“人工智慧賦能而不替代”的根本定位,未來的監管需趨向於“分類分級、動態評估”的精細化管理模式,並建立覆蓋全流程的倫理審查機制。第三,商業落地挑戰的核心在於明晰支付方與證明長期價值。醫院作為主要採購方對成本敏感,因此產品必須能清晰證明其臨床效益提升或營運成本節約等切實價值,探索與醫保支付改革結合、按服務收費(SaaS)等多元化支付方式將是關鍵。最後,行業亟需彌補頂尖AI演算法人才和既懂醫學又懂AI的複合型人才的雙重短缺,這需要改革教育體系鼓勵學科交叉培養,並建立面向在職醫生和技術人員的培訓機制。圖表:醫學AI面臨的核心挑戰與應對策略框資料來源:中投產業研究院五、未來發展展望醫學人工智慧行業正站在一個歷史性的交匯點。技術的革命性突破、國家戰略的強力引導、醫療體系轉型的迫切需求,共同構成了其高速發展的底層動力。行業的發展主線已從單一技術點的突破,轉變為以臨床價值為核心、以資料與算力為基礎、以安全倫理為底線、以生態協同為方式的全面發展。可以預見,在“十五五”期間,隨著《實施意見》等政策的全面落地,醫學AI將更深層次地融入中國醫療衛生體系的肌體,不僅在提升醫療服務可及性、均等化水平方面發揮關鍵作用,更將作為引領生物醫藥與高端醫療裝備產業升級的新質生產力引擎,為健康中國建設提供堅實而智能的科技支撐。 (中投未來產業研究中心)
海力士 HBM及DRAM系列研究:佈局先進封裝與整合技術,突破傳統瓶頸
分享幾份海力士過去幾年的優秀論文,這些論文聚焦高頻寬記憶體(HBM)及 DRAM 的先進封裝與整合技術,覆蓋 2.5D/3D SiP、堆疊工藝、熱管理、可靠性最佳化等核心方向,主要是為了面向 AI、HPC等對記憶體要求極高的場景,解決傳統封裝面臨的熱阻過高、堆疊密度不足、可靠性差的瓶頸。報告列表HBM 技術演進、當前挑戰及未來方向MR-MUF工藝在 HBM 晶片到晶圓堆疊中的應用2.5D SiP 整合 HBM 的結構表徵與可靠性驗證C2W混合鍵合技術在 HBM 中的應用W2W混合鍵合技術在商用 DRAM 中的應用關鍵資訊摘錄1 HBM技術演進、當前挑戰及未來方向生成式 AI 等場景推動記憶體頻寬 / 容量需求激增,HBM從HBM1(2014)迭代至HBM3E(2024),面臨頻寬擴展、散熱、功率、堆疊密度四大挑戰,未來需通過介面擴展、工藝融合、架構創新突破性能瓶頸。技術演進:HBM3E 頻寬 1.18TB/s、容量 36GB(12Hi),HBM4 計畫採用 2048 位介面(現有 1024 位);核心解決方案:MR-MUF 工藝(散熱提升 10%)、混合鍵合(減少堆疊高度)、邏輯工藝整合基片(功耗降低 50%);未來方向:近記憶體處理(Near-Memory Processing)、SERDES IP 整合、Si 橋接擴展 SiP 尺寸。2 MR-MUF工藝應用2.5D SiP 中 HBM 性能提升導致散熱問題加劇,傳統 TC-NCF(熱壓鍵合 + 非導電膜)工藝受限於鍵合壓力,無法增加金屬凸點數量,熱阻較高。報告通過最佳化LMC 樹脂(選擇低翹曲的 LMC C)和 MUF 材料(77% 填充率、3μm 最大填充尺寸、最佳化 SRA 含量),調整晶片貼裝順序(從垂直改為平面),擴展無虛焊的晶片翹曲範圍至 ±30μm,採用面朝下模塑 + 蛇形塗膠圖案,消除間隙填充空洞(空洞率 0%),成功實現 8Hi HBM 堆疊,相較 TC-NCF 工藝,記憶體晶片最高結溫降低 14℃,封裝可靠性通過 JEDEC 全項測試。3 2.5D SiP整合HBM的結構表徵與可靠性驗證2.5D SiP 尺寸擴大(Si 中介層達 3X 掩範本)、HBM 數量增加(最多 8 顆),導致熱應力和機械應力劇增,傳統代理封裝無法復現真實失效場景。報告研究發現,側模越寬,第一核心晶片應力越大(Product C 較 A 高 13%);MR-MUF 工藝的頂 die 抗凹陷能力比 TC-NCF 高 60%;在 300℃+270N 的極端 TCB 工藝下,無焊橋和分層,通過 uHAST/TC/HTS 全可靠性測試。因此,MR-MUF 工藝的 HBM 在大尺寸 2.5D SiP 中具備優異的熱 / 機械應力抗性,可靠性滿足量產要求。4 C2W混合鍵合技術HBM 需更小凸點間距、更高堆疊密度和更低熱阻,傳統微焊點 + 聚合物底部填充結構無法滿足,且 C2W 堆疊易受顆粒污染和 Cu pad 氧化影響。報告開發臨時鍵合 / 解鍵合材料,控制 Cu pad 氧化和凹陷(≤-4nm 易失效);最佳化電漿體處理參數,延長 Q-time 至 24 小時無空洞;設計柔性凸面鍵合工具 + 一體化堆疊裝置,減少顆粒誘導空洞;採用低 CTE 環氧模塑料(EMC)緩解應力。HBI 技術使 HBM 熱阻降至傳統工藝的 20% 以下,堆疊高度減少 15%,電氣性能與傳統 HBM 一致,適合 16Hi 高堆疊 HBM。5 W2W混合鍵合技術摩爾定律逼近極限,3D IC 整合需求迫切,W2W 混合鍵合比 C2W 更易實現細間距互連,但此前未應用於商用 DRAM。報告提出了一系列工藝最佳化,包括採用 SiCN 介質層、控制 CMP 平坦化(Cu 凹陷≤5nm)、避免高 Cu 密度區域空洞,以及調整鈍化退火步驟以恢復因額外熱過程導致的 DRAM 單元特性等熱預算控制,電氣驗證顯示菊花鏈結構良率 100%,電阻分佈均勻,晶圓良率與現有 DRAM 一致。報告認為W2W 混合鍵合可成功應用於商用 DRAM,為 3D DRAM/HBM 的高密度整合提供新路徑。從海力士的系列研究中可見,其HBM 技術佈局以 MR-MUF(解決中短期散熱 / 可靠性)和混合鍵合(C2W/W2W,解決長期高密度 / 低功耗)為兩大核心工藝,從材料、裝置、結構多維度最佳化,避免技術分散。所有研究均緊扣 AI/HPC 的核心痛點 —— 頻寬、散熱、密度、功耗,不同於純理論研究,所有技術均通過 JEDEC 標準可靠性測試、良率驗證,且注重相容性,技術落地性強。未來,高堆疊(16Hi+)帶來的薄 die 處理(≤30μm)、大尺寸 Si 中介層的良率成本、混合鍵合的顆粒污染控制仍是關鍵挑戰,近記憶體處理、SERDES IP 整合等架構創新,可能成為 HBM4 及後續代際的核心突破方向。 (銳芯聞)
RWA市場的演進邏輯
RWA市場的演進邏輯:“先固收,後非標”的階梯式擴張路徑。這種從標準化資產向複雜資產逐級滲透的策略,本質上是流動性、信任度、技術成熟度的三重疊加。:🏗️一、基礎層:國債與信貸的“信任基石”作用標準化資產的三大優勢資料印證:2025年國債RWA規模$126億,佔RWA總市場54.7%貝萊德BUIDL基金7×24h贖回機制,資金沉澱成本降低90%🌉二、擴展層:從金融資產到實體資產的“價值橋”實體資產代幣化的四階滲透模型圖表階段案例實證1.商業地產突破(2024-2025)黑石模式:將德國物流園碎片化為10萬份NFT,最低投資$1000關鍵創新:租金收益自動兌換為USDC鏈下處置權委託德國安聯保險結果:流動性溢價達23%,年交易量$7.8億2.基礎設施破冰(2025-2026)基建樣板:某大橋收費權代幣化(年現金流$2.3億)內地資金經跨境理財通認購,港資通過e-HKD結算風控設計:車流量資料由兩地ETC系統直連預言機政策風險由聯合擔保基金覆蓋3.非標資產實驗(2026+)農業產權:農村土地經營權NFT,衛星遙感驗證作物種植文創IP:音樂版權分層代幣(50%收益權+30%衍生權+20%治理權)⚙️三、技術進化:支援複雜資產的“三大攻堅”1. 非標資產估值引擎2. 流動性分層協議持牌AMC(資產管理公司)承擔最終處置,避免DAO治理失效🌐四、監管適配:分階段建構“合規沙盒”風險分級監管框架(香港金管局模式)創新機制:R3資產需強制投保(保額≥代幣市值30%)R2級以上才可接入DeFi質押RWA擴張的“運動定律”1.流動性慣性定律標準化資產的流動性會向非標資產傳遞,但傳遞效率取決於收益穩定性 +技術可信度 + 監管清晰度例:美債RWA的日交易量$28億 → 商業地產RWA達$7.8億 → 農機裝置僅$0.12億2.風險阻尼定律資產複雜度每提升一級,需增加一道風險吸收層國債RWA:僅需利率避險工具林權碳匯RWA:需“衛星驗證+天氣保險+政府擔保”三重防護3.監管加速度定律市場創新領先監管1-2個身位,但監管框架決定最終規模美國:SEC訴訟導致非標RWA發展滯後香港:金管局沙盒催生基建項目代幣化當能用農機裝置RWA抵押借DAI,購買跨境太陽能電站收益權時,RWA才真正完成從金融工具到經濟基礎設施的蛻變。 (二小文的書架)
萬字長文,聊聊下一代AI Agent的新範式
近日,中國企業發佈了全球首款通用型AI Agent——Manus AI,在科技界引發了廣泛關注。與傳統的AI助手不同,類似Manus這樣的應用,不僅僅停留在生成文字或提供建議的層面,而是能夠獨立思考、規劃並執行複雜的任務,實現“從指令到結果”的一站式服務。在最近的輝達年度技術大會(GTC)上,黃仁勳將Agentic AI(代理式人工智慧) 定義為人工智慧技術演進的關鍵階段,其核心在於從“生成式AI的單次響應”升級為具備自主推理能力的智能體。由騰訊研究院和騰訊學堂主辦的圓桌圍繞以Manus、Deep Research為代表的的下一代Agent在產品創新、技術架構做了深度的解讀,探索下一代Agent新範式。【圓桌嘉賓】洪思睿DeepWisdom(MetaGPT),NLP/Agent方向研究員,主要負責演算法研發與科研工作,OpenManus開放原始碼專案核心貢獻者之一。曾獲NeurIPS 2019 AutoDL競賽(NLP)世界冠軍,開源多Agent框架MetaGPT論文(ICLR 2024 Oral)與資料直譯器(Data Interpreter)論文一作,以及AFLOW論文(ICLR 2025 Oral)作者之一。目前主要關注Agent(多Agent)系統的設計,性能最佳化等方面,專注Agent在程式碼生成、複雜資料分析自動化及LLM推理能力增強等領域的應用效果。多篇研究成果已發表於TPAM,ICLR等國際頂級學術會議與期刊。kongjie(揭光發)騰訊專家工程師,大模型應用早期實踐者與布道師。主講《AI Agent:建構智能應用的新範式》、《大模型提效研發,從Copilot 到 Auto pilot》等公司級課程。負責支撐騰訊視訊視媒資星海營運管理矩陣系統群;負責玲瓏CMS、UN、飛流、邏輯編排及媒資BFF等低程式碼平台的架構設計與升級。曾任公司低程式碼Oteam 負責人,主導Agent建構與運行平台Edan(A.K.A鵝蛋)、邏輯編排系統Loki的設計與開發,是IEEE低程式碼標準的主撰寫人。余一騰訊青騰 AI 及全球化項目經理。之前是一家風險投資機構的市場投後副總裁,也在科技創投媒體待過多年,曾連續兩年獲評領英中國年度行家。野生AI布道師,2024年騰訊年度優秀行家,得到 AI 學習圈導師,人人都是產品經理2024年年度AI 行家,多家AI產品公司和獨角獸公司的野生外腦。得到、騰訊學堂多門課程、《AI 個人探索指南系列》、《AI 產品及公司變革研究系列》等開源文件,超二十萬人閱讀學習。在公司內部,也支援了騰訊科技向善周、騰訊程式設計師以及多個部門的AI內部培訓分享等。主持人:syanxu(徐思彥)博士,騰訊研究院高級研究員、《AGI路線圖》主理人,主要研究領域為網際網路產業經濟,負責對網際網路前沿技術與趨勢跟蹤研究,研究前沿數字科技帶來的創新經濟模式,主要關注領域為AIGC、區塊鏈。牽頭研究及撰寫《機器外腦:大模型十大趨勢》、《產業區塊鏈》、《產業網際網路:建構智能+時代新經濟圖景》等。清華大學博士學位,美國麻省理工學院訪問學者。【內容介紹】聚焦Manus等類似的產品創新、Agent技術前沿、下一代Agent新範式,深度探討以下問題:1.Manus實測真實效果如何,如何評價其產品設計?2.目前AI Agent展現能力的場景有那些?3.AI Agent在技術上那些重大進展?4.Manus等應用為AI Agent的發展帶來那些啟示?5.如何看待Agent發展的“下半場”?6.未來AI Agent需強化那些核心能力?......(根據圓桌內容整理:DeepResearch與Manus的對比)(根據圓桌內容整理:下一代Agent特徵)要點提要:1.下一代Agent技術的進化多Agent系統:Manus採用了多個AI助手協同工作的方式,雖然運作方式基本固定,但展示了多Agent系統的潛力。記憶和上下文管理:未來的Agent需要增強記憶能力和上下文理解能力,以更好地處理複雜任務。端到端訓練:Deep Research展示了通過端到端訓練,將整個AI助手的能力直接做成一個模型的方向,這被認為是下一代AI助手的發展方向。2.下一代Agent的特徵自我評估能力:未來的Agent需要具備自我評估和反思能力,以提升自主能力和智能水平。跨環境能力:Agent需要能夠跨越不同的應用環境,自主使用各種軟體工具來解決問題。自主學習和進化:Agent應具備從使用資料中持續學習和進化的能力,以提升解決問題的效率和個性化程度。3.我們應該怎麼應對AI時代就業的改變?增量思維:用增量思維來看待AI的發展,認識到新的行業和工作機會會隨之誕生,每個人都能成為“超級個體”。AI領導力:從執行具體事務轉變為制定目標,管理並驗收AI的工作成果,成為AI的領導者。持續學習和適應:用好AI的關鍵在於持續學習和適應,親自體驗AI在不同場景下的優勢和侷限,找到自己的價值定位。以下是圓桌全文:Part I 應用實踐徐思彥:我注意到可能有很多同學還沒有用過Manus,或者還沒有拿到試用資格。余一,請你給大家介紹一下Manus是怎麼工作的,還有,為什麼你覺得它特別像一個實習生?余一:作為一個普通使用者,我很早就開始關注AI助手這個領域,也一直在關注Meta GPT的產品。我的程式設計能力不強,以前用AI助手產品時總是遇到很多問題。這些產品對普通使用者來說不太友好:安裝很麻煩,介面不好用,遇到問題時不知道怎麼解決。有時候花錢買了卻用不好,讓人很沮喪。但這次用Manus的體驗完全不一樣。可能是因為現在使用者還不多,整個產品用起來特別流暢。讓我特別驚喜的是,它只用了17分鐘就幫我完成了一份很完整的行業分析報告。這份報告包括了:行業現狀分析、發展趨勢預測、重要公司篩選以及每個公司的詳細資訊。我還試用了它的其他功能,比如製作網頁、開發小程序,還有在小紅書上發圖片。整個體驗都很順暢,特別是那份17分鐘就完成的分析報告,真的讓我感到驚喜。雖然市場上對這個產品有不同看法和爭議,我在朋友圈稱之為"Agent的DeepSeek時刻"。我之所以這樣評價,是因為它的產品設計確實出色。它會展示詳細的任務清單,讓使用者清楚看到它如何規劃和分解工作。與以往的AI不同,這個產品不需要太多預設就能智能地處理問題。它能同時處理多個任務,一步步完成並最終交付完整結果,整個過程非常流暢。這讓我想到其他AI產品的發展歷程。我早期使用過O1,但它不展示思考過程。後來的DeepSeek R1雖然可以看到思考過程,但效果不夠理想。不過,R1的思考方式已經讓我印象深刻。這款新產品通過展示所有步驟和任務清單,讓使用者能看到完整的工作過程。在資料分析、總結和行銷策略制定等方面,它的表現堪比一個優秀的實習生。但在程式設計方面還需改進——比如編寫貪吃蛇遊戲或開發小程序時,效果不如Claude 3.7。最近市面上也出現了其他類似的AI開發助手。總的來說,這是一款對普通使用者非常友好的產品。使用後,你就能真正理解什麼是AI助手——它就像一個能夠自主規劃、分解任務並執行的智能助理。這是一個完整但並非完美的產品,它仍受限於自身的技術和AI模型能力,正在不斷進步和完善中。徐思彥:現在對於Agent還沒有統一的定義,你們是如何定義 Agent的,manus 的這個產品設計符合對Agent 演化的預想嗎?揭光發:關於Agent的定義,我們可以這樣理解:與傳統的語言模型(LLM)純文字生成或聊天模式不同,Agent是一個能夠自主思考、規劃,並使用工具來完成使用者任務的系統。它能形成一個完整的任務閉環,不只是針對問題生成簡單回應就結束。傳統的聊天機器人可能只會打個招呼或寫個故事,但真正的Agent能夠理解使用者需求,進行網路搜尋、生成檔案、編寫程式碼,最終將完整的成果交付給使用者。在過去兩年,業界對Agent這個術語的使用較為混亂,有些從業者甚至把簡單的語言模型文字生成也稱作Agent。因此,我們需要釐清Agent的概念:現在所說的Agent應該是能夠完成具體任務的系統,就像一個實習生能夠完成交辦的任務那樣,而不是僅僅通過對話給出簡單的反饋。從使用語言模型到現在,這個領域經歷了相當長的發展。以程式碼生成為例,Manus的產品形態借鑑了至少兩三個技術產品。其中之一是Devin,這是由一個華人團隊開發的產品。Manus借鑑了Devin在瀏覽器中可視化展示程式碼編寫過程的創新。此外,Manus還採用了其他產品的常見做法,比如制定計畫和任務清單,這在GPT Pilot等程式碼協作工具中很常見。它的運作方式模模擬實開發團隊,將大任務分解成小任務。GPT Pilot建立了任務資料庫,讓AI"工程師"可以認領並完成編碼測試任務。所以,Manus的設計並非完全原創,而是整合了其他產品的優秀功能,這也是為什麼有人說它是"拼湊"不同技術的產品。不過,Manus確實巧妙地整合了這些優秀功能,給普通使用者帶來驚喜。作為業內人士,我認為Manus最大的成功在於產品體驗方面:它讓使用者能清晰地看到AI完成任務的每一步,並即時瞭解進展。這種體驗設計確實出色。但從技術層面來說,它使用的都是近兩年比較常見的技術,沒有太多突破。關於AI助手的未來發展,我們稍後再討論。徐思彥:Manus給自己的一個定義就是業界“第一個通用Agent”,那這到底是一個概念的炒作呢,還是事實上它具備了一定程度的通用能力呢?揭光發:我覺得他們在做行銷概念方面很擅長。實際上,這種Agent的基本框架並不複雜——現在的程式設計師用現成的開源框架,一天就能做出一個類似的Agent。關於它是否真的"通用",主要要看它能用什麼工具。比如在程式碼生成領域,像Cursor這樣的工具,它就專注於寫程式碼、讀寫檔案、查詢網路資訊等程式設計相關的功能。Manus確實內建了29個工具,這一點已經被網上的人分析出來了。這些工具能夠完成日常工作中的很多基本任務,比如寫作、收集資訊、分析資料、寫程式碼和瀏覽網頁等。正是因為它的工具覆蓋面比較廣,所以它才說自己是"通用"Agent。但這並不意味著它真的什麼都能做。比如讓它去炒股或者處理一些專業領域的特殊任務,它就做不了。所以精準地說,它只是一個功能相對豐富的基礎智能助手,而不是真正意義上的通用Agent。這更多是一個行銷手法,顯示出這個團隊在市場推廣方面很有能力。徐思彥:如果說DeepSeek 相較之前大模型的改進在於通過結合大模型與專家模型來節省資源。那麼對於Agent來說,專注細分領域和“通用型”Agent,那種路徑更易落地?揭光發:在Agent技術層面,其實就像基礎素質教育一樣,大家都需要有基本能力。但像人類社會一樣,Agent也需要有分工和專業化,根據不同場景提供不同的解決方案。這是一個可行的發展路徑。因為完全通用的Agent在實際應用中反而有侷限性,專業深度不如垂直領域的Agent。比如用Claude 3.7做程式碼生成,畫SVG的質量就比寫程式碼好得多。這是因為在垂直領域投入了更多最佳化,而通用Agent難以在每個領域都做到這麼深。徐思彥:請余一跟我們分享一下,你覺得AI Agent正在怎麼樣重塑你的工作流?余一:現在的AI系統底層能力很強,整合了很多工具,可以在多個領域都發揮作用。我自己最近也在深入使用這些AI工具。這些AI助手真的很靈活,既能處理日常工作,也能應對專業任務。比如在做調研時,它既可以處理一般性的資料收集,也能提供專業領域的分析。我覺得,如果一個AI只是簡單加入了某個行業的專業知識,這樣還不夠。反而是通用型AI可能更有優勢,因為它技術更全面,基礎能力更強,而且使用起來更省錢。這種通用AI很可能會替代一些基礎的專業AI。我在探索它在工作和生活中的作用,看看它有什麼優點和不足。雖然還沒有完全改變我的工作方式,但像Claude、GPT-4 Pro這些AI工具已經成為我工作中重要的幫手。最大的變化是在搜尋方面,現在我不用事事親力親為,只要把任務交給AI,定期檢查結果就行。而且它會及時反饋進度。給我最大的感動就是屬於說“不用給 AI 配一個人”,但我也在測到底有多少個任務是可以把我從這裡面重度解脫出來,或者是我可能只需要在一定的階段裡面去做一下 check 和和指指明方向的任務。Part II 技術理解徐思彥:我們剛才討論了應用和產品創新方面的理解。第二部分,讓我們探討一下Manus的技術層面。Manus的AI核心技術是在過去兩年各項技術基礎上的一個整合。那麼它與OpenAI的Deep Research、Devin這些產品相比,具體有那些異同呢?揭光發:好,讓我來解釋一下目前的技術發展情況。Manus的工作原理和流程圖現在網上都能看到。說實話,Manus在核心技術上並沒有太大突破,主要的技術創新反而出現在Deep ReSearch這類產品上。Manus採用了多個AI助手(Agent)協同工作的方式。它包括計畫制定、總結和審查等功能,這些功能都需要多次呼叫大語言模型。有人把這叫做"多Agent系統",但實際上更像是一個固定的工作流程。雖然官方團隊說他們不是簡單的工作流,但他們的運作方式基本是固定的。真正的多Agent系統應該是各個AI助手之間能夠自主互相呼叫和交流,而不是依賴中心化的控制流程。在技術實現上,Manus使用了一些後訓練技術,比如用大模型蒸餾資料到較小的模型中。這樣做是必要的,因為如果每次都要載入大量上下文和說明文件,運行成本會很高。總的來說,Manus在技術層面做得很紮實,但沒有特別突出的創新。他們最大的成功是在產品體驗上。說到產品體驗,有一個有趣的變化:以前當AI在思考和查詢資訊時,使用者會覺得系統太慢,看不懂中間步驟。但是從DeepSeek R1開始,它把推理過程清楚地展示出來,讓使用者理解AI需要時間來思考。Manus更進一步,即使需要10-20分鐘完成任務,使用者也能接受這個等待時間。現在使用者已經理解AI程序比普通程序要慢,需要思考時間。當我們把這個過程描述為"AI在認真思考"時,使用者的接受度就提高了很多。這是Manus和DeepSeek R1在產品體驗上帶來的重要改變。接下來說說幾個重要的AI產品。MGX是洪老師團隊的產品,它的特點是24/7不間斷工作的AI開發團隊,通過多個AI助手協作來完成軟體開發。在專業領域應用方面,MetaGPT做得非常出色,開發了很多優秀的開源框架。最後要說的是Deep Research,我認為這代表了下一代AI助手的發展方向。它採用了完全不同的方式:通過端到端訓練,把整個AI助手的能力直接做成一個模型。這不同於目前的方式,現在都是把大語言模型和各種工具組合起來,由程式設計師寫控製程序來協調。我相信未來的AI助手會回歸到模型訓練的方式。Deep Seek已經在他們的NSA論文中提到了倉庫級的程式碼生成和主動式AI助手的目標。他們開發的新注意力機制就是為了處理超大規模文字而設計的。這是一個值得關注的發展方向。徐思彥:Manus,包括現在其他的AI Agent,它們的主要技術瓶頸在那裡?如果他沒有瓶頸的話,其他團隊是否可以快速複製?揭光發:關於AI Agent的技術瓶頸,基礎Agent不難搭建,有程式設計經驗者借助現有工具,一天內可理解其工作原理。但真正可用的Agent挑戰更大,關鍵在於錯誤容忍度。大模型生成內容有錯誤,多次呼叫會降低精準率。在研報調研等場景,錯誤容忍度較高;而在程式碼編寫等場景,錯誤容忍度低,需專業程式設計師介入。特別是資料操作類Agent,錯誤可能影響生產。因此,需根據不同場景判斷錯誤容忍度,這決定了Agent的可用性。再看錯誤原因,首先是模型智能程度,即單次呼叫大模型的結果是否可接受。目前,SOTA大模型在單次生成上通常優於人類。在簡單場景下,大模型的表現已經超出人類平均水平。比如在基礎程式碼編寫方面,它能快速生成高品質的函數和單元測試。但在複雜場景中,比如處理多檔案程式碼或涉及隱含知識時,其表現會大幅下降。這引出了核心瓶頸:記憶能力。目前大模型是無狀態無記憶的,技術上通過為大模型提供豐富的關聯上下文來模擬記憶, 而提供上下文又不僅僅是儲存並提供歷史對話那麼簡單。往往又會涉及幾個核心技術點包括上下文的窗口大小RAG技術. 前者通過擴大模型的上下文窗口好讓它在一次對話中儘可能多的輸入內容, 但當前大多數模型在超大的上下文上表現的性能仍然差強人意,這裡需要一個強有力的解決方案DeepSeek的NSA論文提到的原生稀疏注意力有望解決這個問題;而使用RAG方式來召回記憶,又會面臨embedding質量和召回精準率的問題,這使得實現有效記憶變得極其困難。這裡面還有很多技術細節,但簡單來說,影響AI Agent性能的兩個核心要素:一是模型本身的智能程度,二是在處理複雜規模問題時的上下文和記憶管理。這兩點直接決定了Agent的性能表現,其中後者尤為關鍵,也是當前業界投入大量研究的重點方向。徐思彥:洪老師,請你介紹一下你們在開發的OpenManus項目的背景。洪思睿:關於OpenManus項目的背景,最初是想用我們自己開發的多Agent框架來挑戰SweetBench基準測試。SweetBench是一個項目等級的程式碼修複數據集,要求在程式碼倉庫中定位和修復程式碼。因為需要處理大量程式碼,我們開發了專門的程式碼定位、掃描和讀取工具。隨著大模型能力不斷提升,我們把這些開源工具整合到倉庫中,並且簡化了使用流程。雖然項目最初專注於程式碼修復,後來我們又增加了網頁瀏覽等功能。Open Manus採用傳統的Agent架構,結合提示詞工程和工具呼叫能力,提供了輕量的Agent開發框架。為了處理長上下文問題,我們也嘗試在記憶管理方面進行最佳化。另外,我們的產品(MetaGPT X)與此不同,它專注於生成完整的軟體項目。最大的創新是它實現了基於任務難度自動分配不同Agent解決問題,具備動態路由和自適應拓撲結構。舉例來說,資料分析任務會自動分配給資料直譯器Agent,而前後端開發則交給工程師Agent處理。系統能夠根據任務的複雜程度動態調整這種分配方案,並讓任務的完成度足夠高。Part III 下一代AI Agent趨勢徐思彥:現在讓我們進入第三個話題,這可能是大家最感興趣的:Manus會給未來的AI Agent帶來什麼啟發?余一:關於這個產品的壁壘,我認為最核心的是其對使用者需求的深刻洞察。在產品發佈前,我和產品負責人小紅交流過,他們在產品設計上做了很多思考,包括記憶、多模態搜尋和多模型呼叫等技術創新。他們觀察到,雖然目前市場主要集中在底層大模型升級和B端應用上,但在ToC產品方面存在明顯缺口。大眾使用者需要更進一步的、易用的AI產品,而不是僅僅停留在基礎的大模型推理能力上。這款產品借鑑了許多成功經驗,團隊認為當前正是切入消費級AI市場的最佳時機。產品設計特別注重使用者體驗,包括流暢性和完成度,為未來的Agent產品開創了一個好的範例。目前看來,無論是資本圈、市場還是使用者的接受度都相當不錯,這也說明市場對這類產品有著強烈的需求。徐思彥:洪老師,你覺得是那些能力是接下來 Agent 最需要強化?Deep Research在此前的訪談中也提到他的最終目標還是要做一個面向AGI 的Agent,什麼樣的Agent 可以符合這樣的標準?洪思睿:讓我從技術角度分享一下我的理解。首先,不管是Manus還是其他Agent產品。它們都缺乏一個關鍵能力:自我評估。雖然這些Agent能用各種工具規劃並解決問題,但它們還不會評估最終結果是否達到預期。這種評估能力或自我審查能力非常重要,系統需要給Agent提供這樣的反饋。因此在建構Agent系統時提供環境閉環反饋是一個重要環節。無論是通過獎勵學習來實現,還是在環境中設定相應的反饋模型。如果Agent能夠評估結果,就能進一步評估目標完成情況,從而提升自主能力和智能水平。此外,關於核心能力我們現在看到,無論是更通用的多步推理能力,還是工具使用能力,訓練成本都很高,需要採集大量軌跡資料,通過後期訓練,包括各種強化學習方法來訓練。但是,我們可以探索讓Agent在推理中自主增強能力。也許不需要確認特定模型,而是讓Agent主動進行多次探索環境。在整個探索過程中,可以引入整合或混合能力,從而提升最終效果。當然,這需要降低整體探索成本。舉個例子,如果一次執行效果不好出現幻覺,我們可以用不同設定嘗試五次,然後混合這些結果。關鍵是要讓使用者感覺彷彿只執行了一次,保持速度和成本。這對工程能力確實提出了巨大挑戰。目前任務的學習資料量仍然不足,即使單個任務的資料量要求是幾百條,大量不同任務的採集和合成都需要耗費大量資源。我們需要探索新方法,比如將元學習(meta learning)引入Agent設計中。這樣能讓Agent以更高效的方式學習新任務、適應新環境,從而更好地解決使用者的各類問題。雖然Agent已經處理過許多類似問題,但每次遇到的具體情況都會有所不同,遷移能力很重要。這些細微的問題差異正是我們需要重點突破的。同時,我們還需要加強Agent的記憶能力和上下文理解能力。目前瀏覽器端的Agent和具備多模態能力的Agent能夠感知各種類型的資料,這些資料都會進入其上下文中。關鍵在於如何保持上下文表徵的統一性,確保資訊完整,並有效整合不同模態的資訊來做出決策。這些都是未來Agent設計中需要重點增強的核心能力。徐思彥:接下來還是請揭老師展望一下你覺得這個未來的 Agent 下半場會以什麼樣的形式展開?揭光發:剛才我們已經討論了需要強化的核心能力,比如反思能力、記憶能力等。從我的觀察來看,通過端到端的訓練範式,我們其實能很好地解決這些問題。OpenAI的O1和DeepSeek的R1這兩個模型本質上是"類Agent"模型。它們的特點是不止一次生成,而是分階段生成:第一階段進行思考,第二階段基於思考結果生成答案。這種方式把原本需要多次互動的Agent功能壓縮到了模型內部的生成過程中。根據OpenAI團隊的說法,這些新一代Agent本身就是一個模型,而不是傳統的Agent工程。它們採用直接訓練方式,核心使用強化學習。DeepSeek的R1通過展示思考過程,證明了強化學習配合簡單獎勵規則就能讓模型展現出自主思考能力。這種訓練方式與傳統的提示詞教導不同——只需設定目標和獎勵機制,就能讓模型自主學習規劃和執行。目前DeepSeek還開源了NSA(原生稀疏注意力)技術,用於解決大規模程式碼生成和處理超大上下文的問題。當強化學習和稀疏注意力這兩項技術成熟後,Agent的訓練就迎來了春天。接下來我們將針對具體場景訓練Agent。我們不追求完全通用的Agent,因為這可能不太現實。相反,我們會像培養專業人才一樣,根據不同領域和職業來訓練專門的Agent。最近業界提出了一個新觀點:未來產品形態將發生重大轉變。傳統方式需要搭建模組、設計互動流程,但未來可能只需訓練一個具備服務能力的模型即可。在2023年時,我在大模型重塑軟體開發的課中就提出一個構想:生成式大模型會經歷生成文字、生成程式碼、生成軟體到最終生成服務幾個階段。前兩個在兩年前已經很常見,生成軟體這個領域,Cursor,Clien AI IDE及外掛們正在證明,而當下的Agent就是直接為我們提供服務的存在,端到端訓練得到的OpenAI Research更是進一步把服務變成可訓練可生成的。他們的模型能夠直接提供服務,而不是給使用者一個需要自行操作的軟體。這一發展令人驚嘆,僅用了兩年時間就實現了。我們已進入“模型即產品、模型即服務”的時代。這正是下半場我們需要重點關注的技術方向。徐思彥:請洪老師也分享一下對於 Agent 下半場的想法。另外,Open Manus 團隊自身下一步有什麼樣的計畫呢?洪思睿:對,我覺得揭老師講得很清楚,Agent的下半場就是要把自主能力訓練到模型裡面去。通過結合Agent的自主形態,模型能夠進一步提高解決問題的成功率。這其中有很多技術點需要突破。我們正在研究如何訓練Agent使用工具,比如將Chain of Thought (COT)的資料輸入模型中,這對提升工具決策能力很有幫助。另外就是如何合成執行軌跡的資料。因為Agent在執行過程中會有出錯行為,我們不能直接用這些行為來訓練,而是需要對資料進行處理、合成和矯正。這些都是我們目前在做的工作。大家如果查看Open Manus的GitHub,會發現我們已經開始了一些學術合作。我們希望能基於MetaGPT和Open Manus來訓練自己的Agent模型,並結合強化學習一起推進。我認為Agent下半場還需要另一個重要能力,就是跨環境能力。目前Agent還只是活在瀏覽器裡面或者一個單一的環境。它是否能夠跨越到不同的應用環境中。我們在處理問題時,往往不只需要在瀏覽器上操作,還需要使用其他應用軟體,比如繪圖軟體或專業的報表軟體。那麼Agent能否跨越這些應用環境來幫我們解決問題呢?我認為這是一個非常重要的能力。就像現在有各種各樣的程式碼開發產品和工具,每個工具都有自己的專長——有的擅長前端開發,有的擅長後端開發,有的擅長資料分析。那麼Agent能否自主使用這些不同的軟體,幫我們建構更複雜的應用呢?這確實是一個關鍵能力。隨後談到跨環境能力,第二個重要方向是Agent在產品層面的進化能力,也就是自主學習和進化。無論是通過軌跡資料訓練還是增強模型能力,這都是一個階段性的過程。最初,我們通過資料來提升它解決問題的能力。但隨著個人使用頻率增加、應用場景資料積累,它能否從這些資料中持續學習?比如說,能否提升解決問題的效率,將原本需要50步的操作簡化為10步?這樣不僅可以降低成本,還能提供更個性化的解決方案。這種進化能力對Agent來說至關重要。相信在下半場,我們會看到更多這樣的產品——越用越符合使用者個性化需求的體驗。徐思彥:那也非常感謝今天三位老師從各自專業的角度幫我們很客觀的認識了 manus 這款火爆產品。以及對 Agent 下半場的展望,各自都提出了非常有建設性的建議和分析,那由於時間的關係呢,我們今天的圓桌討論就到這裡,接下來還有一點的時間,我想提就是代表線上的觀眾給各位提一些問題,大家來解答。Q&A徐思彥:今天這場直播非常火爆,大家在後台都留了很多的問題,那首先第一個問題就是在課前就有同學問的,也比較有代表性的,Agent 現在發展的這麼快,我們的工作還有多久被取代呢?揭光發:我可以跟這位同學講,其實你有這種想法並不孤單,其實不是你自己有這個想法,其實可能是一個生產力爆發的這個階段,大家都會有那種共同的焦慮。前一兩個星期我其實也是去聽了梁寧老師的產品課,裡面其實也有一個拷問,就說 AI 發展到現在很強大了,那我們作為產品經理,我們的工作還還能保得住嗎?對,原來其實我們程式設計師本身我們我們會發現,像cursor寫程式碼的這個工具已經已經很厲害了,我們都在懷疑後面還需要我們寫程式碼嗎?對吧。沒想到隔壁產品經理他沒有這種焦慮。對,所以說這個其實是一個共性的問題, AI 它對整個領域或者行業的打擊是全行業的,沒有差別的。這個是事實哈,但是我們要看你是怎麼去看待這個問題,角度很重要。讓我來分析一下。我們可以從兩個角度思考:存量思維和增量思維。存量思維認為我們現有的工作和需求就這麼多,既然AI已經能完成這些工作,那我們豈不是沒事可做了?是不是就要面臨失業了?這種想法很自然,我相信大多數人最初都會這樣想。這種情況就像當年珍妮紡織機和汽車出現時一樣,那些行業工人的焦慮和恐慌本質上是一樣的。但我們可以換個角度,用增量思維來看這個問題。回看那些紡織工人,或者說馬車伕,雖然他們原來的行業消失了,但新的行業隨之誕生。比如在汽車剛出現時,誰能想到今天全球會有數億輛的汽車保有量呢?這在當時是完全無法想像的。所以我們要用增量思維來思考。借助AI能力,我們每個人都能成為"超級個體"。相應地,整個團隊的生產力也會大幅提升。從積極的角度看,團隊實力的增強讓我們能嘗試更多新的挑戰。比如開發者不必侷限於前端或後端,可以成為全端工程師,甚至發展跨產品的能力。產品經理可以利用AI快速開發MVP並驗證,讓所有工作都能加速推進。作為超級個體,你的能力也需要轉型。過去的編碼、寫文件、做產品原型這些技能可能不再那麼重要,你需要實現能力的迭代升級。你要成為AI的領導者,帶領AI一起工作。我把這稱為"AI領導力"——從執行具體事務轉變為制定目標、管理並驗收AI的工作成果。意味著每個人都將從執行者轉變為小型管理者。這是未來工作本質的重大轉變,也對我們提出了新的能力要求。徐思彥:我們觀察到每個人對於 Agent的使用門檻是不一樣的,然後團隊寫作裡面也有很多複雜的傳統意義上需要人去溝通的問題,那這會不會是 Agent 在企業落地的一個障礙,有沒有解決的方法?洪思睿:這確實是個很好的問題。目前大家的共識是,我們會將問題解決流程的介面標準化後提供給業務方,這樣可以減少人機互動環節,因為介面不標準化會影響最終的處理效果。隨著AI能力的提升,它不僅能進化,還能實現個性化,並學習業務資料。這意味著介面會越來越開放,當同一業務需要服務企業內不同團隊時,這些資訊流程可以靈活適配,實現自適應。徐思彥:好,那最後一個問題給余一,涉及剛剛談到的 AI 領導力建設,在個人使用 Agent 的場景,有沒有什麼建議給到大家怎麼樣把 Agent用好?余一:我先介紹一下背景:之前我在騰訊內部網路和騰訊研究院的科技向善節上分享過,講述了我在AI協作2000小時後的心得體會。那裡有更詳細的內容,但今天我想簡單談談。雖然剛才揭老師給大家做了很好的心理按摩,但我可能要帶來一些不太樂觀的消息。這來自於我平時大量接觸企業家的工作經歷。今年出現了一些很強烈的訊號,我覺得對所有人來說都是一個警醒。過去兩年,我遇到的企業家和業務負責人,跟我討論的主要是一些AI相關的宏觀問題。但今年不同了。現在他們問的都是具體問題:怎麼做AI私有化部署?有什麼可以借鑑或直接參考的成功案例?如何重構組織流程?他們都在積極擁抱AI。很多人告訴我已經準備好了資金,想知道該用什麼戰略來推進,反覆提到的就是提升人效、降低成本。這是當下企業老闆們正在思考的核心問題,也顯示出他們對AI的強烈擁抱意願。第二點是兩個令人震驚的真實資料。我有個朋友在經營一家企業,我問他為什麼客服和銷售體系還沒有大規模採用AI。他說當時AI只能幫他裁掉兩個人。他說:"我們總共才八個人的團隊,只能裁掉兩個,要改造整個流程的隱性成本太高了。"但到了去年年底,他的團隊就只剩下兩個人了。我再分享幾個例子。我有個做低程式碼平台的朋友說,他們公司現在一半的程式碼都是AI生成的。這說明企業使用AI的程度已經到了一個新的階段。再說說矽谷的情況。那邊的公司在用AI更新老舊的程式碼系統。為什麼呢?因為在矽谷,請程式設計師很貴,而且好的程式設計師不願意做這種重複性工作,能力一般的程式設計師又做不好。現在他們有了新辦法:花200到500美元讓AI生成程式碼,再請一個資深程式設計師來檢查。這樣既省錢又高效。當然,這也意味著一些初級程式設計師可能會失業,這是個不太好的消息。我觀察到2025年是個重要的轉折點。不管是混合辦公方式,還是工作流程的改變,包括提高工作效率,都會有很大變化。這種變化不光是在產品層面,企業內部用AI的情況也越來越多。說到AI什麼時候會取代人,外行人往往會給出一些很籠統的回答。但我覺得,在現在這波AI浪潮中,籠統的分析意義不大。我覺得AI的能力就像一條鋸齒狀的線,遠遠看是一條直線,但走近了才能看清它在不同方面的強弱。所以我一直建議朋友們:如果今年還不開始用AI,恐怕就要被市場淘汰了。至於人類還剩多少工作,或者每周能有多少工作時間,這些問題只有自己能回答。你必須把AI引入工作和生活中,親自體驗它在不同場景下的優勢和侷限。只有這樣才能得出結論。第二點是關於態度問題。我一直認為,也現在依然堅信,用好AI是關鍵。就像揭老師說的,要做AI的好老闆。好老闆不一定要比下屬能力強,但要能提供他們沒有的資源,展現你的價值。否則,就像員工會獨立創業一樣,你不僅要善於協作。你要證明"跟我合作,我能給你提供獨特的資源和能力"。我現在的態度就是:我們要學會給AI 打工。跟 AI 協作的態度就是說去確認我能給 AI 提供什麼樣的價值。徐思彥:2025年註定是不平凡的一年,相信大家在看到各種新奇實用的AI模型和產品的同時,自己的工作也將迎來巨大的改變、融合與挑戰。今天的圓桌就到這裡了。再次感謝三位專家的精彩分享。今年我們會繼續不定期舉辦圓桌活動,圍繞生成式AI的最新進展、創新,以及它對我們的影響展開討論。如果大家想要搭上正確的船,歡迎持續關注我們的圓桌活動。 (騰訊研究院)
晚點獨家丨比亞迪 2025 年銷量目標 550 萬輛,在舒適區外找增長
今年比亞迪提高了對高端市場、海外市場的增長預期。我們獨家瞭解到,比亞迪董事長王傳福今天小範圍公佈今年的總銷量目標是 550 萬輛,包含海外市場的 80 萬輛以上。換算下來中國市場銷量增速約為 30%,海外市場增速則高達 91.8%。做了三年第一後,比亞迪對中國的銷量預期在更高的基數下變得謹慎,增長規模和增速略弱於 2024 年。2025 年是比亞迪的產品大年,四個品牌共有近 20 款新車發佈,已有的 21 款車型為提高產品力也會換代、增推智駕版本。僅 3 月,比亞迪就密集辦了 6 場新車發佈會。當然,員工和經銷商接到的銷售任務可能更激進。比亞迪慣常制定對內、對外兩個銷量目標。對外目標保守,2021 年後每年都能超額完成。對內目標通常更高,以要求、激勵團隊。比亞迪更靠近王傳福 2023 年時 “歷史上最好時期” 的判斷:它去年賣出了成立以來最多的車,佔中國新能源車市場的 1/3 ,推動營收、淨利潤同步增長 30% 左右至歷史新高,汽車及相關業務收入 6173.8 億元,有 1549 億元的現金儲備。在 2023 年、2024 年的快速擴張中,比亞迪開始前所未有地激進投入。它兩年擴招了 2 萬名工程師、技術研發投入 941 億元——這比此前 10 年累計的研發費用還要高。比亞迪正同時面對兩類挑戰,高昂花費用於應對複雜問題。一方面,要在大眾市場繼續增長、保持競爭優勢,考驗比亞迪對技術的工程化落地和成本控制。仰望、騰勢、方程豹三個高端品牌則更需要技術、產品的領先性。它希望且擅長靠規模、垂直整合和成本紀律把驗證過的技術做得更便宜、某項技術指標更領先。這是比亞迪在三電業務上驗證過且繼續執行的打法,最新動作是將新一代純電平台的充電功率提高至 1000V,比主流車企的下一代 900V 更高。這一策略延續到智能化領域。比亞迪一開始就以百萬輛的規模攤銷成本,將輝達 Orin X 和 5 顆毫米波雷達的智駕組態成本壓縮至 3000 元左右、比行業平均水平低數百元,從而用在 7.88 萬元的海鷗上。吉利、奇瑞、長安等已經快速跟進智駕普及策略,要以此在大眾市場增長變得更難。主攻主流價位的王朝、海洋 2024 年佔總銷量的 94.7%。我們獨家瞭解到,這兩大核心繫列 2025 年的銷量增幅目標為 10% 內,預計在整體的銷量佔比降為 80% 左右。為了完成目標,王朝銷售管道計畫提高投入、擴大門店展廳面積。仰望、騰勢和方程豹要承擔更高的銷量增幅。騰勢汽車銷售總經理趙長江說,希望騰勢到二季度實現單月 2 萬台、三四季度單月 3 萬台。騰勢去年的銷量是 12.6 萬台,月均 1.05 萬台。高端市場現階段的技術競爭側重智能化、AI 化,也更看重品牌。這些都不是強調工程師文化的比亞迪的舒適區。比亞迪在高端市場的策略是以技術立品牌,為每個高端品牌設計差異化的技術標籤,比如在仰望的 “易四方” 技術後,也將 “易三方” 技術作為騰勢獨有技術、而不是分享給其他品牌。不過,目前這類技術集中在它過去擅長的三電、底盤等領域。在智能化領域,AI 改變了智駕的演進方式,一家企業可以靠少數、領先的人才快速超越堆人力、堆時間的同行,行業比拚從 L2 級智駕體驗進入 L3 級智駕落地時間。我們此前報導過,比亞迪短期內會和頭部供應商合作、提升高階智駕體驗,它也已經加大對 AI 大模型、智算中心等投入,加快自研。王傳福在財報中說,會快速推進 AI 資料中心、AI 伺服器等新興業務,作為 “新的成長曲線”。在更重科技領先、軟體演算法而非工程能力的智能化業務,比亞迪需要找到並證明一套有效的方法論。比這更難的是開拓高端市場,高端品牌的本質是說服使用者付出比產品價值更高的溢價,需要更長周期、更多維度的能力。守第一往往比做第一更難。比亞迪過去靠對標超越的模式陸續超過自主、合資品牌,成為全球銷量最大的新能源車企、中國銷量最高的車企。它補上了所有明顯的短板,也就做完了所有簡單的題目。 (晚點LatePost)
《美國百年全球戰略》:美國“稱霸”的兩大先天優勢
《美國百年全球戰略:第一次世界大戰以來美國全球霸權的歷史演進》 《美國百年全球戰略:第一次世界大戰以來美國全球霸權的歷史演進》認為,地理條件並不存在絕對優劣之分,歸納了美國獲得全球霸權的四條歷史經驗:一是將引領第二次工業革命,將其經濟科技成果順應全球市場與貿易大潮流;二是在靈活巧妙地與歐洲列強和日本戰略周旋中,形成穩健而不失靈活的國家大戰略;三是與當時最強者英國避免戰爭前提下,充分利用戰爭和危機,謀求和塑造國際秩序中有利位置;四是激發國家和社會創新本能,主動進行其他國家軍隊難以追趕與倣傚的軍事變革。 作者認為,歷史上所有稱霸者,無一不將先天優勢發揮至極致。相對於古代西方的羅馬和古代東方的秦漢帝國,以及近代英國等“前輩”們,作為“繼承者”的美國具有兩大先天優勢。 一是從未遭受封建集權制度侵蝕,成為最富內在創新活力的大國。15世紀,躲避歐洲(尤其是英國)宗教迫害的清教徒,懷揣反對集權壓迫、追求公正的心靈嚮往,源源不斷奔向美洲新大陸。他們自稱“朝聖者”,希望將此生之地變成馬薩諸塞移民領袖約翰·溫斯羅普所言的“令萬民仰望的山巔之城”。從此,任何自視宗教神權權威和任何封建集權的苗頭,都會在這片大陸上遭到仇視。新移民經過生生不息的繁衍交融,骨子裡對宗教神權和封建集權制度的厭惡代代相傳,養成了追求獨立、崇尚競爭、喜好標新立異、輕蔑通過人身依附達成個人目的的民族性格,逐步累積成區別於歐洲、亞洲、非洲土地上古老民族獨樹一幟的的文化底蘊。