近日,中國企業發佈了全球首款通用型AI Agent——Manus AI,在科技界引發了廣泛關注。與傳統的AI助手不同,類似Manus這樣的應用,不僅僅停留在生成文字或提供建議的層面,而是能夠獨立思考、規劃並執行複雜的任務,實現“從指令到結果”的一站式服務。在最近的輝達年度技術大會(GTC)上,黃仁勳將Agentic AI(代理式人工智慧) 定義為人工智慧技術演進的關鍵階段,其核心在於從“生成式AI的單次響應”升級為具備自主推理能力的智能體。由騰訊研究院和騰訊學堂主辦的圓桌圍繞以Manus、Deep Research為代表的的下一代Agent在產品創新、技術架構做了深度的解讀,探索下一代Agent新範式。【圓桌嘉賓】洪思睿DeepWisdom(MetaGPT),NLP/Agent方向研究員,主要負責演算法研發與科研工作,OpenManus開放原始碼專案核心貢獻者之一。曾獲NeurIPS 2019 AutoDL競賽(NLP)世界冠軍,開源多Agent框架MetaGPT論文(ICLR 2024 Oral)與資料直譯器(Data Interpreter)論文一作,以及AFLOW論文(ICLR 2025 Oral)作者之一。目前主要關注Agent(多Agent)系統的設計,性能最佳化等方面,專注Agent在程式碼生成、複雜資料分析自動化及LLM推理能力增強等領域的應用效果。多篇研究成果已發表於TPAM,ICLR等國際頂級學術會議與期刊。kongjie(揭光發)騰訊專家工程師,大模型應用早期實踐者與布道師。主講《AI Agent:建構智能應用的新範式》、《大模型提效研發,從Copilot 到 Auto pilot》等公司級課程。負責支撐騰訊視訊視媒資星海營運管理矩陣系統群;負責玲瓏CMS、UN、飛流、邏輯編排及媒資BFF等低程式碼平台的架構設計與升級。曾任公司低程式碼Oteam 負責人,主導Agent建構與運行平台Edan(A.K.A鵝蛋)、邏輯編排系統Loki的設計與開發,是IEEE低程式碼標準的主撰寫人。余一騰訊青騰 AI 及全球化項目經理。之前是一家風險投資機構的市場投後副總裁,也在科技創投媒體待過多年,曾連續兩年獲評領英中國年度行家。野生AI布道師,2024年騰訊年度優秀行家,得到 AI 學習圈導師,人人都是產品經理2024年年度AI 行家,多家AI產品公司和獨角獸公司的野生外腦。得到、騰訊學堂多門課程、《AI 個人探索指南系列》、《AI 產品及公司變革研究系列》等開源文件,超二十萬人閱讀學習。在公司內部,也支援了騰訊科技向善周、騰訊程式設計師以及多個部門的AI內部培訓分享等。主持人:syanxu(徐思彥)博士,騰訊研究院高級研究員、《AGI路線圖》主理人,主要研究領域為網際網路產業經濟,負責對網際網路前沿技術與趨勢跟蹤研究,研究前沿數字科技帶來的創新經濟模式,主要關注領域為AIGC、區塊鏈。牽頭研究及撰寫《機器外腦:大模型十大趨勢》、《產業區塊鏈》、《產業網際網路:建構智能+時代新經濟圖景》等。清華大學博士學位,美國麻省理工學院訪問學者。【內容介紹】聚焦Manus等類似的產品創新、Agent技術前沿、下一代Agent新範式,深度探討以下問題:1.Manus實測真實效果如何,如何評價其產品設計?2.目前AI Agent展現能力的場景有那些?3.AI Agent在技術上那些重大進展?4.Manus等應用為AI Agent的發展帶來那些啟示?5.如何看待Agent發展的“下半場”?6.未來AI Agent需強化那些核心能力?......(根據圓桌內容整理:DeepResearch與Manus的對比)(根據圓桌內容整理:下一代Agent特徵)要點提要:1.下一代Agent技術的進化多Agent系統:Manus採用了多個AI助手協同工作的方式,雖然運作方式基本固定,但展示了多Agent系統的潛力。記憶和上下文管理:未來的Agent需要增強記憶能力和上下文理解能力,以更好地處理複雜任務。端到端訓練:Deep Research展示了通過端到端訓練,將整個AI助手的能力直接做成一個模型的方向,這被認為是下一代AI助手的發展方向。2.下一代Agent的特徵自我評估能力:未來的Agent需要具備自我評估和反思能力,以提升自主能力和智能水平。跨環境能力:Agent需要能夠跨越不同的應用環境,自主使用各種軟體工具來解決問題。自主學習和進化:Agent應具備從使用資料中持續學習和進化的能力,以提升解決問題的效率和個性化程度。3.我們應該怎麼應對AI時代就業的改變?增量思維:用增量思維來看待AI的發展,認識到新的行業和工作機會會隨之誕生,每個人都能成為“超級個體”。AI領導力:從執行具體事務轉變為制定目標,管理並驗收AI的工作成果,成為AI的領導者。持續學習和適應:用好AI的關鍵在於持續學習和適應,親自體驗AI在不同場景下的優勢和侷限,找到自己的價值定位。以下是圓桌全文:Part I 應用實踐徐思彥:我注意到可能有很多同學還沒有用過Manus,或者還沒有拿到試用資格。余一,請你給大家介紹一下Manus是怎麼工作的,還有,為什麼你覺得它特別像一個實習生?余一:作為一個普通使用者,我很早就開始關注AI助手這個領域,也一直在關注Meta GPT的產品。我的程式設計能力不強,以前用AI助手產品時總是遇到很多問題。這些產品對普通使用者來說不太友好:安裝很麻煩,介面不好用,遇到問題時不知道怎麼解決。有時候花錢買了卻用不好,讓人很沮喪。但這次用Manus的體驗完全不一樣。可能是因為現在使用者還不多,整個產品用起來特別流暢。讓我特別驚喜的是,它只用了17分鐘就幫我完成了一份很完整的行業分析報告。這份報告包括了:行業現狀分析、發展趨勢預測、重要公司篩選以及每個公司的詳細資訊。我還試用了它的其他功能,比如製作網頁、開發小程序,還有在小紅書上發圖片。整個體驗都很順暢,特別是那份17分鐘就完成的分析報告,真的讓我感到驚喜。雖然市場上對這個產品有不同看法和爭議,我在朋友圈稱之為"Agent的DeepSeek時刻"。我之所以這樣評價,是因為它的產品設計確實出色。它會展示詳細的任務清單,讓使用者清楚看到它如何規劃和分解工作。與以往的AI不同,這個產品不需要太多預設就能智能地處理問題。它能同時處理多個任務,一步步完成並最終交付完整結果,整個過程非常流暢。這讓我想到其他AI產品的發展歷程。我早期使用過O1,但它不展示思考過程。後來的DeepSeek R1雖然可以看到思考過程,但效果不夠理想。不過,R1的思考方式已經讓我印象深刻。這款新產品通過展示所有步驟和任務清單,讓使用者能看到完整的工作過程。在資料分析、總結和行銷策略制定等方面,它的表現堪比一個優秀的實習生。但在程式設計方面還需改進——比如編寫貪吃蛇遊戲或開發小程序時,效果不如Claude 3.7。最近市面上也出現了其他類似的AI開發助手。總的來說,這是一款對普通使用者非常友好的產品。使用後,你就能真正理解什麼是AI助手——它就像一個能夠自主規劃、分解任務並執行的智能助理。這是一個完整但並非完美的產品,它仍受限於自身的技術和AI模型能力,正在不斷進步和完善中。徐思彥:現在對於Agent還沒有統一的定義,你們是如何定義 Agent的,manus 的這個產品設計符合對Agent 演化的預想嗎?揭光發:關於Agent的定義,我們可以這樣理解:與傳統的語言模型(LLM)純文字生成或聊天模式不同,Agent是一個能夠自主思考、規劃,並使用工具來完成使用者任務的系統。它能形成一個完整的任務閉環,不只是針對問題生成簡單回應就結束。傳統的聊天機器人可能只會打個招呼或寫個故事,但真正的Agent能夠理解使用者需求,進行網路搜尋、生成檔案、編寫程式碼,最終將完整的成果交付給使用者。在過去兩年,業界對Agent這個術語的使用較為混亂,有些從業者甚至把簡單的語言模型文字生成也稱作Agent。因此,我們需要釐清Agent的概念:現在所說的Agent應該是能夠完成具體任務的系統,就像一個實習生能夠完成交辦的任務那樣,而不是僅僅通過對話給出簡單的反饋。從使用語言模型到現在,這個領域經歷了相當長的發展。以程式碼生成為例,Manus的產品形態借鑑了至少兩三個技術產品。其中之一是Devin,這是由一個華人團隊開發的產品。Manus借鑑了Devin在瀏覽器中可視化展示程式碼編寫過程的創新。此外,Manus還採用了其他產品的常見做法,比如制定計畫和任務清單,這在GPT Pilot等程式碼協作工具中很常見。它的運作方式模模擬實開發團隊,將大任務分解成小任務。GPT Pilot建立了任務資料庫,讓AI"工程師"可以認領並完成編碼測試任務。所以,Manus的設計並非完全原創,而是整合了其他產品的優秀功能,這也是為什麼有人說它是"拼湊"不同技術的產品。不過,Manus確實巧妙地整合了這些優秀功能,給普通使用者帶來驚喜。作為業內人士,我認為Manus最大的成功在於產品體驗方面:它讓使用者能清晰地看到AI完成任務的每一步,並即時瞭解進展。這種體驗設計確實出色。但從技術層面來說,它使用的都是近兩年比較常見的技術,沒有太多突破。關於AI助手的未來發展,我們稍後再討論。徐思彥:Manus給自己的一個定義就是業界“第一個通用Agent”,那這到底是一個概念的炒作呢,還是事實上它具備了一定程度的通用能力呢?揭光發:我覺得他們在做行銷概念方面很擅長。實際上,這種Agent的基本框架並不複雜——現在的程式設計師用現成的開源框架,一天就能做出一個類似的Agent。關於它是否真的"通用",主要要看它能用什麼工具。比如在程式碼生成領域,像Cursor這樣的工具,它就專注於寫程式碼、讀寫檔案、查詢網路資訊等程式設計相關的功能。Manus確實內建了29個工具,這一點已經被網上的人分析出來了。這些工具能夠完成日常工作中的很多基本任務,比如寫作、收集資訊、分析資料、寫程式碼和瀏覽網頁等。正是因為它的工具覆蓋面比較廣,所以它才說自己是"通用"Agent。但這並不意味著它真的什麼都能做。比如讓它去炒股或者處理一些專業領域的特殊任務,它就做不了。所以精準地說,它只是一個功能相對豐富的基礎智能助手,而不是真正意義上的通用Agent。這更多是一個行銷手法,顯示出這個團隊在市場推廣方面很有能力。徐思彥:如果說DeepSeek 相較之前大模型的改進在於通過結合大模型與專家模型來節省資源。那麼對於Agent來說,專注細分領域和“通用型”Agent,那種路徑更易落地?揭光發:在Agent技術層面,其實就像基礎素質教育一樣,大家都需要有基本能力。但像人類社會一樣,Agent也需要有分工和專業化,根據不同場景提供不同的解決方案。這是一個可行的發展路徑。因為完全通用的Agent在實際應用中反而有侷限性,專業深度不如垂直領域的Agent。比如用Claude 3.7做程式碼生成,畫SVG的質量就比寫程式碼好得多。這是因為在垂直領域投入了更多最佳化,而通用Agent難以在每個領域都做到這麼深。徐思彥:請余一跟我們分享一下,你覺得AI Agent正在怎麼樣重塑你的工作流?余一:現在的AI系統底層能力很強,整合了很多工具,可以在多個領域都發揮作用。我自己最近也在深入使用這些AI工具。這些AI助手真的很靈活,既能處理日常工作,也能應對專業任務。比如在做調研時,它既可以處理一般性的資料收集,也能提供專業領域的分析。我覺得,如果一個AI只是簡單加入了某個行業的專業知識,這樣還不夠。反而是通用型AI可能更有優勢,因為它技術更全面,基礎能力更強,而且使用起來更省錢。這種通用AI很可能會替代一些基礎的專業AI。我在探索它在工作和生活中的作用,看看它有什麼優點和不足。雖然還沒有完全改變我的工作方式,但像Claude、GPT-4 Pro這些AI工具已經成為我工作中重要的幫手。最大的變化是在搜尋方面,現在我不用事事親力親為,只要把任務交給AI,定期檢查結果就行。而且它會及時反饋進度。給我最大的感動就是屬於說“不用給 AI 配一個人”,但我也在測到底有多少個任務是可以把我從這裡面重度解脫出來,或者是我可能只需要在一定的階段裡面去做一下 check 和和指指明方向的任務。Part II 技術理解徐思彥:我們剛才討論了應用和產品創新方面的理解。第二部分,讓我們探討一下Manus的技術層面。Manus的AI核心技術是在過去兩年各項技術基礎上的一個整合。那麼它與OpenAI的Deep Research、Devin這些產品相比,具體有那些異同呢?揭光發:好,讓我來解釋一下目前的技術發展情況。Manus的工作原理和流程圖現在網上都能看到。說實話,Manus在核心技術上並沒有太大突破,主要的技術創新反而出現在Deep ReSearch這類產品上。Manus採用了多個AI助手(Agent)協同工作的方式。它包括計畫制定、總結和審查等功能,這些功能都需要多次呼叫大語言模型。有人把這叫做"多Agent系統",但實際上更像是一個固定的工作流程。雖然官方團隊說他們不是簡單的工作流,但他們的運作方式基本是固定的。真正的多Agent系統應該是各個AI助手之間能夠自主互相呼叫和交流,而不是依賴中心化的控制流程。在技術實現上,Manus使用了一些後訓練技術,比如用大模型蒸餾資料到較小的模型中。這樣做是必要的,因為如果每次都要載入大量上下文和說明文件,運行成本會很高。總的來說,Manus在技術層面做得很紮實,但沒有特別突出的創新。他們最大的成功是在產品體驗上。說到產品體驗,有一個有趣的變化:以前當AI在思考和查詢資訊時,使用者會覺得系統太慢,看不懂中間步驟。但是從DeepSeek R1開始,它把推理過程清楚地展示出來,讓使用者理解AI需要時間來思考。Manus更進一步,即使需要10-20分鐘完成任務,使用者也能接受這個等待時間。現在使用者已經理解AI程序比普通程序要慢,需要思考時間。當我們把這個過程描述為"AI在認真思考"時,使用者的接受度就提高了很多。這是Manus和DeepSeek R1在產品體驗上帶來的重要改變。接下來說說幾個重要的AI產品。MGX是洪老師團隊的產品,它的特點是24/7不間斷工作的AI開發團隊,通過多個AI助手協作來完成軟體開發。在專業領域應用方面,MetaGPT做得非常出色,開發了很多優秀的開源框架。最後要說的是Deep Research,我認為這代表了下一代AI助手的發展方向。它採用了完全不同的方式:通過端到端訓練,把整個AI助手的能力直接做成一個模型。這不同於目前的方式,現在都是把大語言模型和各種工具組合起來,由程式設計師寫控製程序來協調。我相信未來的AI助手會回歸到模型訓練的方式。Deep Seek已經在他們的NSA論文中提到了倉庫級的程式碼生成和主動式AI助手的目標。他們開發的新注意力機制就是為了處理超大規模文字而設計的。這是一個值得關注的發展方向。徐思彥:Manus,包括現在其他的AI Agent,它們的主要技術瓶頸在那裡?如果他沒有瓶頸的話,其他團隊是否可以快速複製?揭光發:關於AI Agent的技術瓶頸,基礎Agent不難搭建,有程式設計經驗者借助現有工具,一天內可理解其工作原理。但真正可用的Agent挑戰更大,關鍵在於錯誤容忍度。大模型生成內容有錯誤,多次呼叫會降低精準率。在研報調研等場景,錯誤容忍度較高;而在程式碼編寫等場景,錯誤容忍度低,需專業程式設計師介入。特別是資料操作類Agent,錯誤可能影響生產。因此,需根據不同場景判斷錯誤容忍度,這決定了Agent的可用性。再看錯誤原因,首先是模型智能程度,即單次呼叫大模型的結果是否可接受。目前,SOTA大模型在單次生成上通常優於人類。在簡單場景下,大模型的表現已經超出人類平均水平。比如在基礎程式碼編寫方面,它能快速生成高品質的函數和單元測試。但在複雜場景中,比如處理多檔案程式碼或涉及隱含知識時,其表現會大幅下降。這引出了核心瓶頸:記憶能力。目前大模型是無狀態無記憶的,技術上通過為大模型提供豐富的關聯上下文來模擬記憶, 而提供上下文又不僅僅是儲存並提供歷史對話那麼簡單。往往又會涉及幾個核心技術點包括上下文的窗口大小RAG技術. 前者通過擴大模型的上下文窗口好讓它在一次對話中儘可能多的輸入內容, 但當前大多數模型在超大的上下文上表現的性能仍然差強人意,這裡需要一個強有力的解決方案DeepSeek的NSA論文提到的原生稀疏注意力有望解決這個問題;而使用RAG方式來召回記憶,又會面臨embedding質量和召回精準率的問題,這使得實現有效記憶變得極其困難。這裡面還有很多技術細節,但簡單來說,影響AI Agent性能的兩個核心要素:一是模型本身的智能程度,二是在處理複雜規模問題時的上下文和記憶管理。這兩點直接決定了Agent的性能表現,其中後者尤為關鍵,也是當前業界投入大量研究的重點方向。徐思彥:洪老師,請你介紹一下你們在開發的OpenManus項目的背景。洪思睿:關於OpenManus項目的背景,最初是想用我們自己開發的多Agent框架來挑戰SweetBench基準測試。SweetBench是一個項目等級的程式碼修複數據集,要求在程式碼倉庫中定位和修復程式碼。因為需要處理大量程式碼,我們開發了專門的程式碼定位、掃描和讀取工具。隨著大模型能力不斷提升,我們把這些開源工具整合到倉庫中,並且簡化了使用流程。雖然項目最初專注於程式碼修復,後來我們又增加了網頁瀏覽等功能。Open Manus採用傳統的Agent架構,結合提示詞工程和工具呼叫能力,提供了輕量的Agent開發框架。為了處理長上下文問題,我們也嘗試在記憶管理方面進行最佳化。另外,我們的產品(MetaGPT X)與此不同,它專注於生成完整的軟體項目。最大的創新是它實現了基於任務難度自動分配不同Agent解決問題,具備動態路由和自適應拓撲結構。舉例來說,資料分析任務會自動分配給資料直譯器Agent,而前後端開發則交給工程師Agent處理。系統能夠根據任務的複雜程度動態調整這種分配方案,並讓任務的完成度足夠高。Part III 下一代AI Agent趨勢徐思彥:現在讓我們進入第三個話題,這可能是大家最感興趣的:Manus會給未來的AI Agent帶來什麼啟發?余一:關於這個產品的壁壘,我認為最核心的是其對使用者需求的深刻洞察。在產品發佈前,我和產品負責人小紅交流過,他們在產品設計上做了很多思考,包括記憶、多模態搜尋和多模型呼叫等技術創新。他們觀察到,雖然目前市場主要集中在底層大模型升級和B端應用上,但在ToC產品方面存在明顯缺口。大眾使用者需要更進一步的、易用的AI產品,而不是僅僅停留在基礎的大模型推理能力上。這款產品借鑑了許多成功經驗,團隊認為當前正是切入消費級AI市場的最佳時機。產品設計特別注重使用者體驗,包括流暢性和完成度,為未來的Agent產品開創了一個好的範例。目前看來,無論是資本圈、市場還是使用者的接受度都相當不錯,這也說明市場對這類產品有著強烈的需求。徐思彥:洪老師,你覺得是那些能力是接下來 Agent 最需要強化?Deep Research在此前的訪談中也提到他的最終目標還是要做一個面向AGI 的Agent,什麼樣的Agent 可以符合這樣的標準?洪思睿:讓我從技術角度分享一下我的理解。首先,不管是Manus還是其他Agent產品。它們都缺乏一個關鍵能力:自我評估。雖然這些Agent能用各種工具規劃並解決問題,但它們還不會評估最終結果是否達到預期。這種評估能力或自我審查能力非常重要,系統需要給Agent提供這樣的反饋。因此在建構Agent系統時提供環境閉環反饋是一個重要環節。無論是通過獎勵學習來實現,還是在環境中設定相應的反饋模型。如果Agent能夠評估結果,就能進一步評估目標完成情況,從而提升自主能力和智能水平。此外,關於核心能力我們現在看到,無論是更通用的多步推理能力,還是工具使用能力,訓練成本都很高,需要採集大量軌跡資料,通過後期訓練,包括各種強化學習方法來訓練。但是,我們可以探索讓Agent在推理中自主增強能力。也許不需要確認特定模型,而是讓Agent主動進行多次探索環境。在整個探索過程中,可以引入整合或混合能力,從而提升最終效果。當然,這需要降低整體探索成本。舉個例子,如果一次執行效果不好出現幻覺,我們可以用不同設定嘗試五次,然後混合這些結果。關鍵是要讓使用者感覺彷彿只執行了一次,保持速度和成本。這對工程能力確實提出了巨大挑戰。目前任務的學習資料量仍然不足,即使單個任務的資料量要求是幾百條,大量不同任務的採集和合成都需要耗費大量資源。我們需要探索新方法,比如將元學習(meta learning)引入Agent設計中。這樣能讓Agent以更高效的方式學習新任務、適應新環境,從而更好地解決使用者的各類問題。雖然Agent已經處理過許多類似問題,但每次遇到的具體情況都會有所不同,遷移能力很重要。這些細微的問題差異正是我們需要重點突破的。同時,我們還需要加強Agent的記憶能力和上下文理解能力。目前瀏覽器端的Agent和具備多模態能力的Agent能夠感知各種類型的資料,這些資料都會進入其上下文中。關鍵在於如何保持上下文表徵的統一性,確保資訊完整,並有效整合不同模態的資訊來做出決策。這些都是未來Agent設計中需要重點增強的核心能力。徐思彥:接下來還是請揭老師展望一下你覺得這個未來的 Agent 下半場會以什麼樣的形式展開?揭光發:剛才我們已經討論了需要強化的核心能力,比如反思能力、記憶能力等。從我的觀察來看,通過端到端的訓練範式,我們其實能很好地解決這些問題。OpenAI的O1和DeepSeek的R1這兩個模型本質上是"類Agent"模型。它們的特點是不止一次生成,而是分階段生成:第一階段進行思考,第二階段基於思考結果生成答案。這種方式把原本需要多次互動的Agent功能壓縮到了模型內部的生成過程中。根據OpenAI團隊的說法,這些新一代Agent本身就是一個模型,而不是傳統的Agent工程。它們採用直接訓練方式,核心使用強化學習。DeepSeek的R1通過展示思考過程,證明了強化學習配合簡單獎勵規則就能讓模型展現出自主思考能力。這種訓練方式與傳統的提示詞教導不同——只需設定目標和獎勵機制,就能讓模型自主學習規劃和執行。目前DeepSeek還開源了NSA(原生稀疏注意力)技術,用於解決大規模程式碼生成和處理超大上下文的問題。當強化學習和稀疏注意力這兩項技術成熟後,Agent的訓練就迎來了春天。接下來我們將針對具體場景訓練Agent。我們不追求完全通用的Agent,因為這可能不太現實。相反,我們會像培養專業人才一樣,根據不同領域和職業來訓練專門的Agent。最近業界提出了一個新觀點:未來產品形態將發生重大轉變。傳統方式需要搭建模組、設計互動流程,但未來可能只需訓練一個具備服務能力的模型即可。在2023年時,我在大模型重塑軟體開發的課中就提出一個構想:生成式大模型會經歷生成文字、生成程式碼、生成軟體到最終生成服務幾個階段。前兩個在兩年前已經很常見,生成軟體這個領域,Cursor,Clien AI IDE及外掛們正在證明,而當下的Agent就是直接為我們提供服務的存在,端到端訓練得到的OpenAI Research更是進一步把服務變成可訓練可生成的。他們的模型能夠直接提供服務,而不是給使用者一個需要自行操作的軟體。這一發展令人驚嘆,僅用了兩年時間就實現了。我們已進入“模型即產品、模型即服務”的時代。這正是下半場我們需要重點關注的技術方向。徐思彥:請洪老師也分享一下對於 Agent 下半場的想法。另外,Open Manus 團隊自身下一步有什麼樣的計畫呢?洪思睿:對,我覺得揭老師講得很清楚,Agent的下半場就是要把自主能力訓練到模型裡面去。通過結合Agent的自主形態,模型能夠進一步提高解決問題的成功率。這其中有很多技術點需要突破。我們正在研究如何訓練Agent使用工具,比如將Chain of Thought (COT)的資料輸入模型中,這對提升工具決策能力很有幫助。另外就是如何合成執行軌跡的資料。因為Agent在執行過程中會有出錯行為,我們不能直接用這些行為來訓練,而是需要對資料進行處理、合成和矯正。這些都是我們目前在做的工作。大家如果查看Open Manus的GitHub,會發現我們已經開始了一些學術合作。我們希望能基於MetaGPT和Open Manus來訓練自己的Agent模型,並結合強化學習一起推進。我認為Agent下半場還需要另一個重要能力,就是跨環境能力。目前Agent還只是活在瀏覽器裡面或者一個單一的環境。它是否能夠跨越到不同的應用環境中。我們在處理問題時,往往不只需要在瀏覽器上操作,還需要使用其他應用軟體,比如繪圖軟體或專業的報表軟體。那麼Agent能否跨越這些應用環境來幫我們解決問題呢?我認為這是一個非常重要的能力。就像現在有各種各樣的程式碼開發產品和工具,每個工具都有自己的專長——有的擅長前端開發,有的擅長後端開發,有的擅長資料分析。那麼Agent能否自主使用這些不同的軟體,幫我們建構更複雜的應用呢?這確實是一個關鍵能力。隨後談到跨環境能力,第二個重要方向是Agent在產品層面的進化能力,也就是自主學習和進化。無論是通過軌跡資料訓練還是增強模型能力,這都是一個階段性的過程。最初,我們通過資料來提升它解決問題的能力。但隨著個人使用頻率增加、應用場景資料積累,它能否從這些資料中持續學習?比如說,能否提升解決問題的效率,將原本需要50步的操作簡化為10步?這樣不僅可以降低成本,還能提供更個性化的解決方案。這種進化能力對Agent來說至關重要。相信在下半場,我們會看到更多這樣的產品——越用越符合使用者個性化需求的體驗。徐思彥:那也非常感謝今天三位老師從各自專業的角度幫我們很客觀的認識了 manus 這款火爆產品。以及對 Agent 下半場的展望,各自都提出了非常有建設性的建議和分析,那由於時間的關係呢,我們今天的圓桌討論就到這裡,接下來還有一點的時間,我想提就是代表線上的觀眾給各位提一些問題,大家來解答。Q&A徐思彥:今天這場直播非常火爆,大家在後台都留了很多的問題,那首先第一個問題就是在課前就有同學問的,也比較有代表性的,Agent 現在發展的這麼快,我們的工作還有多久被取代呢?揭光發:我可以跟這位同學講,其實你有這種想法並不孤單,其實不是你自己有這個想法,其實可能是一個生產力爆發的這個階段,大家都會有那種共同的焦慮。前一兩個星期我其實也是去聽了梁寧老師的產品課,裡面其實也有一個拷問,就說 AI 發展到現在很強大了,那我們作為產品經理,我們的工作還還能保得住嗎?對,原來其實我們程式設計師本身我們我們會發現,像cursor寫程式碼的這個工具已經已經很厲害了,我們都在懷疑後面還需要我們寫程式碼嗎?對吧。沒想到隔壁產品經理他沒有這種焦慮。對,所以說這個其實是一個共性的問題, AI 它對整個領域或者行業的打擊是全行業的,沒有差別的。這個是事實哈,但是我們要看你是怎麼去看待這個問題,角度很重要。讓我來分析一下。我們可以從兩個角度思考:存量思維和增量思維。存量思維認為我們現有的工作和需求就這麼多,既然AI已經能完成這些工作,那我們豈不是沒事可做了?是不是就要面臨失業了?這種想法很自然,我相信大多數人最初都會這樣想。這種情況就像當年珍妮紡織機和汽車出現時一樣,那些行業工人的焦慮和恐慌本質上是一樣的。但我們可以換個角度,用增量思維來看這個問題。回看那些紡織工人,或者說馬車伕,雖然他們原來的行業消失了,但新的行業隨之誕生。比如在汽車剛出現時,誰能想到今天全球會有數億輛的汽車保有量呢?這在當時是完全無法想像的。所以我們要用增量思維來思考。借助AI能力,我們每個人都能成為"超級個體"。相應地,整個團隊的生產力也會大幅提升。從積極的角度看,團隊實力的增強讓我們能嘗試更多新的挑戰。比如開發者不必侷限於前端或後端,可以成為全端工程師,甚至發展跨產品的能力。產品經理可以利用AI快速開發MVP並驗證,讓所有工作都能加速推進。作為超級個體,你的能力也需要轉型。過去的編碼、寫文件、做產品原型這些技能可能不再那麼重要,你需要實現能力的迭代升級。你要成為AI的領導者,帶領AI一起工作。我把這稱為"AI領導力"——從執行具體事務轉變為制定目標、管理並驗收AI的工作成果。意味著每個人都將從執行者轉變為小型管理者。這是未來工作本質的重大轉變,也對我們提出了新的能力要求。徐思彥:我們觀察到每個人對於 Agent的使用門檻是不一樣的,然後團隊寫作裡面也有很多複雜的傳統意義上需要人去溝通的問題,那這會不會是 Agent 在企業落地的一個障礙,有沒有解決的方法?洪思睿:這確實是個很好的問題。目前大家的共識是,我們會將問題解決流程的介面標準化後提供給業務方,這樣可以減少人機互動環節,因為介面不標準化會影響最終的處理效果。隨著AI能力的提升,它不僅能進化,還能實現個性化,並學習業務資料。這意味著介面會越來越開放,當同一業務需要服務企業內不同團隊時,這些資訊流程可以靈活適配,實現自適應。徐思彥:好,那最後一個問題給余一,涉及剛剛談到的 AI 領導力建設,在個人使用 Agent 的場景,有沒有什麼建議給到大家怎麼樣把 Agent用好?余一:我先介紹一下背景:之前我在騰訊內部網路和騰訊研究院的科技向善節上分享過,講述了我在AI協作2000小時後的心得體會。那裡有更詳細的內容,但今天我想簡單談談。雖然剛才揭老師給大家做了很好的心理按摩,但我可能要帶來一些不太樂觀的消息。這來自於我平時大量接觸企業家的工作經歷。今年出現了一些很強烈的訊號,我覺得對所有人來說都是一個警醒。過去兩年,我遇到的企業家和業務負責人,跟我討論的主要是一些AI相關的宏觀問題。但今年不同了。現在他們問的都是具體問題:怎麼做AI私有化部署?有什麼可以借鑑或直接參考的成功案例?如何重構組織流程?他們都在積極擁抱AI。很多人告訴我已經準備好了資金,想知道該用什麼戰略來推進,反覆提到的就是提升人效、降低成本。這是當下企業老闆們正在思考的核心問題,也顯示出他們對AI的強烈擁抱意願。第二點是兩個令人震驚的真實資料。我有個朋友在經營一家企業,我問他為什麼客服和銷售體系還沒有大規模採用AI。他說當時AI只能幫他裁掉兩個人。他說:"我們總共才八個人的團隊,只能裁掉兩個,要改造整個流程的隱性成本太高了。"但到了去年年底,他的團隊就只剩下兩個人了。我再分享幾個例子。我有個做低程式碼平台的朋友說,他們公司現在一半的程式碼都是AI生成的。這說明企業使用AI的程度已經到了一個新的階段。再說說矽谷的情況。那邊的公司在用AI更新老舊的程式碼系統。為什麼呢?因為在矽谷,請程式設計師很貴,而且好的程式設計師不願意做這種重複性工作,能力一般的程式設計師又做不好。現在他們有了新辦法:花200到500美元讓AI生成程式碼,再請一個資深程式設計師來檢查。這樣既省錢又高效。當然,這也意味著一些初級程式設計師可能會失業,這是個不太好的消息。我觀察到2025年是個重要的轉折點。不管是混合辦公方式,還是工作流程的改變,包括提高工作效率,都會有很大變化。這種變化不光是在產品層面,企業內部用AI的情況也越來越多。說到AI什麼時候會取代人,外行人往往會給出一些很籠統的回答。但我覺得,在現在這波AI浪潮中,籠統的分析意義不大。我覺得AI的能力就像一條鋸齒狀的線,遠遠看是一條直線,但走近了才能看清它在不同方面的強弱。所以我一直建議朋友們:如果今年還不開始用AI,恐怕就要被市場淘汰了。至於人類還剩多少工作,或者每周能有多少工作時間,這些問題只有自己能回答。你必須把AI引入工作和生活中,親自體驗它在不同場景下的優勢和侷限。只有這樣才能得出結論。第二點是關於態度問題。我一直認為,也現在依然堅信,用好AI是關鍵。就像揭老師說的,要做AI的好老闆。好老闆不一定要比下屬能力強,但要能提供他們沒有的資源,展現你的價值。否則,就像員工會獨立創業一樣,你不僅要善於協作。你要證明"跟我合作,我能給你提供獨特的資源和能力"。我現在的態度就是:我們要學會給AI 打工。跟 AI 協作的態度就是說去確認我能給 AI 提供什麼樣的價值。徐思彥:2025年註定是不平凡的一年,相信大家在看到各種新奇實用的AI模型和產品的同時,自己的工作也將迎來巨大的改變、融合與挑戰。今天的圓桌就到這裡了。再次感謝三位專家的精彩分享。今年我們會繼續不定期舉辦圓桌活動,圍繞生成式AI的最新進展、創新,以及它對我們的影響展開討論。如果大家想要搭上正確的船,歡迎持續關注我們的圓桌活動。 (騰訊研究院)