AGI前夕:為什麼說Manus的爆紅只是產業巨變的開始?

001 什麼是Manus? ——從「對話式AI」到「執行式Agent」的跨越

Manus是一款由中國團隊Monica研發的『通用型Agent』,它被定義為「知行合一的自主智慧助理」。

與傳統AI(如ChatGPT)的對話聊天方式不同,Manus能讓你跟他的對話產生現實影響力,能幫助你完成各種不同的「任務」。

如果Deepseek是幫你分析問題的顧問,那麼Manus就是能幫你分析問題還能幫你解決問題的助理

技術架構主要基於四大模組:

1. 虛擬機器環境:隔離的Linux系統,內建瀏覽器、Python環境等工具鏈,支援安全執行任務;

2. 多智能體協作框架(MCP):主Agent拆解任務,子Agent專精程式碼產生、資料爬取等環節;

3. 動態認知架構:透過機率圖模型即時調整任務路徑,例如在房產分析中同步處理預算與風險評估;

4. 端對端交付:從指令輸入到產生可運行的網頁應用或報告,形成閉環。

002 為什麼說Manus的影響力堪比DeepSeek?

確切來說,問題是為什麼通用型Agent的影響力堪比DeepSeek?

如果說Deepseek是大腦,那麼它用來影響現實世界的方式(手腳)有兩種:

一是確切地透過物理世界的接觸來影響人類世界,也就是機器人;

二是透過虛擬網路的存取和使用來影響部分現實世界(白領的工作),也就是Agent。兩者結合起來才足以毀滅人類世界

所以,通用型Agent本身,是網路虛擬化的機器人,你也就從概念上明白了為什麼Manus如果真的實現,它的影響力如此之大

那麼從切身體驗來說,影響力的判斷在於對人類世界的改變程度,在當下AGI之前的時間點,更多是節省的勞動效率來衡量。

如果你花了一天時間完成的特斯拉2024年獲利分析報告PPT,Manus只需要30分鐘就能完成等同甚至超出你交付品質的成果,你可以想想增加的勞動效率或節省的勞動力會形成怎樣的衝擊程度

003 為什麼是Manus,為什麼是現在?

Agent這個字是2023年開始流行的,Manus破圈了通用型Agent。

其實從GPT開始,就已經有無數通用型Agent的探索,AutoGPT、BabyAGI等都是以相同的出發點來建構通用型Agent,期望透過LLM自己來實現任務規劃和任務實現。

但為什麼不是它們?

跟機器人賽道不同,機器人完成一個任務動作所產生的影響力是可見且可改變現實世界的(例如走路、抓取)。

但通用型Agent如果只是能瀏覽網頁,那就只是一個工具屬性,而這類工具屬性網際網路時代的程式碼就能夠完成了。而且當你無法流暢的理解使用者意圖,完成PPT生成整個任務的時候,對於現實世界的影響力是非常有限的,頂多算是一個還挺有意思的玩具。

所以AutoGPT當年在技術宅盛行,卻始終無法破圈產生影響力。那麼當初的解決辦法是什麼呢?

workflow,也就是人工設定好的工作流程。在AutoGPT挑戰AGI的失利之後,很多的先行者退而求其次來嘗試能不能我不需要AI拆解大的任務,我設定好整個工作流程,你來幫我完成就好。

就像公司新來的實習生可能做不了大項目,但幫我印PPT還是可以實現的對吧?所以有了MetaGPT之類產品的嘗試。有一定效果意義上的成功,但是認為限定工作流程之後的副作用就是解決問題的侷限性,或者說影響力侷限。

MetaGPT比較是在開發者中流行,因為本身限定的工作流程場景就是網路標準開發產品的套路。

那麼為什麼是現在?為什麼是Manus?

技術上來說,之所以通用型Agent難以實現,是因為作為大腦的LLM不夠強大,隨著Deepseek、Qwen以及Claude的能力越來越強,通用型Agent實現的可能性也越來越大。

當然依照目前曝光的資訊來看,Manus團隊一定也是做了一些Agent規劃的post-training技術創新最佳化的。

從行銷角度來看,開發一個小遊戲絕對不是大眾感興趣的場景,而如果你既能幫我找資料來分析,還能把得到的資料分析結果幫我做一個好看的PPT呢?這個展示產品的影響力受眾就爆炸了。

再加上自媒體流量極度渴望一個新的題材,所以整個影響力就被無限放大。

004 自媒體的鼓吹背後,Manus被誇大了什麼?

上面是一張網上看到的AI講座的宣傳內容,把Manus吹成了遠超Deepseek的AI。

當然可以理解為了流量這麼宣傳可以吸引一般使用者產生更多的關注,但對於『科普』這件事的誤導也就引導的越深。

首先Manus只是基於當前最強大AI做了相應的虛擬手腳,核心能力還是Deepseek、Qwen之類的AI大腦,其次要談到神器和真正幹活,可能需要各位看官再稍微等等了,給Manus和所有通用型智能體一些時間和耐心

『我們距離AGI還差一個黎明,同時也給AGI前夜的通用智能體一點耐心』

從現有的Manus團隊採訪以及放出的一系列測試影片和文章來看,Manus還有很多的問題沒有解決,當然這也不僅僅是Manus的問題。

第一,煉式呼叫的錯誤累積。

就像傳統的workflow設定的Agent一樣,通用型Agent會存在當你解決一個問題,不斷規劃和呼叫執行的時候,錯誤是會不斷累積的。

當你的目標是去三亞旅遊,而AI幻覺導致你的規劃第一步是騎車過去的時候,整個任務就已經失敗了。當然Manus採用了許多反思來動態調整規劃以減輕錯誤的積累問題和AI幻覺,但這始終是一個繞不過去的核心痛點。

這不是僅僅靠Manus一家就能解決的,核心還是我們的大模型能力能更強。

第二,錯亂陷入死循環。

跟簡單的聊天任務不同,聊天任務你無論輸出什麼都是可以完成任務的,但對於有工具屬性的執行方案來說,就不同了。

你很有可能在研究如何去攜程上訂飛往三亞的機票的時候失敗,並且由於當前AI對於訓練資訊的固化,或者帶上聯網功能之後還會產生各種各樣幻覺,導致始終過不去一個很小的bug。

於是智能體就會陷入死循環,這也就是你的當前推理類AI中看思考過程往往能發現的思考循環,偶爾運氣好能跳出來,運氣不好就可以讓AI自我懷疑到成為‘賽博祥林嫂’

第三,任務執行成本龐大。

從各方測試的影片都可以看到,一個任務的執行時間是按照半小時來計算的。

當然本來一天的工作量壓縮到半小時已經是生產效率的奇蹟了,本身並沒有問題,但問題是半小時任務形態不是我們之前的聊天AI所常見的範式,無論是從AutoGPT時代就帶來的token巨量消耗的問題,一次可能需要幾十上百元的成本,這可能還不是普通使用者承擔的起的。

還是從機會成本的角度來說,你甚至無法確定消耗了幾十上百成本,等待半小時之後,你得到的是否是一個成品,還是得重新開始蒐集資料來寫PPT,而AI僅僅是幫你浪費了半小時。

這一點足以讓人焦慮。

005 給Manus和Agent一點時間

所以,對先進的技術名詞祛魅,但也別貶低技術的發展過程。從AutoGPT到Manus,到下一個真正能幹活的Agent。

通用型Agent是量變到質變

Manus顯然是往前邁出了一步的,但正如團隊採訪所說,Manus目前還只是一個初生兒,還有很多的最佳化需要做。請給Manus和通用型Agent一點時間和耐心

『當你右腳的鞋跟也跨過門檻的瞬間,你會發現一切都翻天地覆』

000 當AI成為“能力放大器”,人類如何定義新價值?

Manus的爆火揭示了一個更深刻的命題:在AGI前夕,人類與AI的關係正從「替代」轉向「共生」。

當AI能完成80%的標準化工作,人類的角色將向「架構師」進化-不再親自編寫程式碼,而是設計任務流程;不再埋頭資料分析,而是定義問題邊界。

正如Manus創始人肖弘所言:“AI不是替代者,而是將人類文明推向新高度的能力放大器。”

未來的競爭,將是「人機聯合體」的效率之爭。那些善於將人性洞察與AI執行力結合的組織,將率先跨越Scaling Law的邊界。

而在這場變革中,真正的贏家或許是那些敢於放下「工具理性」焦慮,轉而探索「何為不可取代的人類價值」的思考者。

正如莎士比亞筆下“世界的起伏本是波浪式的”,AI浪潮終將沖刷出新的文明形態——在那裡,技術隱於無形,而人類的創造力,因解放而愈發璀璨。 (凌晨十二點零負一)