【AI焦點】DeepSeek之後,全球首款通用AI Agent——Manus發佈!3大場景實測,震撼AI新紀元


AI Agent(人工智慧代理)概念近年來備受關注,它的目標是讓AI不僅能“聽懂”和“回答”,還能主動“做事”。DeepSeek以其高效的大模型能力震撼業界,而Manus則更進一步,試圖將AI從被動響應升級為主動執行。它的口號“Leave to Manus”(交給Manus處理),傳遞了一種自信:無論任務多複雜、多場景,它都能自主搞定。這種雄心是否名副其實?讓我們通過實測場景一探究竟。


一、技術核心:Manus的“自主大腦”與沙盒環境

Manus的核心在於其通用性和自主性,這得益於MonicaIM團隊為其打造的獨特技術架構。從AI專家的角度看,它的亮點不僅在於大模型的呼叫,更在於任務分解、工具整合和過程透明化的設計。

1.1 自主規劃與任務分解

與傳統大模型不同,Manus並非簡單地將使用者指令丟給語言模型生成答案,而是像人類一樣,先進行任務規劃。它會生成一個To-Do列表,將複雜任務拆解為多個子任務,逐一執行。比如,當使用者要求“收集Manus的資訊”時,它會自動規劃:搜尋官網、分析文件、呼叫API、整理報告。這種“分而治之”的策略,讓它能處理遠超單次生成能力的問題。

從技術角度看,這種能力可能基於強化學習(Reinforcement Learning)或預訓練的規劃模組,結合大模型的語義理解。AI專家會注意到,這與AutoGPT等早期Agent的遞迴呼叫有相似之處,但Manus更注重結構化輸出和過程可追溯性。

1.2 沙盒環境與工具整合

Manus運行在一個虛擬沙盒環境中,配備瀏覽器、VS Code等工具,支援多種資訊獲取方式:

  • 網頁瀏覽:通過內建瀏覽器搜尋公開資訊,如官網、社交媒體等。
  • API呼叫:直接訪問外部資料來源,獲取即時或結構化資料。
  • 程式碼執行:利用VS Code編寫指令碼,處理複雜計算或資料分析。

這種多模態工具整合,讓Manus突破了純文字生成的侷限。從AI專家的視角看,這類似於“具身智能”(Embodied AI)的雛形——通過虛擬環境模擬人類操作,賦予AI物理世界的互動能力。不過,目前沙盒功能的深度尚待驗證,比如能否處理動態網頁或複雜API授權。

1.3 過程透明與文件輸出

Manus的一大亮點是全程透明。它不僅提供最終結果,還生成詳細的過程文件,包括中間態的To-Do列表、搜尋記錄、角色檔案等。這種設計不僅增強了結果的可信度,還讓使用者能復盤AI的決策路徑。從技術角度,這可能是通過日誌記錄(Logging)和中間結果快取實現的,類似於軟體工程中的偵錯工具。對AI專家而言,這不僅提升了使用者體驗,也為後續最佳化提供了寶貴資料。

1.4 技術侷限與潛力

儘管令人印象深刻,Manus仍受限於底層大模型的上下文窗口和推理能力。比如,長篇小說創作需要極長的上下文記憶,而當前模型可能依賴分段生成和拼接,質量一致性存疑。此外,沙盒環境的資源限制(如算力、頻寬)也可能影響複雜任務的執行效率。從AI專家的視角看,未來隨著模型能力提升(如更大窗口、更強推理),Manus的潛力將進一步釋放。


二、三大場景實測:從資訊收集到創意行銷

為了直觀展示Manus的能力,我們參考視訊中的三大場景,結合AI專家的分析,逐一拆解其表現。

2.1 場景一:自我資訊收集

任務:讓Manus收集自己的資訊並生成報告。

表現

  • 規劃:生成To-Do列表,包括搜尋官網、查閱文件、總結資訊。
  • 執行:通過瀏覽器訪問公開資訊,整理成報告,涵蓋產品介紹、使用場景、競品對比等。
  • 結果:輸出詳盡報告,連可靠性評估和展望都一併提供,資訊量遠超預期。

AI專家點評: 從技術上看,Manus展現了驚人的自省能力。大多數AI模型缺乏自我認知,而Manus能在發佈幾小時後,利用有限資訊生成全面報告,說明其搜尋與總結能力極強。這可能得益於高效的RAG(Retrieval-Augmented Generation,檢索增強生成)機制,通過檢索外部資料彌補模型知識的空白。不過,資訊來源以中文為主,英文內容較少,反映了當前資料來源的地域侷限性。

2.2 場景二:長篇小說創作

任務:為某小說平台撰寫投稿內容。

表現

  • 規劃:分為資訊收集(瞭解平台要求)和創作階段(大綱、角色設計、章節寫作、編輯)。
  • 執行:生成小說大綱、角色檔案,輸出兩章約2萬字的內容,結構清晰、質量不俗。
  • 結果:不僅完成任務,還通過分步規劃解決了長文字生成的難題。

AI專家點評: 長篇內容生成是AI的經典難題,受限於上下文窗口和連貫性。Manus通過“分段規劃+逐步執行”繞過了這一限制,先建構大綱和角色,再逐章生成。這種策略與人類寫作流程高度一致,體現了Agent的智能性。從技術角度,這可能涉及多輪生成和中間狀態的記憶管理,但2萬字的連貫性仍需進一步驗證,可能存在細節銜接的潛在問題。

2.3 場景三:圖書行銷策劃

任務:為《DeepSeek極簡入門》規劃出版後行銷策略。

表現

  • 規劃:分析書籍內容與作者資源,分為預熱、預售、發佈、持續推廣四階段。
  • 執行:生成詳細行銷計畫,包括多平台內容策略(B站揭秘核心內容、YouTube突出獨特功能、小紅書強調實用性),每日任務精確到具體發佈內容。
  • 結果:輸出約5000字文件,目標首月銷售5000冊、建立3000人讀者社群,框架專業且可操作。

AI專家點評: 這一場景展示了Manus在複雜任務中的通用性。它不僅理解書籍主題,還結合作者的社交媒體資源,定製差異化策略。從AI專家的視角,這可能基於語義分析和範本化規劃,輔以少量創造性推理。過程文件的豐富性(社交媒體分析、平台特點)令人驚嘆,表明其具備初步的市場洞察能力。不過,粉絲資料部分缺失(如B站),顯示資料採集仍需最佳化。


三、行業影響:AI Agent的“通用革命”

Manus的發佈,不僅是MonicaIM的里程碑,更可能重塑AI行業的格局。從AI專家的角度看,它的影響體現在技術、市場和生態三個層面。

3.1 技術範式的轉變

Manus在GAIA基準測試中超越OpenAI的Deep Research,標誌著AI Agent從“單一任務工具”向“通用執行者”的轉型。傳統大模型擅長對話和生成,但缺乏主動性;而Manus通過規劃與工具呼叫,填補了這一空白。從技術角度,這可能推動Agent架構成為AI研發的新熱點,結合強化學習、多模態互動和沙盒模擬,催生下一代智能系統。

3.2 市場競爭的加劇

海外科技圈對Manus的關注,源於其通用性和實用性。相比OpenAI的Deep Research(偏研究導向)、xAI的Grok(偏對話娛樂),Manus更貼近實際應用,如寫作、行銷、資料分析。這種“親民”的定位,可能吸引企業和個人使用者,挑戰現有玩家的市場份額。從AI專家的視角看,這也將加速Agent產品的商用化處理程序。

3.3 生態系統的啟發

Manus的沙盒環境和過程透明設計,為AI生態提供了新思路。未來,Agent可能成為連接大模型與終端應用的橋樑,通過標準化工具介面(如瀏覽器、API)和可追溯執行路徑,建構開放平台。從行業角度,這或將催生“Agent即服務”(Agent-as-a-Service)的商業模式,類似雲端運算的IaaS、PaaS。


四、未來展望:通用AI Agent的潛力與挑戰

Manus的亮相,讓我們看到了AI Agent的無限可能,但也暴露了一些待解的難題。

4.1 潛力無限

從AI專家的視角看,Manus只是通用Agent的起點。隨著大模型能力提升(如上下文窗口擴展至百萬Token、推理能力增強),它可能勝任更複雜的任務,如即時項目管理、跨國市場調研甚至程式碼開發。此外,沙盒環境的進化(支援更多工具、更強算力)將進一步拓寬其邊界,接近真正的“數字助理”。

4.2 面臨的挑戰

  • 技術瓶頸:當前Agent依賴大模型,推理深度和長文字一致性仍是短板。複雜任務可能需要更強的多步推理能力。
  • 資料依賴:資訊來源的侷限性(如英文內容不足)可能影響全球化應用,需擴展多語言檢索能力。
  • 倫理與隱私:自主執行涉及資料訪問和程式碼運行,如何確保安全性和隱私保護,是未來關鍵。

4.3 下一步演化

從AI專家的預測看,Manus的下一代可能整合語音互動、動態調整策略(根據使用者反饋即時最佳化),甚至與物理機器人結合,邁向具身智能。MonicaIM團隊若能開源部分技術,或將引發新一輪Agent熱潮,推動全球協作創新。


五、AI Agent時代的序幕

從DeepSeek的高效大模型,到Manus的通用AI Agent,2025年無疑是AI突破之年。Manus以其自主性、通用性和透明性,不僅超越了實習生的水平,甚至在某些場景下媲美專業人士。從AI專家的視角看,它不僅是技術的勝利,更是AI應用範式的革新。無論是資訊收集、長篇創作還是行銷策劃,Manus都展現了“交給它就行”的潛力。

未來,Manus會如何進化?它能否真正成為人類的“數字分身”?這些問題的答案,或許就在MonicaIM的下一步動作中。作為“AI焦點”的主編,我對這場Agent革命充滿期待,也將繼續跟蹤其進展,為大家帶來最新解讀。如果你對Manus的三大場景或AI Agent的未來有任何想法,歡迎留言討論,我們下期再見! (AI焦點)