Manus vs ChatGPT!比拼任務執行能力,誰更勝一籌?

隨著AI技術的發展,AI Agent(智能體)概念愈發火熱。曾經「一碼難求」的AI Agent平台Manus於近日全面開放註冊。根據官方公告,新註冊用戶每天可免費獲得300積分,並額外一次性獲得1000積分。

Manus試圖串聯真實世界工具鏈,但目前執行過程尚未實現穩定高效。


為了驗證其實用性和任務完成能力,小K以一名普通用戶的身份,親自註冊了Manus,獲得了1300積分,並對其與生成式AI聊天機器人的代表產品ChatGPT分別進行了兩個真實任務的測試。

第一個測試任務是:下載Manus產品負責人張濤在Manus推出前發布的一段名叫“為什麼以前我不愛和人聊Agent”的演講視頻,提取MP3音頻,轉寫成文字,並進一步生成PDF和PPT文件。

Manus接收到指令後,開始了一場漫長且曲折的「系統工程之旅」。它不斷在Linux沙箱的終端機中嘗試安裝如BBDown、you-get、FFmpeg、Whisper等工具。

其過程中不斷回顯各種技術日誌,看起來更像是一位在調試腳本的工程師。一旦遇到環境異常就重置沙箱,從頭開始全部流程。

不過,Manus多次重試安裝語音辨識模組Whisper,但皆未安裝成功,由於耗時過長,小K主動要求Manus跳過轉寫和產生PDF和PPT檔任務,直接輸出MP3音訊。


最終,Manus輸出了MP3音頻,並將這份MP3嵌入到一個自動生成的網頁中並部署上線。整個任務耗時約一小時,在未完成文字轉寫、PDF、PPT的情況下積分一次性消耗了1000點。


令人感到落差的是,明明可以透過一次簡單的API呼叫快速完成的任務,Manus卻將流程人為拆解成多個步驟,從而製造出「AI很忙」的錯覺。這種「任務複雜化」的做法雖然反映出平台對自動化流程的執著,但也大大拉長了執行時間,耗費了更多資源。

而面對相同要求,ChatGPT明確表示無法進行影片下載和轉換,但可以提供內容摘要與簡報提綱。在小K確認後,ChatGPT在1分鐘內就基於影片產生了400字摘要,包括張濤的轉變邏輯、技術演進、Agent產業趨勢的詳盡大綱,並建議了PPT結構設計。

在小K進一步提出產生PDF和PPT後,它迅速完成並提供了可直接下載的檔案。


雖然ChatGPT不能原始下載視頻,未能輸出MP3音頻,但完成了有組織的、高質量的文字總結和PPT、PDF生成,對資源不可達的場景有自適應應對機制,任務完成度相對Manus更高,用戶體驗更高效、有邏輯,其內容提煉能力極強,適合需要快速摘要的場景,節省了等待與調試的時間。

第二個測試任務是:幫我制定3天東京自由行:①產生行程表(含地址/營業時間),②查公共交通路線併計算預估費用,③訂3家拉麵店午餐位,如需驗證碼或付款請停止並提示我。

Manus整整花了20多分鐘「逐項收集資料」,包括透過呼叫網路資料來源擷取景點,查詢每個景點的地址與開放時間;計算每日交通路線和預計費用;篩選東京著名拉麵店,並嘗試預約。

然而Manus給出的最終結果是,大部分熱門拉麵店(如“饗くろ喜”、“銀座篝”、“一蘭拉麵店”等)均不接受線上預訂,通常需要現場排隊等候,部分店舖或可嘗試電話諮詢,但不能保證預訂成功。建議在午餐時間前提早前往或做好排隊準備。

Manus輸出了一份包含3日詳細行程、景點地址和營業時間、交通費用估算的markdown文檔,所有內容自動整理為文件輸出,任務完成度高。不過,內容結構偏「流水帳」式,等待時間冗長。

令人沮喪的是,Manus的積分消耗速度也十分驚人。完成第一個任務後,小K只剩300點。雖然評分回贈了100分,也僅稍微緩解損耗。第二個自由行任務提交後,Manus扣除了351點。短短兩次任務,小K帳戶中的積分便已耗盡,未留下任何可持續使用的餘裕。

由此看來,Manus每日免費贈送的300點可能還不夠一次完整任務,結合任務實際執行情況來看,Manus性價比並不高。

與之相比,ChatGPT快速識別旅行任務並立即產生以下內容:含順序、景點、營業時間的3天行程建議;每天午餐推薦拉麵店,並說明預約方式;公共交通推薦(如Suica卡、一日券);費用估算(2400–3000日元)。

最終行程排版美觀,內容結構自然、可讀性強,整個過程高效、連貫、無需等待中間步驟。

ChatGPT雖然沒有直接嘗試在線預訂拉麵店,但清楚地列出各拉麵店的預約平台和連結。

綜上所述,從這兩個任務的實踐來看,Manus的定位更接近一個“自動執行型AI”,它試圖串聯真實世界中的工具鏈,實現從網頁抓取到工具調用、文件部署的完整流程。它最大的優勢在於“能幹活”,尤其是面對結構明確、步驟清晰的任務鏈時,能主動完成流程性、跨步驟的任務(如下載、轉換、部署、查詢)。然而,它執行過程冗長、穩定性不足、智慧應變能力較弱,且算力資源消耗偏高。

而以ChatGPT為代表的生成式AI聊天機器人則使用類人對話的形式,擅長理解模糊需求,快速提供結構清晰、表達得體、可直接使用的內容方案,算力資源消耗較少。

當然,隨著AI Agent技術的逐步成熟,Manus這類平台仍有其價值。它讓我們看到未來AI不僅僅是“說話”,而是可以主動執行任務、部署網頁、與工具鏈互動。只是這一切尚未穩定,也未必有效率。

如今的AI Agent,更像是一位尚在成長中的熱情滿滿、略顯笨拙的技術實習生,如果未來其能和生成式AI聊天機器人更好地結合——生成式AI聊天機器人提供智能交互,AI Agent負責流程執行,或許才是用戶真正需要的“全能AI”。(財聯社AI daily)