#Manus
深扒Meta收購Manus的背後:一場AI時代的生死卡位戰
2025年臨近收尾,一則併購引發全球科技圈和資本圈的關注。一場閃電般的收購將一家中國AI創業公司推向全球科技舞台中央。2025年12月,據《晚點LatePost》獨家報導,Meta以數十億美元完成了對AI應用Manus開發商蝴蝶效應的收購。整個談判過程異常迅速,僅用了十餘天。當Meta官宣以數十億美元拿下AI智能體公司Manus時,整個行業的神經都被觸動了——這不僅是Meta成立以來第三大收購案,更被視作AI競賽從"拼模型參數"轉向"拼應用落地"的標誌性事件。有人說這是祖克柏砸錢買船票,有人惋惜中國創業公司的"流失",但這場交易的份量,遠不止表面的資本遊戲那麼簡單。今天我們就扒一扒,這樁併購背後藏著的投資邏輯。一、為何全網都在盯這場收購?科技圈天天有併購,為何Meta收Manus能引發全民級關注?核心在於三個"打破常規"的細節,每一個都戳中了行業的敏感神經。首先是談判速度快得離譜。真格基金合夥人劉元作為Manus的天使投資人,在接受採訪時直言"快到還懷疑過這是不是一個假的offer"。從接觸到敲定,整個談判僅用了十餘天,這對於數十億美元等級的跨國併購來說,簡直是"閃電戰"等級。要知道,Meta當年收購WhatsApp談了近一個月,收購Scale AI更是拉鋸了兩個多月,這種速度背後,是雙方對AI智能體賽道的迫切與共識。其次是標的估值飆升太誇張。收購前,Manus正在進行新一輪融資,當時的估值不過20億美元,而Meta的收購價直接給到了"數十億美元"的等級,相當於短時間內估值翻倍還多。更關鍵的是,這家成立僅三年的公司,2025年初的年化營收才1.25億美元,卻能撬動巨頭的天價收購,這種"高溢價"讓市場重新審視AI應用層的價值——原來能解決實際問題的AI產品,比單純的技術概念值錢多了。最後是中國創業團隊的全球化宿命。Manus的母公司蝴蝶效應,創始人肖弘是華中科大畢業生,創業起點就在武漢,早期靠微信生態工具起家。這樣一支帶著中國基因的團隊,最終被美國巨頭收入麾下,創始人還將出任Meta副總裁,這讓不少人感慨:中國創業者能在全球AI舞台競技是好事,但為何頂尖應用創新最終多被海外巨頭收割?這種複雜的情緒,讓這場收購超越了商業本身,成了科技生態的反思樣本。二、併購核心要點拆解拋開情緒層面的討論,我們用財經視角拆解這場交易的核心要素,看清Meta到底買了啥、Manus又得到了啥。先看交易核心參數。根據《晚點 LatePost》的獨家報導,此次交易金額為數十億美元,具體數字雖未完全披露,但已明確是Meta史上第三大收購,僅次於220億美元收購WhatsApp和140億美元收購Scale AI 49%股權。收購前Manus的融資處理程序也很關鍵:2023年種子輪估值僅1400萬美元,2025年4月B輪估值漲到5億美元,半年後被收購時估值直接翻倍,這種增長速度在AI創業公司中實屬罕見。再看雙方的核心籌碼。Meta買的不是一個簡單的App,而是三重核心價值:一是技術能力,Manus的規劃執行驗證三層架構,能呼叫23類工具鏈,在GAIA基準測試中精準率達到86.5%,遠超同類產品;二是商業化驗證,Manus的訂閱制模式已經跑通,年化營收過億美元,能讓Meta的AI投入快速看到回報;三是團隊能力,創始人肖弘的產品手感的團隊的落地能力,正是工程師文化主導的Meta所欠缺的。而Manus獲得的,是Meta的生態加持。根據協議,蝴蝶效應將保持獨立營運,這意味著團隊不會被巨頭同化;同時能借助Meta的Llama大模型、Quest頭顯硬體、全球數十億社交使用者資源,把智能體能力滲透到更多場景。肖弘在官宣時也直言:"攜手Meta能讓我們在不改變運作方式的前提下,獲得更強大的發展基礎。"三、交易背景祖克柏今年7月在一封公開信中寫道:“超級智能將帶來個人賦能的新時代:它賦予人們更強大的行動力,讓我們能按自己的意願去推動建設世界。”對Meta而言,收購Manus正是推進“超級智能”願景的重要一步。Meta正在積極與OpenAI、Google和微軟等競爭對手展開AI競賽。沒有無緣無故的收購,這場"閃電聯姻"的背後,是Meta的迫切需求和Manus的發展瓶頸,兩者的相遇更像是必然。祖克柏已將AI確定為公司最優先事項,並承諾在未來三年內投入6000億美元用於美國基礎設施項目,其中多數與AI相關。今年夏天,Meta向頂尖的AI研究者開出上億美元年薪offer,重組AI研究團隊。先說說Meta的AI焦慮。祖克柏早就把AI定為公司"首要戰略任務",甚至超過了曾經押注的元宇宙。為了追趕OpenAI和Google,Meta做了不少動作:開源Llama大模型、成立超級智能實驗室、140億美元收購Scale AI股權。但問題很突出:有底層技術卻缺殺手級應用。Meta的AI能力大多停留在實驗室層面,無法轉化為讓普通使用者感知的產品,更沒有清晰的盈利路徑。投資者已經開始焦慮,畢竟持續燒錢卻不見回報的遊戲玩不長久。這時候,跑通商業化的Manus出現,正好補上了Meta的短板。再看Manus的成長瓶頸。作為一家初創公司,Manus雖然增長迅猛,但面臨著三大難題:一是算力成本壓力,AI智能體的運行需要海量算力,隨著使用者增長,算力開支越來越大;二是生態壁壘不足,單靠一款產品很難對抗巨頭的生態圍剿;三是監管風險,作為全球化產品,不同地區的監管要求不同,需要強大的合規團隊支撐。這些問題,都是Meta這樣的巨頭能輕鬆解決的。更關鍵的行業背景是,AI競爭已經進入新階段。前幾年大家還在比大模型參數、比算力儲備,2025年開始,行業共識已經轉向"應用落地"——誰能讓AI真正幫人做事,誰就能掌握主動權。高雲程早就判斷"2026年是AI Agent普及元年",Meta此時收購Manus,就是想提前卡位這個黃金賽道,避免在下一代AI競爭中掉隊。四、瘋狂的資本路徑蝴蝶效應的融資歷程,堪稱一部標準的“中國團隊創業、中國資本助推、最終美國巨頭收購”的當代科技劇本。2023年2月,真格基金以1400萬美元估值開啟種子輪;同年8月,又是真格基金,將估值推至5000萬美元。2024年11月,紅杉中國、騰訊等“中國大廠與頂級VC”聯盟加入A輪,估值8500萬美元。故事至此,仍是一個充滿本土希望的“中國故事”。轉折點出現在美元資本入場時。2025年4月,矽谷老牌風投Benchmark Capital領投B輪估值火箭般躥升至近5億美元。據《晚點LatePost》,在被Meta收購前,Manus正以20億美元的估值進行新一輪融資。而Meta最終的開價直接是“數十億美元”。五、行業思考Meta收購Manus不是孤立事件,而是AI產業發展的一個轉折點,將從根本上改寫行業的競爭規則、產業鏈分工和投資邏輯。第一個改變:巨頭併購潮將席捲AI Agent賽道。Meta的動作相當於給行業定了調:AI智能體是必爭之地。接下來,Google、OpenAI、字節跳動、騰訊這些巨頭肯定會跟風,中小AI創業公司將面臨"要麼被收購,要麼在垂直場景做深"的選擇。以前是小公司自己野蠻生長,現在巨頭直接下場"收割",賽道競爭將從技術研發轉向生態整合。有投資人已經預判:"未來一年,AI Agent賽道的中小公司要麼拿到巨頭投資,要麼被收購,純獨立發展的空間會越來越小。"第二個改變:AI產業鏈分工將徹底清晰。以前大家都在混戰,巨頭既做底層大模型,又做上層應用;小公司也想從模型到應用全覆蓋。這場收購後,行業會形成明確的三層分工:底層大模型(Meta/Llama、Google/Gemini)、中層智能體技術(Manus類企業)、上層垂直場景應用。巨頭掌控底層和中層核心環節,掌握話語權;創業公司則只能在醫療、教育、工業等垂直場景做定製化開發,靠差異化生存。第三個改變:中國科技生態的反思時刻。Manus的成長路徑很典型:中國團隊創業、中國資本早期助推(真格基金、紅杉中國、騰訊都投過),最終被美國巨頭天價收購。這讓不少人追問:為什麼我們能孵化出頂尖的AI應用團隊,卻留不住他們?早期國內大廠對Manus的收購報價僅數千萬美元,和Meta的數十億美元相差百倍,這種價值誤判反映出本土生態對AI應用價值的認知滯後。更值得深思的是,當中國創業者的頂尖成果最終流向海外巨頭時,我們的科技生態是否存在系統性失靈?還有一個風險點不能忽視:反壟斷監管的不確定性。歐美監管機構對科技巨頭在AI核心賽道的併購本來就高度敏感,Meta這次收購很可能觸發反壟斷審查。如果監管介入,不僅交易處理程序可能受影響,後續的業務整合也會添亂。另外,AI Agent技術路線還沒定型,要是Manus的技術方向和行業主流趨勢偏離,Meta的數十億美元投資可能面臨"打水漂"的風險。六、產業衝擊波研究機構預計,相比DeepSeek單次對話需1k Tokens,Manus的智能體任務單次Token需求高達100k,算力需求直接擴大了100倍。以Manus為代表的Agent應用帶來的算力消耗是純AI對話應用的百倍乃至更高。未來Agent應用全面爆發將帶來推理算力消耗佔比大幅提升,對國產算力需求構成長期支撐。Manus帶來的AI技能平權有望激起新一輪創新創業熱潮。它通過模型組合、多模型混合呼叫等創新,不需要開發者深入理解模型內部結構和微調演算法,也可以做出變革性產品。對於醫療、教育、金融等資料密集型行業,未來將逐步降低對大模型廠商的技術依賴,利用開源大模型並通過簡單的模型呼叫,也可以完成高性能智能體的搭建。七、AI時代的船票,從來都不是免費的Meta收購Manus的背後,是巨頭對AI未來的押注,也是行業發展階段的必然。這場交易告訴我們:AI競爭已經從"技術軍備競賽"進入"應用落地肉搏戰",能解決實際問題的AI產品才是真金白銀。對於投資者來說,要關注兩類機會:一是有AI Agent技術壁壘的平台型公司,二是在垂直場景落地的細分龍頭;而那些沒技術、沒場景的中小AI公司,大機率會被行業淘汰。至於Manus的"流失",與其惋惜,不如反思:如何打造一個能讓頂尖AI應用團隊紮根生長的生態?這可能比單純孵化出幾個明星項目更重要。畢竟,真正的科技強大,不是能培養出被巨頭收購的團隊,而是能留住他們,讓他們在本土生態中成長為引領行業的巨頭。這場收購不是結束,而是AI Agent時代的開始。 (投行圈子)
深網獨家 | Manus被Meta數十億美元收購背後:創始人肖弘復盤至暗時刻
12月30日,Meta宣佈完成一筆重量級併購,以數十億美元的價格收購AI Agent產品Manus背後的公司“蝴蝶效應”。這是Meta成立以來金額排名第三的收購,僅次於WhatsApp和Instagram。交易完成後,蝴蝶效應將保持獨立營運,其創始人、騰訊青騰校友肖弘將出任Meta副總裁。這筆交易的推進異常迅速。多位接近交易的人士透露,從雙方正式接觸到最終達成協議,整個談判周期僅十餘天。據悉,在收購發生前,蝴蝶效應正以約20億美元的估值推進新一輪融資。Meta對Manus的興趣並非偶然。祖克柏及多位Meta核心高管均為Manus的長期使用者。在Meta近期重組AI研究體系、高薪引入頂尖研究人員,並持續加大算力投入的背景下,這筆收購被視為其推進“超級智能”戰略的關鍵一步。蝴蝶效應成立於2021年,早期以瀏覽器AI外掛Monica切入市場,成為中國AI行業中少數實現盈利的應用產品。2024年3月,公司推出通用AI Agent產品Manus,能夠調度多種工具完成複雜任務,上線後迅速在國內外引發關注。其發展勢頭在2025年達到新的高峰:同年11月,Manus位列“全球最具潛力創業公司”榜單亞洲區第一。值得注意的是,其風靡全球的演示視訊,是團隊用借來的鏡頭、基礎的剪輯工具,在不到一周時間內趕製而成,體現了公司“在本質上重注,在形式上極簡”的極致效率文化。今年12月,公司宣佈年度經常性收入(ARR)突破1億美元,旋即迎來了Meta的收購邀約。對Meta而言,這並非一次單純的產品或團隊併入,而是一項圍繞AI應用形態的戰略佈局;而對這家源自中國的創業公司而言,Manus也由此被正式納入全球科技巨頭的核心體系之中。Meta超級智能實驗室(MSL)負責人Alexandr Wang(汪韜)轉發了相關消息,並配文稱,Manus團隊在探索當今大模型“能力過剩”問題上處於世界領先水平。此外,該實驗室正在新加坡擴展團隊,Manus原有約100名成員已加入其當地組織。獲得如此評價的Manus團隊,其發展路徑卻充滿非常規的選擇。過去兩年,肖弘主導了三次反共識決策:關乎“生死”,叫停研發七個月的AI瀏覽器項目,轉向為AI配獨立電腦;關乎“快慢”,在流量昂貴時堅持零市場預算,押注算力換體驗;關乎“組織”,推動80%程式碼由AI生成,探索“AI 時代公司形態”的未來。從連續創業者到Agent賽道領跑者,肖弘如何思考行業競爭與未來?近日,他與騰訊集團高級管理顧問、騰訊青騰教務長楊國安在《一問》欄目中展開深度對話,復盤Manus的取捨,並分享了他對AI時代產品邏輯及組織進化的思考。以下是對話整理,經精編如下:範式之變:當AI從“給答案”變成“給結果”楊國安:未來10年,AI對你所在行業最大的改變是什麼?肖弘:核心在於產品開發模式的重塑。軟體研發將更多由AI系統主導。在AI輔助下,我們能以更精銳的團隊,極大縮短開發周期。對生活的影響有兩點:一是產品迭代速度將快得超乎想像,衝擊各行各業;二是AI能力將普及化,每個人都需學會高效運用AI以實現自我提升。楊國安:你們相信“模型能力會外溢,應用是價值核心”,如何形成這個判斷?肖弘:這源於我們此前的連續觀察。做Monica(瀏覽器外掛)時,我們發現“上下文”是關鍵,於是讓外掛自動抓取網頁資訊,免去使用者複製貼上。後來Cursor火了,它證明當模型編碼能力成熟時,Chatbot並非最佳產品形態,需要一個更貼合編碼工作流的載體。這兩個案例讓我們意識到,技術能力一直在進化,但產品形態常常滯後。去年底,我們看到“Agent”這種能進行複雜規劃和自主執行的新能力出現,判斷它同樣缺乏好的產品化形態。這就是我們的機會:抓住模型能力外溢的窗口。楊國安:從給答案的Chatbot,到給結果的Agent,最本質的變化是什麼?肖弘:Chatbot給你一個答案,可能需要你再花兩小時把它變成結果。Agent則試圖直接交付那個結果。比如,做一個研究並生成精美的PPT,全程無需干預,只需幾分鐘。這帶來三個深遠變化:一是成本驟降,過去只有諮詢業能做的定製PPT,現在房產中介也能用AI生成;二是多樣性爆發,Agent可平行生成多個版本供你挑選;三是容錯性增強,任務失敗後它能自動反饋、重試,提高了完成率。楊國安:這會如何改變組織形態?肖弘:我們有一個更大膽的展望。一些用好了AI的大公司會變得更強大,但同時會出現大量微型個體。在AI的賦能下,一兩個人就能成就一項過去需要公司才能運作的事業。因為AI替他們省去了搭建組織、管理流程等複雜事務,直接交付結果。楊國安:我在“數智革新楊五環”的1.0版本研究集中在傳統行業的標準化、數位化、智能化,以實現降本增效和精準決策。但你剛才的觀點讓我很興奮——Agent能處理非標任務,這比標準化流程的潛力更大。若真實現,那些行業會受最大衝擊?肖弘:關鍵在於理解Agent是“思考+執行”。AI拓寬思考的廣度與深度,人則負責最終判斷與選擇。因此,衝擊將首先席捲高度數位化的“案頭工作”領域。給AI配一台“電腦”,而非“搶滑鼠”楊國安: Manus採用“大模型+雲端虛擬機器”的架構,核心優勢是什麼?肖弘:這是我們最關鍵的判斷之一。我們思考的終極問題是:AI的終極“外殼”是什麼?答案是:電腦。在數字世界裡,電腦是人類處理一切事務的終端。那麼,給AI配一台專屬電腦,它理論上就能像人一樣完成所有工作。虛擬機器的最大優勢,是能處理海量長尾任務。無論是安裝特定軟體,還是運行自己編寫的程式碼,AI都能在自己的虛擬環境裡完成。我記得第一次感到震撼,是看到Manus執行git clone命令,將開放原始碼專案下載到自己的“電腦”裡來解決問題——這像極了人類“使用工具”的行為。挑戰在於速度和資源消耗,但長期看這些問題會解決。而它能解決通用方案無法處理的長尾問題,這本身就構成了我們的護城河。楊國安:你們曾經投入七個月探索 AI 瀏覽器,但最終決定放棄。為什麼?肖弘:這確實是我們非常關鍵的一次戰略取捨。我們在2024年初立項做AI瀏覽器,在當時看來是一個非常順理成章的判斷。您可能知道,我們在Manus之前有一款產品叫Monica,它是一個瀏覽器外掛。當時我們想,既然我們在瀏覽器外掛上已經做得不錯了,為什麼不直接做一款瀏覽器呢?有了瀏覽器之後,一些任務就可以直接在瀏覽器內幫助使用者執行和完成。想到這個Idea 時,我們非常興奮,覺得它突破了瀏覽器外掛的天花板。我們大概花了六個多月時間去開發這款瀏覽器,從底層技術開始,我們自己編譯了開放原始碼的Chrome核心,然後將AI能力部署上去,讓它能夠在某些任務上實現自動化執行。但是,最終放棄的決定,是基於兩個核心原因:一個宏觀的戰略判斷;一個微觀的產品體驗問題。楊國安:那些改變公司命運的重大決策(如放棄瀏覽器、選擇全球化),背後的思考原則是什麼?肖弘:決策本身的邏輯很清晰:永遠從“技術能解決使用者的什麼根本問題”出發,再推導商業模式。真正的難度不在於分析,而在於有無勇氣堅持清晰的答案,並克服內部慣性,將其變為全組織的共識與行動。思考可能只需一個月,但落地執行往往更耗心力。楊國安:Agent技術落地的臨界點將取決於什麼?肖弘:我覺得可以從兩個層面來看。第一類,是您剛剛提到的核心基礎能力的提升。比如成本、速度、更長的上下文、以及在長上下文的指令遵循能力。這些都至關重要。成本和速度直接影響了產品是否能被更多使用者負擔和使用。指令遵循和上下文處理則影響了任務的完成率。這些能力我們一直在密切關注,一旦有新的突破,肯定會立即應用到產品化中。第二類,有一項能力是我個人比較期待的,它雖然已經被應用,但我預測在今年內或明年初會有比較大的突破,就是通用的電腦使用能力。這意味著AI自己能夠識別並掌握如何使用一個軟體。這項能力一旦突破,像Manus這種自帶虛擬機器的產品,就能夠完成更多專業軟體或特定行業軟體的應用。我們可以想像,未來你拿起手機,通過Manus就能讓它去完成一個本來需要在電腦上用行業專業軟體才能完成的事情。我認為這項能力即將實現突破。根據我們與研究員的觀察和交流,一旦突破,將解鎖更多的應用場景。楊國安:如果Agent能直接呼叫現有軟體,繞過人工操作,會帶來什麼變化?肖弘:最大的變化是“解放值守”。許多需要人坐在電腦前操作專業軟體的任務,未來可以由Agent自動完成。AI已能處理其中的基礎判斷。即使遇到關鍵節點,也可像手機安裝App時請求授權一樣,由人一鍵確認。這最終將徹底顛覆現有軟體的操作邏輯和人們的工作方式。用昂貴的算力換取增長楊國安:PC時代有“安迪-比爾定律”——硬體(英特爾)的提升總被軟體(微軟)消耗掉。這是否說明,價值是由“技術能力”和“應用能力”共同創造的?肖弘:是的,這正是我們的核心參照。“安迪-比爾定律”建立在摩爾定律之上,意味著算力增長必然催生更耗資源的應用。微軟當年就是依據對未來算力的預測來規劃Windows的。這直接啟發了我們的產品思路:在技術飛速進化的當下,我們是否可以暫時忽略成本與速度,只專注於打造極限質量的產品?我們跟蹤最前沿的模型,不計代價地追求最佳體驗。這與傳統網際網路平衡質量、速度、成本的思路截然不同,也是我們敢於將昂貴算力轉化為核心競爭力的原因。楊國安:你們堅持“產品驅動增長”,零市場預算,這種打法的持續性如何?肖弘:這個思考來源於我們做Monica時的觀察。我記得當時與一位企業家交流時,他提到今天AI產品的成本結構,以Monica為例:在2024年,約三分之一的成本是員工薪資,三分之一是Token(大模型呼叫)費用,另外三分之一是投放在網際網路廣告平台上的增長費用。那次對話對我的啟發很大。我就在想:如果我們做一款產品,持續有大量的成本投入到廣告平台,那麼我們的增長就很可能被網際網路巨頭廣告平台所定義。我記得當時的情況是,一旦我們快要盈利、有了好的利潤空間時,廣告平台就會立即漲價,這種模式幾乎是可計算的。這與消費品行業通過廣告平台獲取增長後面臨的問題是相似的。所以我當時思考:有什麼東西是今天很貴,但未來會很便宜的?以及有什麼東西是今天很便宜,但未來會越來越貴的?結論是:AI API(Token 成本)今天很貴,但從長期來看,受摩爾定律和底層技術發展的驅動,它一定會變得更便宜。網際網路使用者的價格卻在不斷上漲。在早期,使用者願意探索,但一旦產品與市場契合,現有玩家就會通過廣告平台來獲取使用者,推高整個行業的使用者獲取成本。基於這個判斷,我給團隊設定的目標是:我們能否做出一個讓使用者覺得非常厲害、願意主動告訴朋友的產品?在某種程度上,我們就將原本昂貴的Token成本轉化為我們的使用者獲取成本。隨著 Token成本越來越便宜,而使用者獲取成本越來越貴,這個模型就具備了長期可持續性。當時給團隊的目標是:創造出讓人感到驚豔、願意傳播的產品,並且做到零市場行銷預算。在Manus上線的前一周,我們開了一次內部會議,正式確定必須是零市場預算。所以,今年年初大家看到Manus在社交媒體上火爆,是因為我們在某種程度上打造出了使用者預期的產品。像一些意見領袖之所以轉發,正是因為它確實擁有令人震驚的體驗,實現了大家對未來 AI 產品的設想。楊國安:為何首選服務C端“獨狼型”使用者,而非B端?肖弘:底層判斷是技術階段匹配。AI Agent技術仍處早期,迭代極快。大企業需要確定性和穩定性,而個體用戶、自由職業者更能容忍變化、擁抱創新。在技術快速變化的早期,最大化發揮迭代速度優勢的,正是C端市場。楊國安:Manus的生存戰略是與巨頭合作共生。許多巨頭包括Anthropic、OpenAI、Google等,已經有可能會推出自己的Agent。那麼,你們如何在這些巨頭中找到合作共生的機會呢?肖弘:我們的策略是合作共生,扮演“最佳體驗整合者”。底層模型競爭激烈,沒有一家能持續壟斷所有能力。Manus作為應用層,可以靈活整合各家最優模型,理論上能為使用者提供比任何單一家都更極致的體驗。這類似手機廠商與晶片廠商的關係:我們雖不造晶片(模型),但憑藉對使用者需求的深度理解和巨大用量,能反推模型最佳化,形成共贏。楊國安:如何讓Manus突破早期使用者,被普通大眾廣泛接受?肖弘:關鍵在於兩點:一是產品體驗的絕對差異化。在ChatGPT已成習慣的海外市場,我們必須讓使用者一眼感知到不同。比如,Manus不僅給答案,還會主動生成一個可互動的網頁,讓“Agent給結果”變得可視、可感。二是進行“場景化”的市場傳播。我們正跳出AI圈,與各垂直行業的博主合作,讓他們基於自身真實需求使用Manus,並向其受眾展示具體的使用場景,用他們熟悉的語言來定義Manus的價值。當“一個人成為一家公司”楊國安:當AI全面重構工作流,組織的核心任務似乎正在發生轉變。從你們的實踐看,這是否意味著傳統以管控和協作為主的模式需要被重新定義?你們強調“增強”並借此做出顛覆性決策,這套新模式的底層邏輯是什麼?肖弘:我們的實踐正是對這三個問題的同步回答。首先在組織上,我們正回歸一種更緊密的協作形態。即便公司規模擴大,我們幾位核心合夥人最近又重新坐在一個小房間裡工作,並設立每天固定的“無會議時段”專注討論產品。這背後的啟示是:當AI極大提升個體效率後,組織最核心的任務不再是管控流程,而是保障最關鍵的決策單元能進行高強度、高質量的思考與共識形成。其次,這也正是“增強”而非“替代”的落地體現。AI負責執行與拓寬思路,而人不可或缺的價值在於最終判斷、對齊預期與把握場景。組織創造這樣的深度溝通空間,就是為了強化“人”在戰略與審美上的最終決策權。最後,那些顛覆性決策正源於此。無論是砍掉項目還是All in新方向,邏輯都始於“技術能解決用戶的什麼根本問題”。真正的挑戰從來不是分析,而是在答案明確後,有無勇氣打破內部共識與路徑依賴,並將新共識堅決地付諸實踐。高頻、高質量的面對面碰撞,正是我們凝聚這種戰略勇氣、確保共識堅固的關鍵熔爐。楊國安:你認為100分的“AI原生組織”是怎樣的?肖弘:我們給自己打60分,因為很多工作慣性仍沿用舊方式。100分的組織,是AI深度融入每一個工作環節,成為員工的“第一反應”。就像遇到問題先Google一樣,未來員工會本能地先問AI。在新增任務上,我們會優先問:“這個能不能直接交給AI做?” 這才是真正的AI原生工作流。楊國安:我知道你在招聘時,也在努力識別那些真正具備AI原生思維的人才。你是如何識別這些人的?肖弘:我的方法是看他如何實際使用AI。我會請對方展示日常使用AI的痕跡。真正的AI原生者,使用量會遠超常人,AI已深度嵌入其工作流。“There’s No Software”的激進實踐:用AI吞食舊世界楊國安:你曾經提到過“There's No Software”的觀點。你認為Agent的發展將對軟體產業帶來那些影響?肖弘:根據我的觀察,這種影響已經開始形成,主要分為兩大部分。第一部分,是對軟體工程師和技術人員的影響。像Cursor或是Claude Code這樣的產品,已經讓軟體工程師的工作方式發生巨大變化。以我們公司為例,Manus主要的幾位工程師基本上不再親自手寫程式碼。我觀察他們的工作狀態,他們會打開多個Coding Agent窗口,像在與人聊天一樣進行協作。統計發現,我們公司接近80%的程式碼都是由AI生成的。工程師現在做的更多是梳理業務需求、審查程式碼質量、以及架構設計等工作。所以對軟體工程師來說,這種變革是正在發生且會更加徹底。我很難想像幾年後軟體開發會是什麼樣子,或許真的會像科幻片裡那樣,通過自然語言描述就能快速生成一個優秀的產品。第二部分,是對非技術崗位和組織內部IT系統的影響。很多組織內部的非工程師崗位也需要資訊系統支援。過去他們需要搭建內部IT團隊或尋求外部外包服務。我的觀察是,未來這種內部系統或非工程師崗位的資訊系統需求,一定能直接通過 AI Agent來完成。這種變革是巨大的:迭代周期會比外包更短,需求的個性化程度更高,你告訴Agent需求,它能立刻給你實現。這種變化在今天被低估了。Manus在這方面也有投入,我們近期會發佈相關產品。楊國安:AI將如何改變未來的SaaS行業?肖弘:我們的觀察和分析是,也許會分化為兩條路徑:對於存量SaaS,關鍵在於能否成功進行AI化改造。有頂級併購基金判斷,約一半的現有SaaS公司可能無法完成這一轉型。對於新增市場,創業者不必複製舊模式,而應基於已驗證的客戶需求,用AI原生的思維重新建構產品,這將是更大的機會。楊國安:隨著AI Agent有越來越強大的自主性,未來員工人數可能會減少。你是怎麼思考這種技術進步對行業帶來的社會影響?你在產品或技術上有沒有考慮倫理、安全等邊界問題?肖弘:這是一個必須長期思考的問題。一次測試中,Manus為查詢火車時間,在發現官網因罷工無資料後,竟試圖尋找聯絡方式、起草詢問郵件。這讓我們既震撼又警惕。但最後它沒成功,因為它沒有信箱,但它甚至準備去註冊一個信箱。那一刻,我覺得既驚訝又有些害怕。我們的原則是:一是利用好模型廠商已有的安全護欄;二是在關鍵節點設定使用者確認機制,防止AI“過度代表”使用者。作為創業者,我們的責任是釋放技術潛力,同時對其深遠影響保持敬畏與審慎。 (深網騰訊新聞)
Meta新任副總裁:Manus創始人肖弘,90後
Manus的去向終於塵埃落定!和143億美元控股Scale AI如出一轍,小扎再次通過斥資數十億美元收購Manus,將全員招入麾下,Manus創始人出任Meta副總裁!Manus最早引爆了AI Agent市場,本次收購,也是中國科技創業者取得的世界級的重大突破時刻,極具象徵意義。起猛了!就在剛剛,Meta正式收購AI智能體初創Manus,創始人肖弘直接出任Meta副總裁!據傳,交易金額高達數十億美元。這次收購,是Meta成立以來第三大收購,花的錢僅次於WhatsApp和Scale AI。恰在這月,Manus宣佈了這一年來的戰績,僅用了8個月的時間,實現了從0到1億美元ARR。Meta首席AI官Alexandr Wang激動表示,Manus的加入,將在未來幫助Meta打造超贊AI產品!創始人兼CEO肖弘稱,「今天,是我這一生都會銘記的一個時刻」。當我們創立Manus時,幾乎沒人相信通用AI智能體真的能夠落地。有人說這來得太早、太過宏大、也太難實現。但我們還是選擇繼續前行。在質疑中,在一次次挫折中,在無數個夜晚反覆懷疑自己是否在追逐不可能之事時,我們依然沒有停下腳步。而事實證明,我們並沒有選錯。01. 憑什麼被Meta看上?因為它真是「SOTA」Manus到底幾斤幾兩?資料不會撒謊。在Scale AI今年十月發佈的「遠端勞動力指數(RLI)」評測中,Manus以2.5%的自動化率拿到了SOTA。要知道,Scale AI搞的這個RLI可是個「魔鬼測試」。為了搞清楚AI到底能不能替代人類幹活,他們收集了涵蓋遊戲開發、產品設計、建築設計、資料分析、視訊動畫等各行各業的真實外包項目。這些項目總價值超過14萬美元,代表了人類專業人士超過6000小時的實際工作量。其中,有些硬骨頭項目成本甚至超過1萬美元,耗時100多個小時。而Manus之所以能夠在一眾智能體中脫穎而出,甚至被Alexandr Wang親自點贊,靠的就是其新加坡團隊的一項獨門絕技——挖掘「能力溢出」(Capability Overhang)簡單來說,就是把當下大模型那些潛藏的、沒被充分利用的能力給「榨」出來,搭建成超強的AI智能體。02. 上線九個月,狂攬1.25億營收Manus不僅技術硬,賺錢能力更是驚人。這家公司今年3月才剛剛上線,由一家名為蝴蝶效應的公司營運。短短八個月,它的年化營收就突破了1.25億美元。對於Meta來說,這點錢雖然只是九牛一毛,但意義重大。祖克柏為了要在AI領域跟OpenAI、Google、微軟搶地盤,承諾未來三年要在美國基建項目上狂砸6000億美元。投資人看著這燒錢速度早就心裡犯嘀咕了,擔心半天見不到回頭錢。Manus這種已經跑通訂閱模式、能向企業賣服務的成熟產品,無疑能讓Meta的報表好看不少。03. 從中國到新加坡Manus的身世也頗具故事性。它的母公司最早成立於中國,後來才全員搬遷至新加坡,並在舊金山、東京設有分部,員工總數擴充到了105人。今年7月,在裁撤了國內大部分員工並將產品撤出大陸市場後,Manus完成了徹底的「身份轉換」。這一背景曾引發不小的波瀾。今年早些時候,美國頂級風投Benchmark領投了一輪融資,當時Manus的估值近5億美元。因為這層中國背景,Benchmark還被美國議員和其他投資人狠狠批了一頓。但這並沒有阻擋資本的熱情,真格基金、紅杉中國和騰訊都在其投資人名單上。被Meta收購前,Manus進行了4輪融資:對於這些早期支持者來說,賣給Meta絕對是一場大獲全勝的退出。04. 接下來還會發生什麼?Meta在周一的聲明裡給現有使用者吃了個定心丸:Manus的服務照常賣,團隊也不會被打散。Manus CEO肖弘表示:攜手Meta使我們能夠在不改變Manus運作方式和決策機制的前提下,在更強大、更可持續的基礎上發展。雖然還沒細說這幫頂級人才以後歸那個部門管,但可以確定的是,Meta會把Manus的技術整合進自家產品裡。Meta目前的聊天機器人Meta AI已經覆蓋了智能眼鏡、Facebook、Instagram和WhatsApp。有了Manus的加持,也許下次你讓Meta Agent幫你「訂張機票」或「做個PPT」時,它不再是動動嘴皮子,而是真能幫你把活兒幹完了。對了,Manus還計畫很快在巴黎開設新辦公室。看來,這場AI智能體的全球擴張戰,才剛剛開始。而本次收購,也是中國科技創業者取得的世界級的重大突破時刻,極具象徵意義。 (DataFunTalk)
Meta 數十億美元收購 Manus,肖弘將出任 Meta 副總裁
Meta 成立以來的第三大收購。《晚點 LatePost》獨家獲悉,Meta 以數十億美元收購開發 AI 應用 Manus 的公司蝴蝶效應。這是 Meta 成立以來第三大收購,花費僅次於 WhatsApp 和 Scale AI。我們瞭解到,在 Meta 收購前,Manus 正以 20 億美元估值進行新一輪融資。“快到還懷疑過這是不是一個假的 offer。” 真格基金合夥人、蝴蝶效應公司天使投資人劉元說,這次收購談判在極短時間完成,前後不過十餘天。剛開始創始團隊比較糾結,但最終被 Meta 創始人、CEO 馬克·祖克柏開出的條件和願景打動。祖克柏和幾位核心高管也是 Manus 的忠實使用者。劉元說,這對 AI 時代的新一代年輕創業者而言,將是莫大的激勵。“屬於中國這一代年輕創業者的時代,已經到來。”收購完成後,蝴蝶效應公司將保持獨立運作,創始人肖弘出任 Meta 副總裁。“超級智能將帶來個人賦能的新時代:它賦予人們更強大的行動力(agency),讓我們能按自己的意願去推動建設世界。” 今年 7 月,祖克柏在一封公開信中寫道,他們擁有龐大的基礎設施的資源和專業能力,也有通過旗下產品向數十億人提供新技術的能力和意願,“很興奮能集中 Meta 的力量致力於打造這個未來”。同期,Meta 向頂尖的 AI 研究者開出上億美元年薪 offer,重組 AI 研究團隊。數十億美元併購蝴蝶效應,是祖克柏推進 “超級智能” 願景的一部分。蝴蝶效應成立於 2022 年,創始人肖弘是江西吉安人,畢業於華中科技大學,創業起點在武漢,曾開發過兩款微信生態的外掛:微信公眾號排版工具壹伴和企業微信客戶關係管理工具微伴,賣給一家獨角獸公司。蝴蝶效應第一款產品是瀏覽器 AI 外掛 Monica,提供大模型驅動的聊天、搜尋、閱讀、寫作、翻譯等功能。那時行業裡更看好開發大模型的公司做產品,肖弘選擇在大模型基礎上開發外掛,被指為 “套殼”。但 Monica 是中國 AI 行業少有的盈利產品。2024 年初,Monica 剛開始高速增長時,字節跳動高層曾與肖弘在香港單獨會面,出價 3000 萬美元收購蝴蝶效應。同一年,Cursor、Devin 等呼叫大模型解決複雜任務的產品讓模型具備了更強的能力,成了他們開發新產品的靈感來源。經過真格基金投資人的撮合,曾開發出猛獁瀏覽器、Magi 知識搜尋引擎的 90 後連續創業者季逸超,曾在多家公司擔任產品經理的張濤,在 2024 年加入蝴蝶效應,共同帶隊開發出了 Manus。Manus 是一款能夠調度不同的工具解決複雜問題的 Agent 產品,2025 年 3 月上線時就引發國內外的關注和討論。 今年 12 月中旬,Manus 宣佈年度經常性收入(ARR)已突破 1 億美元。被 Meta 收購前,Manus 公司蝴蝶效應一共完成 4 輪融資:2023 年 2 月,種子輪,投後估值  1400 萬美元,投資人:真格基金2023 年 8 月,天使輪,投後估值 5000 萬美元,投資人:真格基金2024 年 11 月,A 輪,投後估值 8500 萬美元,投資人:紅杉中國、騰訊、真格基金、王慧文、Old Friendship Capital2025 年 4 月,B 輪,投後估值近 5 億美元,投資人:Benchmark Capital、真格基金、紅杉中國,騰訊等中美頭部 VC 基金及科技公司創業者今年 3 月,Manus 引發關注時,兩次投資肖弘團隊的劉元說:“硬科技創業者基本都是名門正派,光譜另一端的消費級產品創始人則幾乎都是畎畝之中。”“最近每天都在感嘆,Manus 已經不僅是一個創業公司,更是中國新一代創業精神和希望的象徵。” 真格基金管理合夥人、前聚美優品聯合創始人戴雨森說,他們 “不靠關係,不比資歷,在全球舞台上光明正大同台競技,做到了我們上一代創業者做不了甚至不敢想的事情。” (晚點 LatePost)
Meta 閃電收購 Manus(蝴蝶效應),整合團隊!
Meta 數十億美元閃電收購蝴蝶效應,創第三大併購紀錄12 月 30 日重磅!Meta 砸數十億美元(傳約 108 億)拿下 AI 公司蝴蝶效應,創其成立以來第三大收購,僅次於 WhatsApp 和 Scale AI。談判僅十餘天,速度快到令人咋舌。蝴蝶效應核心產品 Manus 為通用 AI Agent,3 月上線即爆火,12 月中旬 ARR 破 1.25 億美元,已處理 147 兆 token、建立 8000 萬台虛擬電腦。創始人肖弘將出任 Meta 副總裁,公司保持獨立、新加坡營運。一、世紀交易落槌:Meta數十億美元敲定第三大收購2025年末,全球科技界迎來重磅消息——Meta正式完成對AI初創公司蝴蝶效應的收購,交易金額達數十億美元(市場預估15.5億美元,約合108億元人民幣)。這一交易躋身Meta成立以來第三大收購,僅次於2014年190億美元收購WhatsApp、2025年148億美元收購Scale AI,標誌著全球AI競賽進入資源整合決戰階段。收購談判僅十餘天敲定,效率之高令蝴蝶效應天使投資人劉元直言“快到懷疑是假offer”,背後凸顯Meta對核心資產的迫切渴求與戰略決斷。有使用者稱,Manus這個交易價格為15.5億美元(約合108億元人民幣),僅作參考。二、破局者Manus:中國初創的全球AI突圍被Meta收購的Manus並非偶然。Manus這家2022年成立的中國初創企業,從武漢起步,在肖弘帶領下憑藉使用者洞察走出差異化路徑。核心產品Manus作為通用AI Agent,可自主調度工具解決複雜任務,2025年3月上線即引發全球關注,12月中旬年化收入突破1.25億美元,月度增速20%,累計處理超147兆token、建立8000余萬台虛擬電腦。從被質疑“套殼”的Monica到全球AI增長標竿,Manus三年實現估值從1400萬美元至20億美元的飛躍,獲紅杉中國、騰訊、Benchmark等中美頂級資本加持,成為中國新一代創業力量的全球名片。三、戰略卡位:Meta超級智能願景的關鍵落子Meta天價收購的核心是“超級智能”戰略卡位。今年7月,祖克柏在公開信中提出“超級智能將帶來個人賦能新時代”,並承諾三年投入6000億美元建設AI基礎設施。收購Manus是該願景的關鍵落地:一方面,Manus成熟的商業化路徑可為Meta AI投資帶來直接回報,破解“只燒錢不盈利”的質疑;另一方面,其AI Agent技術可與Meta旗下數十億使用者規模的產品矩陣整合,加速AI能力規模化落地。祖克柏本人是Manus長期使用者,而蝴蝶效應保持獨立營運、肖弘出任Meta副總裁的安排,將保障核心團隊與技術穩定。四、時代訊號:中國年輕創業者的全球主場這場收購的意義遠超商業交易,是中國新一代創業精神的全球宣言。肖弘團隊無海外名校光環與大廠高管履歷,憑藉卓越產品工程能力,在全球AI領域“不靠關係、不比資歷”競爭,最終獲定義矽谷創業精神的Meta青睞。正如真格基金戴雨森所言,Manus“做到了上一代創業者做不了甚至不敢想的事情”。從哈佛宿舍起步的祖克柏曾激勵全球創業者,如今中國大學社團走出的肖弘團隊征服矽谷巨頭,印證了中國年輕創業者的全球價值。這不僅為AI時代創業者注入強心劑,更標誌著中國新一代創業者的全球時代正式到來。(深科技)
Manus AI 上線以來最大更新:100 個 Agent 為你打工,但缺點是太燒錢了
一個 Agent(智能體)不夠用?Manus 乾脆給你拉來 100 個。今天凌晨,Manus 推出了一項新功能:Manus Wide Research。這項功能的核心亮點在於,使用者只需一鍵即可開啟大規模平行 Agent 協作,輕鬆處理原本需要耗費數小時、動用數百個資料來源的複雜調研任務。簡單來說,這類似於此前 Grok 4 Heavy 的多 Agent 模式——同時啟動多個 Agent 平行工作,最後整合輸出結果。不過,Manus Wide Research 的調度規模更為龐大,Agent 之間的協作也更加緊密。在官方的演示 demo 中,Mamus 展示了兩個典型的案例。第一個案例,是讓 Wide Research 對比分析 100 款運動鞋。從功能、定價、設計到銷量,Manus 會首先並行呼叫 100 個子 Agent ,每個負責一款產品,獨立抓取分析、彙總資訊。隨後,這批結果被自動彙總成 Excel 表格和網頁,交付清晰的最終排序和評估建議。第二個案例,是為即將舉辦的活動尋找海報靈感。Wide Research 能夠同時探索 50 種視覺風格,並自動生成匹配風格的完整海報圖樣。幾分鐘內,成品設計就能交到使用者手上。目前,這項新功能已率先向 Pro 使用者(199 美元/月)開放,並計畫逐步向 Plus(39 美元/月)和 Basic(19 美元/月)層級使用者開放。值得一提的是,系統會根據任務需求自動啟動 Wide Research,無需使用者手動設定或切換。X 網友 @LamarDealMaker 在體驗後發文稱:「manus wide research 是我最近用過的最好的工具之一。50 個 Agent 同時在網際網路上搜尋,收集 AI 新聞資料並填寫這張表格,現在我擁有了一個按需呼叫的個人 AI 蜂群,很興奮將其應用到我的日常工作流程中。」當然,Manus 的積分機制早就被吐槽「貴得離譜」,如今新功能大幅升級,積分的消耗速度勢必進一步飆升。Manus 聯合創始人肖宏也疑似在社交媒體上回應這個問題:AI 在開始時更像邊際成本很高的原子生意,然後(也許會)逐步轉變成為邊際成本更低或者接近於零的位元生意。和這個匹配的做法是1.製造超貴但是拓展人類能力邊界的 AI 產品。2.用 1 掙到的錢造價格實惠的 AI 產品。3.再用 2 掙到的錢造價格更實惠的 AI 產品。現在在階段 1,也才剛剛開始。下一個發佈,再來 100x Token 消耗量。就目前來看, Wide Research 的底層邏輯遠不止「多開 Agent」那麼簡單。其背後其實是一個系統級的平行計算機制——每個 Manus 會話都運行在一台獨立虛擬機器上,具備編排複雜雲工作負載的能力。而 Wide Research 把這套資源能力擴展到了百倍規模,試圖讓一個人調度一個 AI 雲端運算叢集。更重要的是,與傳統多 Agent 系統通過角色預設(比如設計師、程式設計師、分析師)進行分工不同,Wide Research 中的每個子 Agent 都是一個完整的 Manus 實例,能自主思考、自我執行,再集中交付任務結果。Manus 聯合創始人季逸超也在 X 平台發文,進一步解釋了這一架構的靈感來源:Wide Research 是我們在 Agent-Agent 協作方面的最新探索。基於我們的大規模虛擬化基礎設施,Manus 現在可以自主調度一支由同質 Manus Agent 組成的團隊平行工作,並彙總結果。在建構 AI Agent 的過程中,我們一直受到經典系統研究的啟發。Wide Research 直接受到了 20 多年前由 @JeffDean 和 Sanjay Ghemawat 提出的 MapReduce 範式的啟發。作為大規模分佈式系統的先驅,Google遇到了其他人尚未面臨的挑戰,並慷慨地與世界分享了他們的解決方案。如今,隨著 Manus 推動 AI Agent 的邊界,我們正遇到一類只有在大規模時才會出現的新問題。我們將繼續分享在此過程中學到的經驗。特別需要指出的是,儘管願景很宏大,Manus 並未提供足夠證據證明這種同時啟動數十甚至上百個子 Agent 的方案,是否真的比單個高容量 Agent 按順序完成任務更高效。子 Agent 如何分工、如何合併結果、在響應速度、精準率和成本上是否具備顯著優勢,官方尚未提供相關依據。 (APPSO)
剛剛,OpenAI 發布ChatGPT 版Manus!奧特曼:感受AGI 時刻
過去大半年,Agent(智能體)是AI 產業最常被提及的概念之一。幾乎所有廠商都在講Agent,概念不缺,demo 也不少,但真正做到產品級落地,始終缺一套完整的執行系統——既能理解複雜目標,又能調用多種工具串聯任務流程,還要隨時支援任務中斷、修改與恢復,真正貼合任務流。就在剛剛,OpenAI 正式發布ChatGPT Agent 功能。透過整合Operator + Deep Research + ChatGPT 本體,使用者只需描述任務,ChatGPT Agent 就能自主判斷所需工具,自動存取網頁、擷取資訊、執行程式碼、產生PPT 或表格等,並可在執行過程中即時展示對應步驟、接受暫時中斷和修改指令。看到這,你或許有種似曾相識的感覺。 ChatGPT 這個新功能其實與3 月份大火的Manus 在體驗層面相當相似,而Manus 也正面回應了OpenAI 這位競爭對手的入場。凌晨發表會結束後,OpenAI CEO Sam Altman 在社群媒體上寫道:觀看ChatGPT Agent 使用電腦完成複雜任務,對我來說是一個真正的「感受AGI」時刻;看到電腦思考、計劃和執行,有種與眾不同的感覺。亮點如下:ChatGPT Agent 將Operator、Deep Research 與ChatGPT 本體三合一,建構了一個統一智能體系統;內建圖形/文字瀏覽器、終端機和API 呼叫器等工具,支援手機端使用,任務完成後可自動推送結果;可連接Gmail、GitHub 等第三方應用,深度嵌入使用者真實工作流程;在多項基準測試中表現領先,綜合性能位居行業前列;Pro 用戶每月享有400 條呼叫額度,其他付費用戶為40 條,並支援按需擴充配額;ChatGPT Agent 正式上線,可以購物,能寫PPT,你的瀏覽器要被AI 接管了今天開始,你可以在任何對話中,透過聊天介面左下角的「工具」下拉式選單,選擇「Agent 模式」來啟用這項功能。輸入你想完成的任務,ChatGPT Agent 就能瀏覽網站、篩選結果、在需要時安全提示你登入、執行程式碼、執行分析,PPT、電子表格等任務也都能信手拈來。整個執行過程是可視的——操作步驟會即時顯示在螢幕上,使用者可以隨時中斷、修改指令,甚至手動接管瀏覽器繼續操作,確保任務始終符合你的目標和需求。在今天凌晨的示範中,OpenAI 展示了ChatGPT Agent 在真實場景中的應用能力。例如,為即將出席的婚禮做準備,一直是個難題。現在只需發出請求,ChatGPT Agent 迅速搭建虛擬環境,自主判斷應調用瀏覽器、文本解析器還是終端,並開始依次調取婚禮日期、查詢場地天氣、推薦西裝搭配、篩選酒店。在這個過程中,模型可以與OpenAI 研究員進行互動,並在適當節點請求確認需求,而執行這樣一個任務只需十分鐘左右。更重要的是,用戶還可以隨時中斷任務。例如當Agent 在推薦西裝過程中,OpenAI 研究員臨時插入了「幫我找一雙9.5 號黑色正裝鞋」的請求,模型立刻暫停當前任務,轉而處理新需求。同樣地,當Agent 認為有必要時,也會主動向你請求更多信息,確保任務始終與你的目標保持一致。如果任務超出預期時間或出現卡頓,你可以選擇暫停任務、請求進度摘要,或直接終止任務並取得現有的部分結果。「這種可打斷、可多輪對話的機制,是我們這次訓練模型的重點之一,」OpenAI 研究員解釋道。這項能力背後,是ChatGPT Agent 對三大系統的統一整合:Operator 提供網頁互動能力,支援自動滾動、點擊、填表;Deep Research 擅長資訊整合與分析;ChatGPT 本體則負責自然語言理解與智慧推理。ChatGPT Agent 是透過強化學習在複雜的任務中訓練出來的,過去三者各有短板——前者難以深入分析,後者無法操作網頁,而Agent 將三者優勢整合為一體,並輔以瀏覽器、終端、API 呼叫器等工具,形成一個完整的執行系統。使用者不僅可以在桌面端啟動Agent 模式,在手機端也同樣適用。任務完成後也會自動推播結果通知。在第二個演示任務中,OpenAI 研究員在ChatGPT App 上傳了團隊吉祥物Bernie Doodle 的貼紙圖案,Agent 自動調用圖像生成API 設計貼紙樣式,透過瀏覽器訪問電商平台完成比價、樣式選擇、購物車添加,最終整理出定制500 份貼紙的下單明細。當然,為確保流程安全、靈活且清晰可控,面對涉及金額的支付環節,則只會由使用者手動接管瀏覽器完成。透過連接器,使用者還可將Gmail、GitHub 等日常應用程式接入ChatGPT,讓模型讀取郵件、日曆或程式碼庫等上下文內容,並執行諸如總結今天的郵箱內容或查找下周空閒會議時間等任務。一個更典型的應用情境是,OpenAI 研究員能夠讓ChatGPT Agent 總結自己在多個基準測試中的表現,並製作成PPT。收到命令後,Agent 成功呼叫Google Drive 連接器讀取資料文件,用終端機編寫程式碼繪製圖表,並完成任務。這類自動化能力,都是Agent 深度嵌入工作流程的體現。不過,可以看到,ChatGPT Agent 產生的PPT 在設計美學方面表現比較一般,並且,雖然可以上傳電子表格供ChatGPT 編輯或作為模板使用,但產生的PPT 暫不支援二次修改。需要說明的是,OpenAI 並不是讓Agent 像人一樣打開PPT或Excel 文件,透過點擊來插入文字方塊和公式,而是直接產生程式碼來建立文件。這種做法的好處是可以利用模型在程式碼編寫方面的天然優勢,避免因模擬點擊操作帶來的效率低或出錯,也降低了計算資源的消耗。The Information 報告指出,如果ChatGPT 要直接編輯PPT 或Excel 文件,就需要啟動一台「虛擬機器」(即透過ChatGPT 運行的虛擬電腦環境),這會佔用更多運算資源。而直接產生程式碼則是更輕、有效率。儘管潛力巨大,但就目前來看,這項功能短期內很難對微軟的Office 或Google Workspace 造成衝擊。對於ChatGPT Agent 功能,Pro 用戶將在今天之內獲得存取權限;Plus 與Team 用戶將在接下來的幾天內陸續開放;企業版和教育版將在未來幾周內陸續上線。Pro 用戶每月可使用400 次,主打一個量大管飽,而其他付費用戶每月可使用40 次,並可透過彈性積分方案購買更多額度。全線刷新「跑分」紀錄,Agent 戰場迎來最強對手ChatGPT Agent 能力的提升,也反映在「跑分」環節。在評估AI 解決跨學科專家級問題的基準測試Humanity's Last Exam(HLE)中,ChatGPT Agent 以41.6 的pass@1 得分刷新紀錄。在啟用並行執行策略後,該得分進一步提升至44.4。在目前被認為最具挑戰性的數學基準FrontierMath 中,面對難度極高、從未公開的題目,ChatGPT Agent 在具備終端代碼執行能力的前提下,取得了27.4% 的準確率,遠高於此前模型。在這複雜且高經濟價值的知識型工作任務的內部基準測試中,ChatGPT Agent 在約一半的任務中輸出品質已達到甚至超過人類水平,表現也顯著優於o3 和o4-mini 模型。在一個內部的投行建模任務基準中,ChatGPT Agent 的表現也顯著優於Deep Research 和o3 模型。每個任務都基於數百項關於公式正確性、格式規格等評分標準進行評估。此外,在公開評估模型資訊查找能力的BrowseComp 基準上,Agent 以68.9% 的準確率刷新記錄,較Deep Research 高出17.4 個百分點。在WebArena 評估中,其網頁任務執行能力也優於基於o3 的CUA 模型。從平台視角看,Agent 能力的底層接口,正是瀏覽器。在Perplexity AI CEO Aravind Srinivas 最近的訪談中,他表示瀏覽器將會是AI 的「殺手級應用程式」。在他看來,瀏覽器天然具備讓AI 真正「動起來」的全部條件。有別於傳統聊天機器人,AI Agent 的理想形態不是停留在對話框中生成文本,而是具備實際行動力——從訪問網頁、提取資訊、填寫表單,到執行跨平台操作。而這一切,瀏覽器恰好具備所需的操作權限和上下文取得能力。瀏覽器可以直接讀取頁面、模擬點擊、自動執行任務,幾乎無需額外授權。在這個過程中,使用者與AI 共處於同一個互動空間:AI 可以自動執行任務,使用者也能隨時中斷或接管,避免黑盒操作帶來的不確定性。這種可控性與透明度,是目前許多情境協議仍難實現的能力。如今,隨著ChatGPT Agent 能力正式上線,所有聲稱要做Agent 的廠商,恐怕都要重新審視自己的產品路徑。當ChatGPT 從語言互動工具,轉向具備協作、調度與承接任務能力的執行系統,開始接入用戶的真實工作流程,Agent 的可用性門檻,也在此刻被實質地拉高。(APPSO)
一文讀懂ChatGPT Agent:沒超越Manus的能力範疇,但看到了端到端的曙光
Agent是今年AI圈最大的共識,OpenAI自然也無法落後。台北時間2025年7月18日凌晨1點,Sam Altman和四位OpenAI 的研究員在直播中正式發布了ChatGPT Agent——一款通用型AIAgent。前有Manus、Lovart和Flowith,ChatGPT Agent所呈現的功能場景並不算特別驚艷,但它發布的意義,要超越其功能本身。ChatGPT Agent的革命性在於其獨特的技術路徑:它可以主動從工具箱中選擇代理技能,使用自己的電腦完成任務,使用者可以即時觀察AI在虛擬環境中的工作過程。這種交互界面雖與Manus等產品相似,但底層原理卻有著本質差異。Manus調用多個底層模型,類似於“外部縫合”,而ChatGPT Agent,是將Agent能力內化於模型,我們已經看到了端對端通用Agent的雛形。Manus的設計實質上是透過調用多個底層模型來實現"外部縫合"。相較之下,ChatGPT Agent是將Agent能力內化於模型本身。根據OpenAI介紹,為了開發ChatGPT Agent,他們將Operator和Deep Research團隊合併為一個統一的團隊,這個新團隊由20至35人組成。根據ChatGPT Agent的系統卡顯示,它是一個新的代理模型,與OpenAI o3同屬一個系列,採用了端到端的訓練方法。它是為代理任務開發的統一模型,而不是多個模型的工程化組合。根據OpenAI放出的對比PPT,我們可以看到,這項訓練基本上是透過強化學習過程完成的。和Grok4withtool的路徑應該差不多。經過再訓練,Agent結合了Deep research的多步驟研究和高品質報告產生能力、Operator透過遠端視覺化瀏覽器環境執行任務的能力、具有有限網路存取權限的終端工具,以及透過連接器存取外部資料來源和應用程式的能力。在執行完複雜任務之後,也可以交付給使用者一個可下載的一個PPT或一份文件。對Manus而言,OpenAI的這項新舉措無疑是巨大的打擊,甚至從定價上,兩者也差距不大:GPT的Plus套餐每月20美金即可使用ChatGPT Agent,而Manus的基礎計劃是每月19美金。底線重點:ChatGPT Agent:是能夠執行複雜、多工具任務的統一AI Agent。它整合了對文字瀏覽器、GUI 瀏覽器、終端和圖像生成工具的存取。支援與用戶進行互動式、多輪對話,允許打斷和澄清。安全防護升級:加強對網頁「惡意提示」攻擊的防禦;設定高風險任務自動拒絕;生物/化學風險也按最高等級安全堆疊處理。它在多個現實世界和基準任務中取得了最先進的結果。ChatGPT Agent概覽功能很像ManusChatGPT Agent的核心是一個統一的代理系統(unified agentic system),整合並擴展了OpenAI 早期研究專案"Operator"(專注於網站互動)和"Deep Research"(專注於資訊綜合)的能力。這使得ChatGPT Agent 能夠在單一的對話流中,無縫地從推理思考切換到執行具體動作。虛擬電腦環境:ChatGPT Agent在一個為其特設的虛擬電腦上執行所有任務。這個環境是沙盒化的,確保了操作的安全性。它能夠在該環境中保存任務的上下文,即使用戶中途打斷或改變指令,也能從斷點繼續,而不會丟失進度。智慧工具箱:為了完成複雜工作流程,Agent 配備了四種工具,並能根據任務需求自動選擇最適合的工具:視覺化瀏覽器(Visual Browser): 用於與圖形使用者介面進行交互,例如點擊按鈕、填寫表單和瀏覽為人類設計的網站。文字瀏覽器(Text-based Browser): 用於需要高效推理和處理大量文字的網路查詢。終端機(Terminal): 允許Agent 運行程式碼、下載和處理文件。API 存取: 可以直接呼叫API 來獲取訊息,例如透過連接器存取Google Drive、Gmail 和GitHub 等應用程式的資料。新模型驅動:ChatGPTAgent由一個專門為其開發的新模型驅動。這個模型透過強化學習(reinforcement learning) 的方法,在需要使用多種工具的複雜任務上進行了專門訓練,從而學會瞭如何在不同工具之間流暢切換並協同工作。它有以下特性:自主任務執行: 使用者可以用自然語言下達指令,例如“分析我的日曆,並根據最近的新聞為我簡報即將到來的客戶會議”,Agent 能夠自主規劃並執行系列操作,如瀏覽網站、篩選資訊、運行程式碼分析,並最終產生可編輯的幻燈片或電子表格等成果。協作與互動性:它會在需要時主動詢問更多細節以完成目標。使用者可以隨時中斷、重定向任務或完全接管瀏覽器的控制權。安全性與權限控制: 安全性是其設計的核心部分。在執行購買、提交表單、發送郵件或處理個人資訊等具有實際影響的關鍵操作之前,Agent 會明確請求使用者許可。同時,它被禁止執行如金融轉帳或提供法律建議等高風險任務。 OpenAI 也內建了針對「提示注入」等惡意攻擊的防護措施。多項基準測試跑分“破紀錄”最難的HLE 達到41.6%(with tool), 高於剛發表的Grok4(with tool)41.0%。在測量廣域知識與專家級提問的Humanity's Last Exam 上,單次作答準確率達41.6%;採用並行八路推理並選取置信度最高答案後可提升到44.4%。在極難的FrontierMath 數學基準上,借助終端運行程式碼後準確率提升至27.4%。在針對真實知識工作任務的內部評測中,ChatGPT 代理人在約半數案例裡已與人類持平或更佳;在現實資料科學任務DSBench 上,其分析與建模準確率分別達到89.9% 與85.5%,遠超過人類平均值。它對電子表格的直接編輯能力也領先:在SpreadsheetBench 中拿到45.5%,超過 Copilot in Excel 的20%。此外,它在BrowseComp、WebArena 等瀏覽評測裡均刷新了SOTA。(圖:評測方法:SpreadsheetBench的作者在Windows 環境下使用Microsoft Excel 對電子表格進行評估。我們則在OSX 環境中使用LibreOffice,這可能導致評分出現輕微差異。例如,作者報告GPT‑4o 在整體Hard 限制上的結果為15.02%,而我們得到13.38% 在整體Hard 限制上的結果為15.02%,而我們得到了13.912題目根據ChatGPT Agent自己做的PPT,在做PPT的能力上和上網衝浪能力上,Agent的能力都相比純粹的基礎模型有較明顯的提升。但離人類還頗有距離。不是期貨,今日可用自今日起,Pro 用戶可以馬上使用,Plus 與Team 用戶將在數日內陸續開通;Enterprise 與Education 版本將於數周後接入。Pro 每月可用400 則訊息,其他付費用戶每月額度為40 條,可透過彈性的按量計費追加。實際使用非常簡單:在任何對話中切到「代理模式”,描述目標,例如深入研究、製作演示或報銷。螢幕左側即時顯示它的操作流程;若需要登錄,系統會切換到「接管模式」安全輸入憑證。使用者也可以把完成的任務設為周期性執行,例如每周一自動產生指標報告。奧特曼親自提示風險:Agent很強大,也很危險值得注意的是,奧特曼在發布會之後,立刻發了一條長貼,提示使用ChatGPT Agent的風險。在「強調」過ChatGPT Agent處理複雜任務的強大能力後,特別鄭重地提示了產品的風險,並強調:我們尚不清楚具體會造成什麼影響,但不法分子可能會試圖「誘騙」用戶的AI 代理提供不該提供的私人資訊並採取不該採取的行動,而這其中的方式我們無法預測。模型可能會接觸使用者的敏感數據,或遭遇網頁中的惡意「提示注入」攻擊。為此,他們沿用Operator 期間的嚴格控制,並新增多項防護:關鍵動作前必須先得到使用者明確授權;部分高風險任務(如發送郵件)啟用「監督模式」要求使用者全程監控;碰到銀行轉帳等高風險指令會主動拒絕;使用者可一鍵清除瀏覽資料並登出全部會話,或在不需連網時停用連接器。在生物與化學安全方面,OpenAI根據Preparedness Framework 將該模型按高風險級別處理,上線了最全面的安全措施,並與政府、學界及安全機構合作開展紅隊測試與威脅建模,同時啟動漏洞賞金計劃,以便儘早發現並修補潛在問題。ChatGPT Agent夠遙遙領先嗎?ChatGPT Agent最大的創新在於首次在模型中直接整合了完整的虛擬機器環境,使用者可以即時觀察AI的操作過程,這是其它模型產品不具備的。但是,各主流模型公司都在「Agent即模型,模型即Agent」的路上越走越遠。例如,在coding agent能力上幾乎封神的Claude。眾多需要藉用底層模型搭建的Agent產品,甚至離開了Claude,就什麼也不是。剛上線的Kimi K2採用開源的混合專家模型架構,定位就為Agentic Intelligence,且價格僅有Claude 4的1/6左右。上線之後,token的採用量排名持續飆升。但從「模型即Agent」這條路來說,OpenAI並不能算是遙遙領先,僅僅能說邁出了一小步。OpenAI在官方文件中也特別謙虛地表示:需要注意的是,功能仍處早期:例如投影片產生功能現為beta,格式與美觀度仍待提升,現階段主要優化資訊結構與元素可編輯性;未來我們將繼續訓練新版本,以產生更精緻的文件。總的來說,隨著持續迭代,ChatGPT 代理的效率、深度和多樣性都會不斷提升,我們也會逐步調優用戶監督的力度,在易用與安全之間取得更好平衡。看著自家產品的展示,Sam Altman不禁又開始感嘆,「我感受到了AGI」。然而,在貼文後面還是有用戶留言問,說好的GPT-5呢?(騰訊科技)