Manus,危?!

本文彙編整理自張小珺對話季逸超。

他是中國第一代軟體出海創業者,高中靠一款瀏覽器賺得 30 多萬美金;他深耕 NLP 十餘年,親歷從傳統 NLP 到大模型的技術巨變;如今帶著通用 AI 產品 Manus 橫掃海外,ARR 超 1 億美金。
他就是 Manus(蝴蝶效應科技)的聯合創始人兼首席科學家季逸超(Pick)。
最近,Manus被數十億美元收購的風波,引起不少人的討論。但我們更應該關注的,是這家公司的商業思考。
在張小珺這場 3 小時的深度訪談中,季逸超分享了自己的創業故事、產品決策邏輯,以及對 AI 行業未來的底層思考。沒有晦澀術語,全是實戰乾貨,值得每一位創業者、從業者細讀。
以下,是季逸超的自述精華版。

一、三次創業 踩中時代紅利,也扛過技術顛覆

1.第一次創業:移動網際網路蠻荒期的“意外驚喜”

2009年,蘋果APP Store出現的第二年,我還在讀高中。

那時候剛好趕上桌面網際網路向移動網際網路轉型,不管是國內的BAT,還是海外的大廠,大家都站在同一起跑線,沒有成熟的玩法,屬於移動網際網路的蠻荒期,這給了我這樣的個人開發者絕佳機會。

我做了一款第三方iOS瀏覽器,叫猛獁瀏覽器(Mavericks Web Browser),商業模式特別樸素,賣軟體拷貝,每賣一份賺一份固定收入。

沒想到這個簡單的模式,讓我在高二、高三期間賺了30多萬美金,也算成了中國早期軟體出海的創業者。

那時候國內沒有成熟的支付管道,只能支援國際信用卡,國內使用者基本沒法付費。

我就想了個辦法,破解自己的軟體,讓大家免費用,也算賺個吆喝,沒想到還吸引了資本關注,真格基金的徐老師當時就問我想不想創業。

後來移動網際網路的商業模式變了,大家都開始“免費獲客 + 增值服務”,加上 iOS 系統不斷更新,我的瀏覽器慢慢不相容了,最後自然下架。

這段經歷讓我早早摸清了產品變現和使用者營運的邏輯,也讓我深刻感受到 時代機遇對創業者的重要性。

2.第二次創業:NLP深耕與大模型的“降維打擊”

從瀏覽器業務裡,我發現了一個關鍵需求:當時行動網路速度慢,如果能預測使用者的下一次點選,提前載入內容,體驗會好很多。這個需求讓我一頭紮進了自然語言處理(NLP)領域,這一扎就是好幾年。

2013年,Google推出了Word2Vec論文,能把自然語言文字高效轉化為稠密向量,這給了我極大啟發。

我組建團隊做語義搜尋和知識圖譜,想打造“下一代 Google”—— 傳統搜尋引擎只給連結,我想直接給答案,通過自動化技術建構知識圖譜,解決使用者的核心需求。

我們團隊從零開始訓練模型,從依存句法分析到Word2Vec向量化,再到 LSTM+Attention,最後跟進Transformer和BERT,整整熬了4年,做出了產品 Maggie。

它能自動提取三元組、支援多語言,在最高置信度下的精準度能達到89%,比Google當時的產品還高,甚至能支援阿拉伯語這種反向書寫的語言。

但2019年,GPT-3的出現給了我們致命一擊。

我隨便寫個 Prompt(提示詞),它就能和我們訓了幾年的端到端模型五五開,而且它是通解,能搞定 NLP(自然語言處理)領域的各種任務,而我們只是垂直領域的解決方案。

那一刻我意識到,垂直技術在大模型面前沒有優勢,最後決定賣掉公司。

這段經歷讓我體會到垂直整合的痛苦:每天醒來都感覺海水在上漲,不知道什麼時候會淹到鼻子,模型迭代、資料標註、基礎設施搭建,每一步都要自己扛,那種壓力至今難忘。

3.第三次創業:放棄AI瀏覽器,押注通用agent

賣掉公司後,我在一家獨角獸公司做了一年半,主要工作是打榜贏算力資源,那段時間也讓我冷靜觀察了 AI 行業的變化。

2023 年底,我被肖弘(Manus CEO)說服加入團隊,核心原因是他說的一句話:“Pick,你想不想在一個產品裡,把瀏覽器、搜尋引擎、語言模型重新做一遍?” 這句話一下子戳中了我。

初期,我們基於Chrome外掛Monica的使用者資料,想做一款AI原生瀏覽器。

Monica 當時已有1200萬美金 ARR,是正向現金流產品,但我們很快發現了問題:外掛的使用者滲透天花板太低 ,Chrome 有20億日活,而頭部外掛的活躍使用者也就5000萬左右,不到 1% 的滲透率,再怎麼發力也難有大突破。

更關鍵的是,瀏覽器的遷移成本極高。人類歷史上只有兩次瀏覽器變革:從網景到IE,從IE到 Chrome,要麼靠管道分發,要麼靠技術漏洞,創業公司想顛覆太難了。

而且當我們內部把瀏覽器產品打磨得差不多時,我突然覺得它“不是特別酷”——按我現在的話說,如果一個產品做完,你自己都覺得不酷,那沒人會覺得酷。

其實做完一款產品,人難免會有慣性偏袒,那怕我們都是經歷過幾次創業的“中登”,也會下意識想說服自己產品沒問題。但隨著更多問題暴露出來,我們才慢慢趨向冷靜判斷。

直到看到美國創業公司 The Browser Company 放棄瀏覽器產品 Ark,創始人說“連親戚朋友都不願意從Chrome換成Ark”,我才徹底下定決心放棄這個方向。

其實那段時間特別寶貴,大家在自然而然形成共識的過程中放下了瀏覽器,處於一種幾乎無所事事的狀態。

而當一群不太笨的人無所事事的時候,就會產生很多很好的想法。當時我們還在正常營運Monica,同時也會做一些別的實驗,那段時間已經有不少AI產品受到歡迎,尤其是coding領域,像Cursor、Windsurf,還有後來的Devin,都積累了很多使用者。

我們作為工程師,自然會去體驗這些工具,可讓我們意外的是,公司裡很多非工程師居然也在用Cursor,要知道,Cursor的產品形態還是IDE(整合式開發環境),本來是寫給程式碼人才用的東西。

我們發現,營運同事在用它寫部落格,資料分析同事用它做資料分析和可視化。

於是我們特意站在他們身後觀察,發現了很有意思的一幕:Cursor左邊是程式碼區,右邊是和AI聊天的窗口,這些不會寫程式碼的同事根本不看左邊的程式碼,只是不斷跟AI交流,讓AI幫自己完成任務。

原來AI是通過程式設計的方式,以程式碼為媒介,去幫他們完成這些非編碼任務。

這讓我突然意識到:程式設計不是垂直技能,而是通用能力,真正的機會是把這種通用能力包裝起來,讓普通人也能用。

於是我們把瀏覽器的技術積累搬到雲端,打造了通用agent產品 Manus:每一個會話背後都有一個獨立的虛擬機器沙盒,能幫使用者做網頁、做 PPT、批次處理檔案、深度研究,還能聯動 Notion、Slack 等工具,非同步處理長任務,不用使用者自己寫程式碼或複雜操作。

2024年3月Manus 發佈,現在 ARR(年度經常性收入)已經超過1億美金。我們沒有對標任何產品,完全是使用者用出來的,大家喜歡用它做幻燈片、網頁和批次檔案處理,我們再針對性最佳化,這種由使用者塑造的產品,生命力才強。

二、Manus 的產品邏輯不做工具,做 “人的延伸”

1.為什麼堅定做通用agent,而非垂直工具?

我之所以堅持做通用 agent,核心有三個判斷:

技術層面:通用基座模型 + 虛擬機器(圖靈完備)的底層供給是通用的,垂直領域只是在上面加約束,反而會限制產品潛力;

產品層面:使用者的需求是多樣的,通用產品能讓使用者按自己的想像力使用,我們團隊再通過觀察使用者行為捕獲頭部場景,既保留長尾能力,又能形成網路效應;

商業層面:垂直工具的使用頻次太低,比如旅行規劃一年就幾次,很難讓使用者記住,而通用產品能覆蓋使用者多場景需求,提升使用頻次和使用者粘性。

如果你做的是個垂直agent,你可能還是在做一種新的工具。但如果你在做一個通用agent,你其實在做一個人。

我們現在經常跟使用者或其他人交流,他們常說 Manus 很像人,但我們從來不以替換人的思路來想這事 ,如果你給別人傳遞“要替換人”的心智,所有人都會從風險控制的角度考量,只要一個環節不通,整個產品就被否定。

其實我們該抱著提升人(enhance people)的思路,讓高效的僱員或自驅的人,用了這個工具後產能再上一個台階,這才是更良性且現實的做法。

比如你想做一個有內容的網頁,它能先做深度研究,再基於研究結果做網頁,最後還能分析網頁流量、做 PPT 發給投資人。

2.初期用邀請碼,不是行銷是“無奈之舉”

Manus發佈初期採用邀請碼機制,被很多人質疑“過度行銷”,其實這是我們的無奈之舉。

當時我們跟所有雲廠商和模型廠商溝通後發現,世界上能立即到位的算力比想像中少太多。Agent 的算力消耗模式和 Chatbot 完全不同,輸入和輸出比例能達到100:1甚至1000:1,要是放開用,產品肯定會崩。

直到一個月後,雲廠商和模型廠商適應了agent的工作負載,我們才取消邀請碼。可以說,我們是為行業趟了一條路,後來再用邀請碼的公司,我覺得就沒必要了,算力已經準備好了,沒必要再搞這種形式。

3.商業化:不追求DAU,只服務高價值使用者

Manus 的定價邏輯很簡單,參考 ChatGPT的20 美金/月,我們定了40美金 / 月的默認訂閱價,現在逐漸簡化為“免費方案+自由訂閱金額”。

我們不追求 DAU(日活躍使用者數),而是關注“高價值使用者的高價值任務”。有的使用者一個月能給我們付幾千美金,因為他有大量高價值任務要跑,這比單純的使用者數有意義得多。

目前Manus的使用者主要是三類人:網際網路公司非程式設計師的白領、自由職業者、金融和諮詢行業從業者。

他們有強自驅力,任務價值高,對質量的敏感度也高 ,我們做過雙盲測試,悄悄換個模型,使用者滿意度就會明顯下降,所以我們必須保證每一次輸出的質量。

三、AI行業的創業、競爭與決策邏輯

1.模型與應用的終局:不再涇渭分明

未來不會再分模型公司和應用公司。美國現在已經是這個趨勢,OpenAI既做模型也做產品,Google雙向都強,Anthropic 靠Cloud Code的成功也開始重視產品。

對於應用公司來說,優勢在於“不用買模型彩票”。

模型公司的創新是自下而上的,靠技術突破驅動產品;而應用公司能吸收所有外部創新,快速迭代,而且使用者的使用軌跡和反饋留在應用層,能形成獨特的資料飛輪,這是模型公司拿不到的優勢。

2.決策機制:分階段混合模式,兼顧效率與多元

創業公司在不同階段、解決不同事情時,需要不同的決策模式。

雖然我們是連續創業者,但其實也都不成熟,最近在逐漸走向更理智的方式。我們總結了一套“GPA”決策框架,還會結合集權式和民主式兩種模式:

G(Goal,定目標):集權式決策

由CEO肖弘作為“仁慈的終身獨裁者(BDFL)”拍板,直接把團隊核心目標定死,避免目標分散。

P(Priority,定優先順序):專制 + 民主結合

先由核心決策者(比如CEO或對應領域負責人)牽頭,同時充分吸納團隊成員的專業意見,畢竟涉及不同領域的專業能力,多元輸入能讓優先順序排序更合理。

A(Alternative,提方案):充分民主

鼓勵團隊成員自由提供各類可選方案,這個階段方案數量比質量更重要,足夠多的選項才能避免決策侷限,就像訓練模型不能侷限於狹窄的動作空間。

其中,肖弘作為CEO,是產品方面的最終決策者。我們都比較相信與其懸而未決,不如趕緊試試。

面對新領域時,過往經驗未必有用,過度思考只是基於自己“模型內部的參數化知識”,沒有額外資訊輸入,也沒有檢驗結果,再想太多不如先行動,拿到反饋再調整,避免無意義的內耗。

3.競爭:不是零和博弈,而是生態聯動

很多人問我,面對 OpenAI、Google 等大廠的競爭,我會不會焦慮?其實我並不焦慮。

我們能用上市面上所有最好的模型,而大廠有自己的專長:Anthropic 的 coding 能力、Google 的多模態能力、OpenAI 的推理能力。

我們的優勢是產品迭代快,而且服務的是對質量要求極高的使用者,這部分使用者不會因為品牌而妥協,他們要的是當下最好的體驗。

AI行業的競爭不是零和博弈。Manus和 Notion、Microsoft、Slack都是聯動關係,我們串接這些工具,產生的價值比單獨競爭大得多。與其做一個比不過別人的垂直功能,不如讓大家一起把生態做好,這才是共贏。

4.通用agent的未來:主動創造價值,而非被動響應

我認為通用agent的下一個方向是“主動性(proactiveness)”。現在的 AI 還是被動響應使用者需求,未來要能主動完成任務。

比如你面試完,Manus能自動看你的Notion記錄,把評價填到招聘系統裡,只讓你確認就行,真正解放使用者的注意力。

同時,我也想給模型廠商提幾個建議:

讓模型學會 “壓縮意識”,不用無限擴展上下文窗口;

結合工具做推理,而不是純“缸中之腦”;

支援使用者隨時插嘴,適應非同步互動;

提升錯誤恢復能力,遇到問題不放棄、不陷入死循環,這些都是通用agent 落地的關鍵。

5.AI創業的本質:不是賭一把,而是先行動

對比我的三次創業,現在的AI創業和移動網際網路時代完全不同:

移動網際網路的邊際成本低,能低成本試錯;

而AI創業更像製造業,有固定成本,算力消耗就是很大一筆開支。

所以,對於創業公司來說:

第一,不要做垂直整合,除非你有足夠的資源;

第二,不要糾結於要不要做,比較健康的做法應該是當你的產品已經初具PMF,且已經到了一個比較穩定的狀態之後,你以一種增加穩定性或降本或突破天花板的思路再去做模型;

第三,團隊要身心健康、尊重常識,不要做“有賈伯斯的病,沒有賈伯斯的命”的偏執者。

結語

你準備好迎接未來了嗎?

從高中時的瀏覽器創業者,到如今的通用AI先鋒,季逸超的三次創業始終圍繞技術落地和 使用者價值。他踩過垂直整合的坑,也抓住了 agent 的機遇,用 Manus證明了不做模型也能做出頂尖AI產品。

在 AI 行業還在爭論模型至上還是應用為王的今天,季逸超的經歷給出了另一種答案:真正的機會,在於理解技術的邊界、使用者的需求,以及時代的趨勢,然後以理性的姿態,快速行動、持續調整。

而對於我們每一個人來說,AI不是要取代人,而是要解放人,就像季逸超說的:“把不喜歡的事交給 AI,剩下的才是真正的自己。” (筆記俠)