大會結束,月之暗面創始人楊植麟被觀眾層層圍住,有人舉著手機想加他微信,有人追到茶歇區要簽名。投資這家公司的機構,拉一整大巴的投資人去拜訪他,「讓第一線投資人見見好的創業家是什麼樣子」。MiniMax創辦人閔俊傑很少公開露面,網路上能搜到的照片沒幾張。這無礙他在投資業的熱度。 MiniMax估值長期排在中國大模型新創公司前列,投資人要靠「搶」 才能拿到份額。這一切都發生在DeepSeek爆火前。今年初,兩家明星新創公司一起被擠到聚光燈邊緣。春節後的第一個工作周,兩家公司的二號位各自召開了內部會議,討論DeepSeek之後該怎麼做成長。月之暗面在長達6小時的會議後,決定暫緩投放,回歸產品與科技本身。在MiniMax,DAU被稱為「虛榮指標」。兩家公司有員工覺得,這是一種「解脫」:不用再絕望地消耗資源與字節等巨頭競爭,也無需拚命證明「中國能誕生OpenAI」。問題已經失去意義。在這之後,兩家公司取得更好的技術進展。 MiniMax的影片產生模型,宣稱在某些場景超過Google的Veo3;其開源的M2文字模型,在部分評量中位列全球開源模型第一。月之暗面的K2模型,被稱為「中國又一個DeepSeek」;近期發布的K2 Thinking,宣稱部分基準測試得分超過GPT-5。他們的壓力並沒有消失。 MiniMax和月之暗面曾以較少的資源證明成長潛力。兩家公司因此拿到中國大模型創投領域大多數資金,總計超過200億元。這筆錢很少,讓他們難與字節、阿里,甚至是DeepSeek正面競爭,或是對標OpenAI、Anthropic這些海外同行。但這筆錢又夠多,讓他們無法收斂野心。閔俊傑和楊植麟是中國大模型領域的「雙子星」。他們幾乎在同一時間走進公眾視野,講著相似的理想——相信技術,追求AGI;也都在融資、流量、爭議與期待中長期被同一個問題拷問:中國的OpenAI,會誕生在那裡?兩人的相同之處並不多。閔俊傑崇尚“系統理性”,想要在龐雜的約束中尋找最優解。他把公司視為可以設計和最佳化的函數,堅信組織的力量能夠催生創新與成長。他敢於決斷,然後接受衝突,迅速迭代。他創辦的MiniMax,在技術路線上選擇多模態模型,是中國最早推出MoE模型的團隊之一。楊植麟則相信人才的力量,公司的核心產品「Kimi」 也是他的英文名,個人光環與公司品牌深度綁定。他看重“共識驅動”,相信少數精英能引領方向。與MiniMax不同,他創辦的月之暗面更執著於無損的語言模式本身的力量,一度不怎麼在意MoE。現在他們要解決的問題是一樣的。之前三年過山車般的經驗表明,一時的技術成果或使用者成長,很難成為競爭優勢。他們還要建立讓技術和使用者成長持續產生的組織能力。技術CEO、管家二號位2017年,在商湯擔任CEO助理的贠燁禕,就向雲啟資本合夥人、也是她在約翰霍普金斯的師兄陳昱提出過創業設想,但因為缺合夥人沒能推進。四年後,她再次找到陳昱:“我終於找到創業搭子了。”這個搭子,就是閔俊傑。閔俊傑是典型的「系統內優勝者」。他出生於1989年,在河南的縣城長大,博士就讀於中國科學院自動化所。2014年博士畢業後,髕俊傑加入商湯,在這家核心成員大多來自香港中文大學和海外高校博士生的公司中,他只用了五年時間,就從演算法工程師一路做到最年輕的副總裁、研究院副院長,負責智慧城市、遊戲等多個業務。他參與了商湯底層演算法到工程落地的體系建設,發表上百篇論文。MiniMax 創辦人閔俊傑閔俊傑第一次見陳昱,就給對方留下深刻印象:一是光頭,「一看就是絕頂聰明」;二是閔俊傑跟他講,可以用基礎模型,解決更加通用和泛化的問題。「現在看來當然是常識,但在業界都還在講用若干小模型解決複雜問題的2021年,令人耳目一新。」陳昱說。2021年底,閔俊傑離職創辦MiniMax。閔俊傑負責技術,贠燁禕負責技術以外的產品、融資等事務。一位MiniMax早期人士說:“閔俊傑想要做全世界最偉大的技術,贠燁禕想做全世界最偉大的公司。”閔俊傑把AGI視為「一般人每天都會使用的一個產品、一個服務」。一位MiniMax前員工說,他加入MiniMax,是被會議室牆上的一行字打動──Intelligence for Everyone。MiniMax的第一輪融資印證了這套故事的吸引力:閔俊傑在與高瓴創始人張磊聊過後,高瓴直接取代雲啟,拿下首輪2000萬美元融資的領投。 MiniMax投後估值達2億美元。月之暗面起步沒那麼順利。 2023年初,剛成立的月之暗面想融資2,000萬美元還不順利。在投資人眼裡,楊植麟只有「技術」 標籤,缺乏產品、管理、融資經驗。出生於1992年的楊植麟是廣東汕頭人,頭髮茂密,他在卡內基美隆讀博期間,發布的大語言模型相關論文XLNet和Transformer-XL,現在引用接近兩萬。月之暗面創辦人楊植麟同樣在讀博士期間,27歲的楊植麟參與創辦AI公司循環智能。他在自己的個人主頁上寫道:“我所有工作的目標,包括研究和商業,都是最大化人工智慧的價值。”月之暗面的起點,是楊植麟在循環智能負責的團隊。 2021年,楊植麟主導了華為雲合作的千億級盤古大模型,團隊就叫「Moonshot」。兩年後,他推動「Moonshot」 從循環獨立,成立月之暗面。他認為要“專門建一家公司,而不是從別的業務裡拐出一條支線。”起步融資遇挫,楊植麟想到循環智能的投資人、也是他的清華學姊張予彤。在2019年,在金沙江創投的張予彤就主導投資了循環智能。在張予彤的推動下,月之暗面最終在2023年上半年完成第一筆融資,紅杉、真格、Monolith的下注讓楊植麟趕上了窗口期。張予彤如今在月之暗面的角色是二號位,與贠燁禕在MiniMax類似,負責融資、成長等業務。不過張予彤的加入,後來也讓月之暗面陷入潛在的利益衝突與仲裁風波。雖然起步方式不同,兩位創辦人在公司的發展上做出了類似的選擇:用大半年時間研發基礎模型後,嘗試做C端產品,並迎來了第一個爆發點。2022年年中,MiniMax投入數名員工,用一個月的時間做出了AI對話產品Glow,用戶可以在這個產品上自由創建角色,並和角色對話。他們本來想用遊戲化的方式收集數據,「沒人想到這個產品會一炮而紅」。 Glow上線4個月後註冊用戶超過五百萬。「Glow出乎意料的成功讓公司的重心轉向了C端產品。」一位MiniMax員工說。 2023年底,MiniMax約有300名員工,其中近200人在產品線,遠超越同類大模型新創公司。月之暗面的故事類似。 2023年8月,他們第一個模型訓練到後期,開始立項做AI助理Kimi,當時整個公司只有50人,預期只是「展示模型能力」。上線之後,Kimi連續數月月活用戶季增超過100%。「用了最少的錢,最少的人,最少的卡,做到了最好的狀態。」Monolith創始合夥人曹曦曾如此評價月之暗面,他的基金跟進了月之暗面三輪融資。2023底再融資時,月之暗面成為資本追捧的對象。小紅書投前9億美元估值的價格很快就被阿里壓過:投資近8億美元,將月之暗面的估值抬升到23.4億美元。這讓它的估值與2021年就成立的MiniMax並駕齊驅,膨脹速度遠超上一代AI公司。同一時間,MiniMax也拿到阿里投資的6億美元資源,估值又超過月之暗面。兩筆融資2024年初完成,合計超14億美元(100億元人民幣),超過中國大模型創投領域上一年公開融資總額,改寫了產業格局。早期成長吸引大額投資也成了競爭中的弱點大額資本的注入放大了兩位創辦人的野心。 2024年初,閔俊傑定下激進目標:科技達到GPT-4的水平,把產品用戶規模翻十倍,單一產品能突破千萬DAU。這一年的MiniMax很像字節跳動:同時推進多條產品線,從Talkie、星野到海螺AI,還有幾個沒有上線過就放棄的產品。年中,MiniMax員工總數成長到400左右。公司成立剛一年,楊植麟定下覆蓋多個方向的目標:技術上深入無損長文字、視頻生成、多階段推理;產品上追求DAU增長、出海;並加大商業化力度。到年中,信奉菁英策略的月之暗面,員工也翻了一番。問題跟著爆發。 MiniMax陷入糾結與搖擺,這年1月,MiniMax視覺模型團隊開始押注視頻模型;3月,他們抽調星野/Talkie和開放平台的一部分研發人員,做產品形態類似即夢的視頻生成項目;5月,他們放棄這個產品形態項目。到了8月,高層要求在一周內讓模型“能用”,要趕上公司的Open Day。一位員工回憶,那時模型生成的人物“手腳還在亂飛”,而承載視頻模型的產品項目早已放棄。最後團隊先做了網頁版上線,讓使用者測試,移動端往後延,嫁接到原本主打語音互動的海螺AI。不過就像Glow 一樣,他們對這個產品期望不高。但第二個月,其網頁端瀏覽量就接近500萬。一位MiniMax員工回憶,2024年的大部分時間,他們都被這種「既要又要」 的氣氛影響——公司既想增長,又不想將模型往「軟色情」 方向調整,但「一健康就不增長」。高層一度要求暫停在Talkie、星野等產品上增加廣告位,但收入下滑後又陷入焦慮。閔俊傑說,他經歷過技術被資本裹挾的過程:“如果一家企業必須靠不斷融資才能前進,那它優化的就不再是產品,而是如何說服投資者繼續給錢。”月之暗面的精英策略也沒有在新方向上發揮太多效果。他們想要復現Sora的視頻模型,但效果一直未及預期,唯一的“亮相”,是幾位聯合創始人在朋友圈裡發布的幾條視頻,稱由自家視頻模型生成;月之暗面低調上線的兩款出海產品Ohai和Noisee,幾個月後便停止運營。在這段期間,月之暗面創始團隊出售股份,迅速在創投領域引發風波。關鍵不在於賣股份,而是月之暗面背後的敘事失調。產品未定型、格局未穩固的時刻,創始團隊出售股份,很容易被理解為「急於落袋為安」。在風波之中,我們曾問他此事,他以一句「Fake news」 簡短作答。2024年年中,「大模型進展放緩」 的論調開始流行。當技術可能很難帶來巨大突破時,市場和投資人衡量公司成長潛力的指標,轉向最直接的DAU數據。在月之暗面,張予彤主導大規模投流,拉高了B站等平台的AI產品投流價格。 MiniMax也在高層反覆的糾結後,最後決定跟進。他們再一次被資本看好。 MiniMax拿到騰訊等機構的投資;8月,月之暗面獲得騰訊、高榕創投等3億美元融資。資本意志開始更深地介入公司經營,部分投資人頻繁地提供他們成長「建議」:那些海外AI應用公司成長更快,那些投流策略更有效率,那類產品功能更能帶來留存。但一同出現的還有更強的對手。字節跳動發動了飽和式攻擊:產品線覆蓋一切,從生產力到娛樂,從助手到硬體。我們瞭解到,字節也嚴格控制外部AI產品在抖音上的投放,而豆包等作為字節產品,還能享有折扣。一位月之暗面員工回憶,那是公司的士氣低谷,「面對字節這樣的敵人,是打不過的。」一位投資人稱,如果不推動公司轉型,「除了硬著頭皮跟字節拼消耗,似乎別無他法」。到這一年10月,一場數位投了大模型的投資人參加的聚會中,他們開始討論“如何能賣掉部分手裡的大模型創業公司股份?”追求科技可以是一種選擇但空間越來越小DeepSeek「解救」 了MiniMax和月之暗面。他們靠著遠超市場預期的模型,沒花一分錢投流,就在一周內吸引了數千萬用戶,製造了中國自己的ChatGPT時刻。“如果你在對手更強的賽道,那你就沒有勝的可能。” 一位月之暗面員工說,DeepSeek帶來的熱潮,讓他明顯感覺到公司內部情緒有了好轉,“只要技術夠強,就有機會逆天改命。”月之暗面不再更新K1系列的模型,集中資源投入基礎演算法與新模型K2。這個新模型被寄予厚望,月之暗面研發團隊幾乎全員參與,楊植麟本人也親自下場寫程式碼。張予彤在社交平台上寫道,“小夥伴為了這次發布直接睡在公司裡”,配圖是一個帶有“離發布還有0天” 標語的圖片,標語下是一張沙發床。幾個月高強度開發後,月之暗面在7月發布並開源兆參數的MoE模型Kimi K2,宣稱在自主編程、工具調用和數學推理等維度上超過DeepSeek-V3和阿里Qwen3。在這之前,楊植麟相信「閉源是正確的路」。 《自然》雜誌網站的一篇文章稱其為「中國的另一個DeepSeek時刻」。MiniMax也完成了類似的對焦。他們將重點從“模型與產品並重” 收縮到“模型優先”。視訊、語音等多模態模型仍在研究,這是他們有優勢的方向。我們瞭解到,閔俊傑也把一部分產品的員工轉到模型團隊,並為文字模型重新分配算力,核心資源集中到語言模型的基礎能力上,增加數學與程式資料的比重。他之前說,MiniMax沒必要為了一篇新聞稿,就訓練一個類似o1那樣的推理模型。他們10月開源語言模型M2時,強調它的程式設計和推理能力突出,使用量在OpenRouter上已經成長到了前五名。 「應該創業第一天就開源。」髕俊傑年初說。兩家公司似乎回到了剛創業時的狀態,都把提升模型的能力當作主線,投資者也不再過度給公司提建議。公司的經營依賴創業者本身管理能力。髕俊傑看起來溫和,但一旦做出決定,執行起來極為堅決。在MiniMax創業初期,團隊曾嘗試3D數位人方向。工程尚未上線,閔俊傑判斷這條路與公司長期技術路線不符,就立即叫停。計畫解散,剛組成的團隊經歷第一輪震盪。2024年起,MiniMax的中層開始密集流動:產品負責人、商務負責人、資料科學負責人、成長負責人、戰投負責人等陸續離開。例如MiniMax對齊團隊兩年內換了三任負責人——第一任因與髕俊傑激烈爭論技術進展,被降為普通工程師;第二任由下屬提拔,半年後離職。 MiniMax早期的一百名員工,如今已走了一半。「不是同路人的這些同事,我會請他們離開。我已經請走了幾位。」閔俊傑曾在公司全員會上說。在他看來,好的成果不是某個人靈光一現的產物,而是科學方法和團隊配合下的必然發現,就算個人能力不算頂尖,只要能讓團隊跑得更快,就是合適的人才。閔俊傑認為,管理公司就是優化函數,目標是商業化效率、呼叫量等變量,管理的核心任務就是找到“梯度下降最快的方向”,不斷逼近最優解。MiniMax的許多決策,像是不做3D、選擇MoE架構、做視訊模型,都屬於「算出來的結果」。甚至MiniMax每兩周一次的全員分享會,也叫「CD」(Coordinate Decent演算法)。楊植麟相信那些能提出新想法的人才,「因為在這個領域,創新本身最有價值」。他願意為了招攬一名自己欣賞的技術人才,從北京飛到深圳,聊上十個小時,第二天趕早班機返回;也會讓優秀的研究者自己一個人在異地自由工作。他傾向於先達成共識,然後再迅速行動。月之暗面的第一款模型亮相時,主打20萬長文字上下文。但一開始,核心團隊有人並不看好這個方向。一位月之暗面早期員工回憶,2023年5月公司就有人提過做長文字,卻被其他人否決,理由是演算法視角裡,這只是壓縮問題,是工程活,不是技術突破。這個方向就沒有推進。兩個月後,Anthropic發布處理50萬文字的Claude模型,引發產業震動。長文字成為月之暗面內部共識。 「Lossless long context is everything」 成了楊植麟常提的一句話。但如今AI公司把追求模型能力當公司經營的核心變得愈發困難。早期的OpenAI是一個參考答案。他們的團隊延續了「學術式」 的工作節奏,用實驗和試錯推動技術研究,領先技術成果誕生後加上山姆·阿爾特曼(Sam Altman)從YC帶來的成長策略,推動公司持續發展。 DeepSeek的「學術循環」 模式——批判性思考、原子化創新、推動科學邊界——也是一種策略,但它不用太過於關注商業化和用戶成長。MiniMax和月之暗面很難找到這樣的空間和資源。這場資本密集遊戲裡,資金、算力和生態支援至關重要。 OpenAI的估值已達5,000億美元,要頂著兆美元估值上市;xAI和Anthropic的估值也都逼近2,000億美元。而MiniMax和月之暗面的估值都在40億美元左右。這讓誰能成為中國OpenAI的問題變得沒有意義。在體量較大的美元基金退潮後,中國擁有大規模資金的巨頭不願為新創公司持續輸血,反而成為AI公司的競爭對手。阿里、字節、騰訊,甚至是DeepSeek,研發基礎模型都有主營業務(電商、廣告、量化)供血,短期沒有獲利壓力。MiniMax和月之暗面都在嘗試用更專業的功能(月之暗面的OK Computer、深度研究;MiniMax的專業模式)吸引用戶付費訂閱。但只要字節等公司的同類產品免費,去年下半年的競爭問題必然會再次出現。他們還在繼續找錢。市場消息稱,MiniMax正籌備赴港上市。月之暗面又開了一輪新融資。大模型註定是需要幾百億美元,甚至是千億美元投入的遊戲。新創公司想要走完這條路,創辦人必須證明,這是一場需要他們參與的長期探索,才能獲得更多的理解和支援。這是一道更難的證明題:在巨頭林立、算力稀缺、資本收縮的市場中,是否還有空間容納一種既做基礎研究、又不屬於任何巨頭的AI公司?這不僅需要更多技術突破,也需要一種在當前中國環境下罕見的能力——靠投資機構和業務收入,維持一支高密度的研究團隊持續產出。 (創業邦)