#張予彤
看不懂的月之暗面
圖源:視覺中國“這家公司是我目前最看不懂的。”一位國產大模型上市公司的投資部人士這樣評價月之暗面。在他看來,月之暗面的模型能力本身沒問題。讓人困惑的是,這家公司在行業節奏上的走向。1月21日,在達沃斯世界經濟論壇年會上,月之暗面Kimi總裁張予彤表態:“Kimi很快就會發佈一個新模型。”六天後的1月27日,月之暗面發佈並開源了Kimi K2.5模型。這是Kimi迄今能力最為集中的一次更新:視覺理解、程式碼、多模態輸入、思考與非思考模式、Agent及Agent叢集能力,被統一封裝進同一個All-in-one模型之中。發佈視訊中,楊植麟親自站台介紹著K2.5。模型如期亮相,讓月之暗面在技術層面給了外界一個明確回應。但在資本與公司化層面,它卻走在另一條軌道上。過去一段時間,“AI六小虎”開始分化:智譜、MiniMax先後推進上市。幾乎在同一時間,楊植麟稱,公司有100億元現金,並不著急上市。正是在這種對照下,投資人對月之暗面的“看不懂”,變得更具體。進入行業中場,這是在主動放慢節奏,把籌碼繼續押在技術路徑上,還是不得不承認,已經不在第一梯隊?Kimi K2.5,怎麼樣?一位體驗過Kimi K2.5的AI創業者表示,該模型給他的直觀感受是全面聚焦於“生產力”:核心轉向程式設計、辦公與複雜任務協作,而非擴展零散功能。“它不是靠跑分證明自己,而是靠實際產品能力。”他強調,這種在具體任務中的體感差異,比分數更有說服力。K2.5的取向是一次有跡可循的戰略聚焦,標誌著月之暗面在大模型能力譜系中的位置遷移:其技術標籤已從2024年的“長文字”,轉向2025年的複雜推理、思考過程與Agent任務協同。一位接近公司的人士指出,此輪迭代的價值不在榜單排名,而在工程取向——模型圍繞Agent任務反向設計,核心目標是穩定地拆解任務、呼叫工具並保持長鏈路推理的一致性。這一取向,與月之暗面近年來強調的效率優先路線相呼應。公司方面在多個場合提到,自身並不具備無限堆砌算力的條件,因此更強調演算法與系統層面的效率提升,而非單純擴大訓練規模。在K2系列訓練中,月之暗面使用改進版Muon最佳化器,實現約2倍Token效率提升,並通過QK-Clip等機制增強大規模訓練穩定性;在推理側,則提出Kimi Linear線性注意力機制,在保證效果的同時提升長上下文處理速度。張予彤在達沃斯論壇上將這一策略概括為:僅使用美國頂尖實驗室約1%的資源,完成K2與K2 Thinking的訓練。這也意味著,月之暗面對模型能力的驗證路徑,正轉向工程系統導向。這種變化,同樣體現在產品層。自2025年5月起,Kimi密集推出了Researcher、PPT、Kimi Code等Agent功能;9月進一步上線OK Computer,可呼叫虛擬電腦中的工具完成開發、資料分析、多模態內容生成或製作PPT。Agent被放置在模型能力與商業化之間,逐漸成為關鍵中間層。與此同時,月之暗面有意識地將部分能力驗證場景放在海外。公開資料顯示,K2系列模型發佈後,在OpenRouter等模型呼叫平台上佔據一定份額。市場普遍認為,月之暗面不再追求“大而全”的炫技,而是將籌碼押注在“用工程化能力解決實際問題”這一差異化的方向上。這一策略能否成功,關鍵取決於其Agent叢集等核心功能在真實、複雜業務場景中的穩定性和可靠性能否經得起大規模驗證。同時,在面對DeepSeek等同樣強勁的競爭對手時,如何平衡頂尖性能、使用成本與商業化速度,將是月之暗面接下來的核心挑戰。雙重擠壓:資源戰與評價體系之變更早階段,月之暗面曾是國內較早將重心放在C端通用助手上的大模型公司之一。成立初期,憑藉楊植麟的學術背景,公司在行業內獲得較高期待,被部分從業者視作“中國版OpenAI”,月之暗面很早便選擇以產品形態承接模型能力。2023年8月,在首個模型訓練進入後期階段時,月之暗面啟動AI助理Kimi項目。當時公司規模約50人,Kimi在內部更像是模型能力的展示窗口。產品上線後,Kimi月活使用者一度保持較高增長,並通過投放完成冷啟動,在通用對話類產品中進入頭部梯隊。QuestMobile資料顯示,截至2024年底,Kimi月活使用者超過2000萬,僅次於豆包。多位從業者將那段時間視為月之暗面在C端最為風光的階段。但這種增長,很快就遭遇到了成長的煩惱。進入2025年後,隨著字節豆包、騰訊元寶、阿里系產品線同步推進,這一賽道逐漸演變為高度依賴資源投入的競爭。對擁有平台入口和分發體系的大廠而言,投放成本可以被內部消化;而對獨立創業公司來說,持續投流更像一項難以長期承擔的支出。一位接近月之暗面的人士直言:“創業公司很難跟大廠正面拼投流,比到最後,往往是錢燒得更快,使用者卻留不住。”與此同時,行業對“好模型”的判斷標準也在發生變化。2025年初,DeepSeek等模型的崛起重塑了行業的選擇標準:其幾乎零大規模推廣、純靠技術口碑驅動增長的現象,在業內引發了強烈震動。一位月之暗面員工曾回憶,那段時間公司內部感受到的壓力是雙重的,投流層面打不過大廠,技術聲量又被DeepSeek搶走。但這種衝擊,也促成一次內部認知轉向。公司層面逐漸意識到,對技術型創業公司而言,C端通用助手的使用者規模,並不天然構成技術壁壘。相比講使用者故事,更重要的是在模型能力上形成真實差距。上述投資人將這種變化概括為:“過去是先佔使用者,再補模型;現在是模型能力決定你還能不能留住使用者。”在這一判斷下,楊植麟更傾向於將規模視為階段性結果,而非優先目標。在模型能力尚未形成穩定差距前,過早放大使用者規模,反而可能放大資源消耗與路徑誤判的風險。2025年,月之暗面開始對C端業務做出明顯收斂。產品層面,公司逐步停止大規模投流,收縮泛娛樂方向,先後暫停或放緩Ohai、Noisee等多條C端產品線;技術層面,資源重新集中到基座模型訓練與推理能力;市場層面,重心從國內使用者規模競賽中抽離,轉向海外開發者生態與專業使用者場景;戰略層面,公司從閉源轉向開源,並將產品與商業化的主要增量方向放到海外。整體來看,這是一次主動退出C端正面戰場、更換賽場的選擇。但收縮的代價同樣存在。上述投資人表示,從其瞭解的情況看,公司目前“基本只剩下大模型和Kimi這一條主線”,不少其他產品線已經被放棄,“甚至有多個產品線負責人後來離職創業”。分水嶺時刻:當上市成為同行的標準答案戰略上的主動收縮與聚焦,也讓月之暗面在資本路徑的選擇上,展現出與同業公司截然不同的節奏。成立初期,月之暗面展現出極強的融資能力。公司成立僅三個月後即完成超2億美元天使輪融資,投後估值約3億美元;同年7月完成Pre-A輪融資。2024年進入融資高峰期:2月完成超10億美元A+輪融資,估值升至25億美元;8月完成超3億美元B輪融資,估值提升至33億美元。2025年底,月之暗面完成5億美元C輪融資並實現超募,投後估值約43億美元。表:月之暗面融資時間線然而,與強勁的融資表現形成鮮明對比的是,月之暗面在上市處理程序上的“按兵不動”。在多家同梯隊公司相繼啟動上市處理程序的背景下,月之暗面並未同步推進 IPO。對於一家已具備上市條件、且身處高關注賽道的公司而言,這一選擇並不常見。上述投資人提到,隨著智譜、MiniMax 進入二級市場,大模型公司的評估標準正在發生變化:相比一級市場更強調願景與潛力,二級市場更關注成本結構、毛利率水平與商業化兌現節奏。近期多家公司推動上市,本質上仍是現金流壓力下的融資選擇,而非成功與否的標誌。例如,繼 H 股上市後,智譜仍在推進 A 股上市處理程序。中國證監會官網顯示,其輔導機構中金公司已於 2026 年 1 月 15 日遞交輔導報告。這意味著,“大模型第一股”並未止步於單一資本市場。不同公司間的現金狀況,正在成為決定其戰略節奏的關鍵變數。進入2025年底,行業格局進一步分化:12月中旬,同為“AI六小虎”的智譜和MiniMax相繼通過港交所聆訊並開始招股。就在幾天後的12月31日,久未公開露面的楊植麟內部信曝光,披露公司仍持有約100億元現金,並直言“不急於上市”。此後不久,2026年1月13日百川智能創始人王小川也在媒體溝通會上透露,公司帳上存有30多億元現金。三天後的1月26日,階躍星辰完成超50億元新一輪融資,印奇出任董事長。然而,充足的現金並未消除壓力。在看似從容的“不上市”宣背後,楊植麟、王小川和印奇實則面臨著一個共同的難題:僅憑手中的資金,在技術爆炸的窗口期內建立起真正的護城河。實際上,除了對外部技術競賽的焦慮,對月之暗面來說,公司歷史“舊帳”也構成了另一種維度的壓力。有觀點認為,月之暗面早期分拆相關的股權與仲裁問題尚未完全塵埃落定,在這一狀態下貿然啟動 IPO,本身就存在合規與資訊披露層面的複雜性;相比之下,留在一級市場繼續推進技術與產品演進,操作成本更低。上述投資人補充道,他對月之暗面的判斷依然複雜。公司能夠持續推出模型、持續完成大額融資,說明其在技術能力與資本市場層面具備較強說服力;但月之暗面仍未向外界清晰回答產品形態如何確立、商業化如何展開、穩定使用者從何而來等更基礎的問題。在他看來,月之暗面更像是一家技術能力已被驗證,但公司形態仍在形成中的企業。這種技術先行、商業輪廓尚未完全浮現的狀態,也在一定程度上對應了當前國產大模型行業所處的整體階段。 (深網騰訊新聞)