一周燒光140億：中國大模型"諸神之戰"開打了

2026/05/11

•

一周燒光140億：中國大模型"諸神之戰"開打了

2026年5月的第一周，中國AI圈發生了一件讓全球都側目的事。

月之暗面（Kimi）宣佈完成新一輪約20億美元融資，折合人民幣約140億元，創下中國大模型領域有史以來最高的單筆融資紀錄。

與此同時，幾乎在同一個時間節點，國家積體電路產業投資基金（大基金）正在洽談領投DeepSeek的消息悄悄流出，DeepSeek最新估值已從100億美元一路飆升至450億美元，折合人民幣超過3000億元。

兩顆炸彈，同時引爆。

這不是一場普通的融資新聞。這是一個訊號：中國AI大模型的"諸神之戰"，正式打響了。

一、Kimi拿了多少錢，又靠什麼拿到的？

先說Kimi這輪融資的成色。

20億美元，由美團龍珠領投，水木資本、中國移動、CPE源峰（中信產業基金）等跟投。老股東阿里、騰訊、小紅書也悉數加注。投後估值突破200億美元，換算成人民幣超過1400億元。

值得注意的是，這已經是月之暗面在2026年完成的第二輪融資。今年2月，他們剛剛拿完一輪超7億美元（約47億人民幣）的C輪。三個月不到，又進來140億。

自成立以來，月之暗面累計融資額已超376億元，成為中國大模型創業公司中累計融資最多的公司。

這麼多人願意砸錢，憑什麼？

答案在產品上。

4月20日，月之暗面發佈並開源了旗艦模型Kimi K2.6。在多項全球權威基準測試中，K2.6的表現持平甚至優於GPT-5.4和Claude Opus 4.6——這兩款產品分別來自OpenAI和Anthropic，是目前全球頂尖的商業閉源模型。

一家中國創業公司，正面對壘全球最強團隊，拿到了相當的成績單。

投資人的邏輯很清晰：能打，就繼續砸。

二、DeepSeek估值3000億，大基金為什麼要入局？

再說DeepSeek這邊。

這家公司的融資消息從去年就開始傳。但每次傳出來，都會刷新你對數字的認知。

4月中旬曝出首輪融資時，估值是100億美元。進入5月，隨著科技巨頭和國家隊相繼入局，最新估值已經跳漲到450億美元（超過人民幣3000億元），短短幾周內翻了4倍多。

大基金的入局，是整件事中最值得關注的細節。

大基金的全稱是國家積體電路產業投資基金，成立於2014年，是中國扶持半導體產業最核心的國家級資金。它過去主要投晶片製造、封裝測試、裝置材料。現在，它正在進入AI大模型領域。

這意味著什麼？

這意味著：中國AI大模型，已經從"商業賽道"升格為"國家戰略資產"。

國家隊出手，不是來賺錢的。是來定錨的：這個賽道，必須有人做成，而且必須做成到足夠強。

三、百度用6%的成本，做出了同等級最強的模型

就在Kimi和DeepSeek的融資新聞刷屏的同時，另一件事悄然發生，幾乎被掩蓋掉了。

5月9日，百度正式發佈文心大模型5.1。

這個發佈，在技術層面的突破程度，可能被嚴重低估了。

文心5.1的關鍵數字是：預訓練成本僅為業界同規模模型的6%。

不是60%，是6%。

什麼概念？業界其他公司訓一個同等規模的模型要燒掉100塊錢，百度只燒了6塊，還拿到了更好的成績。

具體資料：文心5.1以1223分登上Arena搜尋榜全球第四、中國第一，是唯一進入全球前十五的中國國產大模型。在程式碼和智能體（Agent）能力評測中，成績超越DeepSeek-V4-Pro；在推理能力的AIME26數學競賽評測中，得分99.6，僅次於GoogleGemini 3.1 Pro。

參數規模更是壓縮得極為徹底：總參數僅為文心5.0的1/3，啟動參數壓縮至約1/2。

背後的技術叫"多維彈性預訓練"。核心思路是：一次訓練，生成多種規模的模型。傳統做法是，你想要一個大模型，就得訓一個大模型；想要一個小模型，再單獨訓一個小模型，兩套成本。百度做到的，是一次訓練同時最佳化出多規模的子模型矩陣，然後從中提取最優結構，繼承上一代文心5.0的知識。

這不是"降配"出來的廉價貨，而是用效率革命打出來的技術彎道超車。

四、三件事疊加，說明什麼？

Kimi 140億融資、DeepSeek估值3000億、文心5.1以6%成本登頂——把這三件事放在一起看，你會看到一幅更完整的圖景。

第一，中國AI資本邏輯變了。

過去一年，很多AI公司哭訴"資本寒冬"。但仔細看會發現，寒冬從來不是一視同仁的。寒的，是那些講故事大過實力、PPT多過產品的公司。熱的，是那些真正拿出了成績的玩家。

Kimi K2.6敢於開源並與GPT-5.4、Claude Opus 4.6正面PK，說明技術實力是真實的。資本的嗅覺，從來不差。

第二，國家隊的入場改變了遊戲規則。

大基金入局DeepSeek，背後的潛台詞是：AI大模型將被納入跟半導體同等等級的國家戰略工程。這對整個賽道的影響，遠不止於估值。從資金保障到資源調配，到政策支援，邏輯鏈會發生系統性變化。

第三，效率才是下一階段的核心競爭力。

文心5.1的意義，不只是一款新模型，而是一個方向的宣言：燒錢堆算力的野蠻生長階段已經過去了，接下來比的是：同樣的錢，誰能做出更強的東西。

6%的成本，打出同等級最強效果。這不是一個孤例，這是行業趨勢。

去年的DeepSeek以極低成本挑戰GPT-4，轟動全球。今年文心5.1用6%的預訓練算力登頂搜尋榜中國第一。一個新的評判標準正在建立：效率即實力。

五、對你來說，這意味著什麼？

如果你是一個普通使用者，這些消息的直接影響是：中國國產AI會越來越好，越來越便宜，甚至越來越免費。

但我想說一件更重要的事。

這場大模型資本大戰，本質上是一場關於未來生產工具控制權的爭奪。

誰掌握了最好的大模型，誰就擁有了未來最核心的"作業系統"。它不是裝在手機裡的那種作業系統，而是運行在每一個行業、每一個工作流程上的智能層。

寫程式碼、做設計、分析資料、處理合同、寫行銷文案、跑財務報告——每一個原本需要人來做的事，正在被這個智能層一層層接管。

Kimi、DeepSeek、文心、字節豆包……這些公司搶的不只是市場份額，爭的是：那一家的模型，會成為這個智能層的底座？

中國大模型的"諸神之戰"，勝負未定。

但資本已經用腳投票了。

在這場戰爭裡，被淘汰的從來不只是公司。還有那些不願更新認知、不願學習新工具的人。

最好的時代，留給那些看懂了走向、選好了工具、然後走下去的人。 (碼農菜菜)

科技