一周燒光140億:中國大模型"諸神之戰"開打了
2026年5月的第一周,中國AI圈發生了一件讓全球都側目的事。
月之暗面(Kimi)宣佈完成新一輪約20億美元融資,折合人民幣約140億元,創下中國大模型領域有史以來最高的單筆融資紀錄。
與此同時,幾乎在同一個時間節點,國家積體電路產業投資基金(大基金)正在洽談領投DeepSeek的消息悄悄流出,DeepSeek最新估值已從100億美元一路飆升至450億美元,折合人民幣超過3000億元。
兩顆炸彈,同時引爆。
這不是一場普通的融資新聞。這是一個訊號:中國AI大模型的"諸神之戰",正式打響了。
一、Kimi拿了多少錢,又靠什麼拿到的?
先說Kimi這輪融資的成色。
20億美元,由美團龍珠領投,水木資本、中國移動、CPE源峰(中信產業基金)等跟投。老股東阿里、騰訊、小紅書也悉數加注。投後估值突破200億美元,換算成人民幣超過1400億元。
值得注意的是,這已經是月之暗面在2026年完成的第二輪融資。今年2月,他們剛剛拿完一輪超7億美元(約47億人民幣)的C輪。三個月不到,又進來140億。
自成立以來,月之暗面累計融資額已超376億元,成為中國大模型創業公司中累計融資最多的公司。
這麼多人願意砸錢,憑什麼?
答案在產品上。
4月20日,月之暗面發佈並開源了旗艦模型Kimi K2.6。在多項全球權威基準測試中,K2.6的表現持平甚至優於GPT-5.4和Claude Opus 4.6——這兩款產品分別來自OpenAI和Anthropic,是目前全球頂尖的商業閉源模型。
一家中國創業公司,正面對壘全球最強團隊,拿到了相當的成績單。
投資人的邏輯很清晰:能打,就繼續砸。
二、DeepSeek估值3000億,大基金為什麼要入局?
再說DeepSeek這邊。
這家公司的融資消息從去年就開始傳。但每次傳出來,都會刷新你對數字的認知。
4月中旬曝出首輪融資時,估值是100億美元。進入5月,隨著科技巨頭和國家隊相繼入局,最新估值已經跳漲到450億美元(超過人民幣3000億元),短短幾周內翻了4倍多。
大基金的入局,是整件事中最值得關注的細節。
大基金的全稱是國家積體電路產業投資基金,成立於2014年,是中國扶持半導體產業最核心的國家級資金。它過去主要投晶片製造、封裝測試、裝置材料。現在,它正在進入AI大模型領域。
這意味著什麼?
這意味著:中國AI大模型,已經從"商業賽道"升格為"國家戰略資產"。
國家隊出手,不是來賺錢的。是來定錨的:這個賽道,必須有人做成,而且必須做成到足夠強。
三、百度用6%的成本,做出了同等級最強的模型
就在Kimi和DeepSeek的融資新聞刷屏的同時,另一件事悄然發生,幾乎被掩蓋掉了。
5月9日,百度正式發佈文心大模型5.1。
這個發佈,在技術層面的突破程度,可能被嚴重低估了。
文心5.1的關鍵數字是:預訓練成本僅為業界同規模模型的6%。
不是60%,是6%。
什麼概念?業界其他公司訓一個同等規模的模型要燒掉100塊錢,百度只燒了6塊,還拿到了更好的成績。
具體資料:文心5.1以1223分登上Arena搜尋榜全球第四、中國第一,是唯一進入全球前十五的中國國產大模型。在程式碼和智能體(Agent)能力評測中,成績超越DeepSeek-V4-Pro;在推理能力的AIME26數學競賽評測中,得分99.6,僅次於GoogleGemini 3.1 Pro。
參數規模更是壓縮得極為徹底:總參數僅為文心5.0的1/3,啟動參數壓縮至約1/2。
背後的技術叫"多維彈性預訓練"。核心思路是:一次訓練,生成多種規模的模型。傳統做法是,你想要一個大模型,就得訓一個大模型;想要一個小模型,再單獨訓一個小模型,兩套成本。百度做到的,是一次訓練同時最佳化出多規模的子模型矩陣,然後從中提取最優結構,繼承上一代文心5.0的知識。
這不是"降配"出來的廉價貨,而是用效率革命打出來的技術彎道超車。
四、三件事疊加,說明什麼?
Kimi 140億融資、DeepSeek估值3000億、文心5.1以6%成本登頂——把這三件事放在一起看,你會看到一幅更完整的圖景。
第一,中國AI資本邏輯變了。
過去一年,很多AI公司哭訴"資本寒冬"。但仔細看會發現,寒冬從來不是一視同仁的。寒的,是那些講故事大過實力、PPT多過產品的公司。熱的,是那些真正拿出了成績的玩家。
Kimi K2.6敢於開源並與GPT-5.4、Claude Opus 4.6正面PK,說明技術實力是真實的。資本的嗅覺,從來不差。
第二,國家隊的入場改變了遊戲規則。
大基金入局DeepSeek,背後的潛台詞是:AI大模型將被納入跟半導體同等等級的國家戰略工程。這對整個賽道的影響,遠不止於估值。從資金保障到資源調配,到政策支援,邏輯鏈會發生系統性變化。
第三,效率才是下一階段的核心競爭力。
文心5.1的意義,不只是一款新模型,而是一個方向的宣言:燒錢堆算力的野蠻生長階段已經過去了,接下來比的是:同樣的錢,誰能做出更強的東西。
6%的成本,打出同等級最強效果。這不是一個孤例,這是行業趨勢。
去年的DeepSeek以極低成本挑戰GPT-4,轟動全球。今年文心5.1用6%的預訓練算力登頂搜尋榜中國第一。一個新的評判標準正在建立:效率即實力。
五、對你來說,這意味著什麼?
如果你是一個普通使用者,這些消息的直接影響是:中國國產AI會越來越好,越來越便宜,甚至越來越免費。
但我想說一件更重要的事。
這場大模型資本大戰,本質上是一場關於未來生產工具控制權的爭奪。
誰掌握了最好的大模型,誰就擁有了未來最核心的"作業系統"。它不是裝在手機裡的那種作業系統,而是運行在每一個行業、每一個工作流程上的智能層。
寫程式碼、做設計、分析資料、處理合同、寫行銷文案、跑財務報告——每一個原本需要人來做的事,正在被這個智能層一層層接管。
Kimi、DeepSeek、文心、字節豆包……這些公司搶的不只是市場份額,爭的是:那一家的模型,會成為這個智能層的底座?
中國大模型的"諸神之戰",勝負未定。
但資本已經用腳投票了。
在這場戰爭裡,被淘汰的從來不只是公司。還有那些不願更新認知、不願學習新工具的人。
最好的時代,留給那些看懂了走向、選好了工具、然後走下去的人。 (碼農菜菜)
