梁文鋒和楊植麟的默契：AGI不是終點，定義規則才是

2026/05/02

•

484天的沉默，換來一場1.6兆參數的爆發。

4月24日，DeepSeek V4-Pro正式發佈，總參數1.6兆、百萬token上下文、首次將華為昇騰與輝達GPU並列寫進硬體驗證清單。

而就在4天前，與DeepSeek相距僅1.4公里的月之暗面剛開源了Kimi K2.6，SWE-Bench Pro得分58.6，首次讓國產開源模型站上全球程式碼評測之巔。

兩家公司在五天內連發兩款兆級模型，這不是巧合，是海淀區知春路上兩個男人——梁文鋒與楊植麟，長達一年半的默契共振終於公開化。

先說一個被大多數媒體忽略的真相：DeepSeek和Kimi的"技術撞車"，恰恰是開源生態最理想的進化方式。

2025年初，DeepSeek在V3中推出的MLA多頭潛在注意力機制，Kimi直接沿用；2025年7月，Kimi在兆參數K2中率先規模化驗證自研Muon二階最佳化器，訓練成本降低50%以上，而這次DeepSeek V4的技術報告裡，也跟進採用了Muon。

表面上看是路線同質化，實際上這是兩家公司在兆參數無人區裡的"交叉驗證"。你探一步，我確認一步，共同把國產大模型的技術水位抬到全球第一梯隊。

它們是在互相兜底。這種默契，比單打獨鬥更難得。

更關鍵的是，DeepSeek V4的發佈證明了一件事：中國AI已經具備了"晶片-模型-系統"全端自主的能力。

技術報告裡那行關於昇騰950的備註，很多人讀出了"算力受限"的焦慮，但我讀出了另一種訊號：DeepSeek敢於在發佈當天就把國產晶片的適配進度寫進官方文件，這意味著"芯模協同"不再是PPT概念，而是正在發生的工程現實。

下半年昇騰950超節點批次上市後，V4-Pro的價格會大幅下調，到時候國產模型的性價比優勢將進一步放大。

當然，挑戰也是真實存在。

DeepSeek近300人的研發團隊中，已有10位核心成員標註"已離職"，包括初代LLM核心作者王炳宣、R1核心研究員郭達雅等，分別流向騰訊、字節跳動。

人才流失倒逼DeepSeek打破"零融資"的執念，融前估值已達3000億人民幣，計畫增資500億，50億起投。騰訊、阿里正在爭搶入局。

但換個角度看，這恰恰說明DeepSeek的技術實力已經強到讓大廠無法忽視。挖不走整個團隊，就挖核心骨幹；投不了整個公司，就搶份額入局。

這裡有一個反常識的判斷：DeepSeek和Kimi越是被資本追捧，中國AI的"去中心化"生態反而越穩固。

梁文鋒曾拒絕所有外部投資，擔心喪失決策權；楊植麟去年12月還在內部信裡說"短期內不著急上市"。智譜和MiniMax在港股上市後的暴漲並沒有讓這兩家公司跟風IPO，而是選擇了更靈活的一級市場融資。

有意思的是，當國內為DeepSeek和Kimi的融資歡呼時，美國那邊Anthropic的ARR已經突破300億美元，15個月翻了30倍，正式超越OpenAI的240億美元。OpenAI剛完成1220億美元融資，估值8520億美元。相比之下，中國大模型的融資額"顯得小情小調"。

但體量差距背後，是商業模式的代際差異。Anthropic 80%收入來自企業端，30萬家企業客戶，財富十強裡八家在用Claude。

而DeepSeek至今堅持模型全部開源，C端產品免費。這不是不會賺錢，是主動選擇用開源換生態。Kimi雖然月活使用者從巔峰期的3600萬回落至1000-1500萬，但海外API收入四個月翻了四倍。

Cursor套殼Kimi事件更讓全球開發者意識到：中國開源模型的性能已經不輸閉源旗艦。

中國大模型公司不是在重複網際網路時代的"燒錢換規模"劇本，而是在走一條更硬核的路：先用技術實力打開全球市場，再用生態粘性鎖定長期價值。

歷史正在寫下新的註腳。

當DeepSeek把昇騰寫進技術報告，當Kimi的模型ID出現在Cursor的API呼叫裡，當馬斯克親自轉發評價"Impressive work from Kimi"。這些訊號都在指向同一個趨勢：中國AI不再只是"本土童話"，而是全球開源生態的規則制定者之一。

朱嘯虎去年說"大模型已經變成水電煤，沒有超額利潤"。

目前來看，他錯了一半：大模型確實在變成基礎設施，但超額利潤沒有消失，只是從閉源壟斷轉移到了開源生態的規模化營運。DeepSeek和Kimi的估值飆漲，本質上不是泡沫，是資本對"開源即權力"這一新範式的提前下注。

DeepSeek和Kimi的"知春路雙雄"敘事，不是精緻的本土童話，而是正在發生的全球級技術事件。它們的結局也不只有兩種：被資本收編，或在獨立與規模之間找到平衡。

還有第三種可能，用開源生態的廣度，避險閉源壟斷的深度，最終在全球AI格局中佔據不可替代的位置。

AGI不是終點，定義規則才是。 (識焗)