梁文鋒的終極野心：不做OpenAI，造一個10兆美元中國產業巨獸

2026/05/25

•

100萬token上下文，DeepSeek V4隻需要5.48GB視訊記憶體，智譜GLM5需要60GB，阿里Qwen3需要89GB。

更離譜的是，DeepSeek是個1.6兆參數的巨無霸，而Qwen3隻有2350億參數。參數多了近7倍，視訊記憶體佔用卻少了16倍。

這不是實驗室裡的技術炫技，這是直接改寫AI產業成本結構的核武器。

所有人都在問同一個問題：DeepSeek到底怎麼賺錢？

它不賣程式設計訂閱，不做多模態，甚至連個評測框架都懶得搭。OpenAI靠ChatGPT Plus月入數億，月之暗面、智譜、MiniMax都在瘋狂捲Coding Agent，DeepSeek卻像個局外人，一門心思開源、發論文、壓縮KV快取。

瘋了嗎？

恰恰相反。梁文鋒看得比誰都遠。程式設計訂閱那點錢，撐死也就幾十億美元的年收入。但如果能把AI推理對HBM（高頻寬記憶體）的依賴打掉，把算力成本壓到地板價，由此釋放出的中國國產硬體需求，是一個10兆美元的產業巨獸。

說白了，DeepSeek不是在賣模型，它是在給整個中國AI產業"換底座"。

KV快取是什麼？你可以把它理解成大模型的"短期記憶"。上下文越長，這塊記憶佔用的視訊記憶體就越誇張。以前100萬token的上下文是土豪遊戲，因為視訊記憶體貴到離譜，而視訊記憶體的核心就是HBM——全球產能被三星、SK海力士、美光壟斷，中國幾乎造不了，輝達GPU之所以貴，HBM佔了很大一部分成本。

DeepSeek的MLA、DSA、CSA、HCA一連串注意力機制魔改，把KV快取壓到了行業不可思議的低位。這意味著什麼？意味著以前必須塞在昂貴HBM裡的資料，現在可以低成本地"轉存"到SSD固態硬碟裡，需要時再高速讀取。

SSD是誰的天下？長江儲存（YMTC）正在成為全球3D NAND快閃記憶體巨頭。LPDDR低功耗記憶體呢？長鑫儲存（CXMT）的差距只剩半代到一代。

更關鍵的是，DeepSeek的MoE架構天然支援4-bit權重，模型權重可以放在LPDDR裡流式傳輸到HBM，進一步減輕對HBM容量的飢渴。這套組合拳下來，系統對HBM的依賴斷崖式下跌。

輝達黃仁勳為什麼急？他親口說，DeepSeek率先在華為昇騰上發佈，"對我們國家來說是一個可怕的結果"。因為這意味著全球各地的AI模型，可能在非美國硬體上跑得最好。

這才是DeepSeek融資100億美元、估值450億美元的真正邏輯。國家大基金領投，騰訊、IDG跟投，這不是VC在賭一個SaaS公司的收入曲線，這是國家在押注一套"模型+晶片+儲存"的自主可控生態。

有意思的是，DeepSeek的開源策略在這裡扮演了最精妙的角色。

表面上看，開源是"做慈善"。實際上，當全行業都在用DeepSeek的架構標準、訓練方法、壓縮技術時，DeepSeek就成了AI時代的Android。它不直接向使用者收費，但它定義了產業鏈的介面和規則。所有圍繞這個生態賺錢的硬體廠商、雲服務商、應用開發者，都在變相為DeepSeek的護城河添磚加瓦。

那些嘲笑DeepSeek"不會商業化"的人，和當年嘲笑Android"免費系統怎麼賺錢"的人，大概是同一批。

當然，這條路並非沒有風險。HBM短期內仍是性能巔峰，中國國產晶片在訓練環節仍有代差，長江儲存和長鑫儲存的產能爬坡需要時間。DeepSeek的100萬上下文在實際Agent場景中的穩定性，也還需要大規模驗證。

但趨勢已經清晰：AI產業的競爭，正從"模型參數軍備競賽"轉向"推理成本結構革命"。誰能讓長上下文Agent的成本低到普及，誰就能解鎖下一代應用生態。

DeepSeek的終局，不是成為下一個OpenAI。它的終局，是讓中國AI產業不再被輝達的HBM卡脖子，順便讓自己成為一家兆美元公司。

當所有人還在算API呼叫量時，梁文鋒已經在算國之重器的帳了。 (智軌線)

科技