梁文鋒的終極野心:不做OpenAI,造一個10兆美元中國產業巨獸

100萬token上下文,DeepSeek V4隻需要5.48GB視訊記憶體,智譜GLM5需要60GB,阿里Qwen3需要89GB。

更離譜的是,DeepSeek是個1.6兆參數的巨無霸,而Qwen3隻有2350億參數。參數多了近7倍,視訊記憶體佔用卻少了16倍。

這不是實驗室裡的技術炫技,這是直接改寫AI產業成本結構的核武器。

所有人都在問同一個問題:DeepSeek到底怎麼賺錢?

它不賣程式設計訂閱,不做多模態,甚至連個評測框架都懶得搭。OpenAI靠ChatGPT Plus月入數億,月之暗面、智譜、MiniMax都在瘋狂捲Coding Agent,DeepSeek卻像個局外人,一門心思開源、發論文、壓縮KV快取。

瘋了嗎?

恰恰相反。梁文鋒看得比誰都遠。程式設計訂閱那點錢,撐死也就幾十億美元的年收入。但如果能把AI推理對HBM(高頻寬記憶體)的依賴打掉,把算力成本壓到地板價,由此釋放出的中國國產硬體需求,是一個10兆美元的產業巨獸。

說白了,DeepSeek不是在賣模型,它是在給整個中國AI產業"換底座"。

KV快取是什麼?你可以把它理解成大模型的"短期記憶"。上下文越長,這塊記憶佔用的視訊記憶體就越誇張。以前100萬token的上下文是土豪遊戲,因為視訊記憶體貴到離譜,而視訊記憶體的核心就是HBM——全球產能被三星、SK海力士、美光壟斷,中國幾乎造不了,輝達GPU之所以貴,HBM佔了很大一部分成本。

DeepSeek的MLA、DSA、CSA、HCA一連串注意力機制魔改,把KV快取壓到了行業不可思議的低位。這意味著什麼?意味著以前必須塞在昂貴HBM裡的資料,現在可以低成本地"轉存"到SSD固態硬碟裡,需要時再高速讀取。

SSD是誰的天下?長江儲存(YMTC)正在成為全球3D NAND快閃記憶體巨頭。LPDDR低功耗記憶體呢?長鑫儲存(CXMT)的差距只剩半代到一代。

更關鍵的是,DeepSeek的MoE架構天然支援4-bit權重,模型權重可以放在LPDDR裡流式傳輸到HBM,進一步減輕對HBM容量的飢渴。這套組合拳下來,系統對HBM的依賴斷崖式下跌。

輝達黃仁勳為什麼急?他親口說,DeepSeek率先在華為昇騰上發佈,"對我們國家來說是一個可怕的結果"。因為這意味著全球各地的AI模型,可能在非美國硬體上跑得最好。

這才是DeepSeek融資100億美元、估值450億美元的真正邏輯。國家大基金領投,騰訊、IDG跟投,這不是VC在賭一個SaaS公司的收入曲線,這是國家在押注一套"模型+晶片+儲存"的自主可控生態。

有意思的是,DeepSeek的開源策略在這裡扮演了最精妙的角色。

表面上看,開源是"做慈善"。實際上,當全行業都在用DeepSeek的架構標準、訓練方法、壓縮技術時,DeepSeek就成了AI時代的Android。它不直接向使用者收費,但它定義了產業鏈的介面和規則。所有圍繞這個生態賺錢的硬體廠商、雲服務商、應用開發者,都在變相為DeepSeek的護城河添磚加瓦。

那些嘲笑DeepSeek"不會商業化"的人,和當年嘲笑Android"免費系統怎麼賺錢"的人,大概是同一批。

當然,這條路並非沒有風險。HBM短期內仍是性能巔峰,中國國產晶片在訓練環節仍有代差,長江儲存和長鑫儲存的產能爬坡需要時間。DeepSeek的100萬上下文在實際Agent場景中的穩定性,也還需要大規模驗證。

但趨勢已經清晰:AI產業的競爭,正從"模型參數軍備競賽"轉向"推理成本結構革命"。誰能讓長上下文Agent的成本低到普及,誰就能解鎖下一代應用生態。

DeepSeek的終局,不是成為下一個OpenAI。它的終局,是讓中國AI產業不再被輝達的HBM卡脖子,順便讓自己成為一家兆美元公司。

當所有人還在算API呼叫量時,梁文鋒已經在算國之重器的帳了。 (智軌線)