梁文鋒與DeepSeek的十兆美元棋盤

2026/05/25

•

【新智元導讀】DeepSeek正用開源、降價和底層架構創新，重畫AI硬體生態的成本曲線，把目標指向十兆美元產業與AGI的星辰大海。

DeepSeek最近動作頻頻。

先是5月22日，彭博社爆出他們正在推進700億元人民幣的融資，投前估值高達450億美元。

同一天，DeepSeek官宣V4-Pro API永久降價75%——把促銷價直接焊死成正價。

一邊向投資人要錢，一邊向開發者讓利。這操作，多少有點讓人迷糊。

那麼問題來了，DeepSeek到底要靠什麼賺錢，而且還要賺很多很多錢？

畢竟，AGI可不是能口嗨出來的。

這正是x博主@bookwormengr最近研究的一個狠問題。

他在長文《DeepSeek's 10 trillion USD grand strategy》中提出一個非常大膽的判斷：DeepSeek真正的星辰大海，可能不是賣程式設計套餐，不是賣語音助手，而是參與塑造一個價值10兆美元等級的AI硬體生態，並在這個生態裡衝擊兆美元級估值。

仔細讀完@bookwormengr的這篇萬字長文，你會發現：梁文鋒不是瘋子，他是棋手。

而且是高手，他下的是一盤價值10兆美元的棋。

英雄之旅一場反共識的技術長征

回顧DeepSeek的成長軌跡，用「英雄之旅」來形容不為過。

在所有人都在堆Dense模型、卷參數量的時候，DeepSeek去啃最難訓的MoE（混合專家模型），用更少的計算量撬動更高的智能。

別人用PPO做強化學習，他們從第一性原理出發，發明了更便宜的GRPO演算法。

別人還在討論RLHF的天花板，他們已經跑通了RLVR（基於可驗證獎勵的強化學習），把推理能力拉上了新台階。

MLA、DSA（解耦稀疏注意力）、mHC（流形約束超連接）、CSA和HCA——這些都不是論文裡的花拳繡腿，每一項都在回答同一個問題：怎樣在有限的硬體條件下，榨出最大的AI算力？

英雄從來不是一開始就知道自己的使命。他在路上不斷戰鬥、不斷髮現，最終找到了自己的終極宿命。

DeepSeek的宿命，從來都不是賣API套餐。

一道有趣的數學題 KV Cache的秘密

讓我們從一個具體的數字開始講這個故事。

打開kvcache.ai的線上計算器，輸入100萬token上下文、8bit KV精度、16bit索引精度，你會看到一組讓人瞠目的對比：DeepSeek V4僅需 5.48GB HBM。

相比之下，其他頂級開源模型則動輒需要 60GB HBM。

注意，DeepSeek V4是一個1.6兆參數的模型，體量遠大於其他開源模型，KV Cache佔用卻只有它們的零頭。

這意味著DeepSeek可以把快取命中的價格定到一個令人髮指的低位——V4-Pro快取命中價僅0.025元/百萬Token，不到Claude Sonnet 4.6同類價格的3%，而且可以持續快取數小時。

永久降價後，輸入快取未命中3元/百萬Token，輸出6元/百萬Token，全部是原價的四分之一。

梁文鋒兩年前就說過DeepSeek的定價哲學：我們的原則是不貼錢，也不賺取暴利。

現在看來，他說的是實話——當你的KV Cache只有別人的十分之一，你的成本就是別人的零頭。

但更深的問題是：這個紅利到底流向了那裡？

十兆美元的棋盤硬體生態的重構

答案藏在三個縮寫裡：SSD、LPDDR、HBM。

第一層：SSD與NAND快閃記憶體。 KV Cache被壓縮到極小之後，可以高效地解除安裝（offload）到SSD上，等需要時再快速載入回HBM。

DeepSeek在Dual Path論文中還專門最佳化了從SSD載入KV Cache的速度。這直接減少了對昂貴HBM的依賴。

誰是SSD和NAND快閃記憶體的大玩家？DeepSeek每壓縮一分KV Cache，就在為NAND和SSD創造一個龐大的新市場。

第二層：LPDDR記憶體。SGLang團隊發表的研究表明，LPDDR完全可以作為「權重暫存區」——模型權重先放在LPDDR裡，需要時再流式傳輸到HBM中，大幅緩解HBM的容量壓力。

DeepSeek的MoE架構天然適配這個方案：專家數量多、權重可以4bit量化，流式載入非常高效。

誰在做LPDDR？國產速度只落後0.5代，密度落後1代，追趕的腳步已經很近。

第三層：GPU/ASIC的減壓。 Engram模組用LPDDR中的雜湊查表替代Transformer的前向傳播計算，本質上是用每位元成本極低的「記憶體讀取」替代每位元成本極高的「GPU運算」。

這對中國AI晶片意義重大——由於EUV光刻機受限，國產GPU在原始FLOPs上落後。但如果你能用更多的便宜記憶體來替代更少的昂貴算力，那這種「換道超車」就變得合理了。

再加上TileLang——DeepSeek投資的跨硬體核心編譯框架，可以讓一套計算程式碼同時跑在多種硬體平台上，相當於繞過了「CUDA護城河」。國產晶片廠商，都有可能因此獲得生態層面的突破。

現在你明白了嗎？DeepSeek做的每一項技術創新，都在指向同一個方向：降低對頂級硬體的依賴，讓中國現有的儲存、晶片、網路生態變得足夠用，甚至好用。

@bookwormengr算了一筆大帳：全球AI相關股票的總市值早已遠超10兆美元。

如果DeepSeek能幫助中國建構一個等量級的AI硬體生態，它自己在這盤棋裡拿到1兆美元的估值，完全合乎邏輯。

不賺快錢的邏輯

回頭看DeepSeek的所有「不做」——不做多模態（V4.1才開始試水圖像和音訊）、不做語音模型、不做視訊模型、API一降再降——就說得通了。

不是「不會賺錢」，而是「暫時不屑於賺這種錢」。

@bookwormengr提出了一個精彩的類比：OpenAI拿到了AMD和Cerebras的股權認購權證，只要達成算力採購里程碑就可以低價買入股票。這本質上是「用承諾換股權」——你幫我造晶片，我給你訂單，我們一起把蛋糕做大。

DeepSeek完全可以複製這個模式。

只不過它面對的不是AMD和Cerebras，而是整條國產AI硬體產業鏈。

梁文鋒是量化基金出身，被稱為「 Jim Simmon的忠實粉絲」。這樣一個人，不可能不懂資本運作的精妙之處。

事實上，融資消息傳出前，他已經在2026年4月完成了一次關鍵的股權調整——通過直接與間接持股控制公司約84.29%的股權，表決權100%。

寧德時代投DeepSeek——它要鎖定未來AI資料中心的儲能訂單。京東、網易入局，各有各的戰略訴求。

國家大基金下場，更是把DeepSeek定位成了國家級AI基礎設施。

這些投資者看到的，不是一個賣API的小生意。他們看到的，是一個可能重塑全球AI硬體格局的戰略支點。

終極使命大規模強化學習與AGI

但如果你以為DeepSeek的終點是「做中國AI硬體生態的發動機」，那可能還是低估了梁文鋒。

據彭博社報導，梁文鋒在投資者會議上明確表態：DeepSeek的主要目標是推動技術邊界，追求AGI。

硬體生態是手段，AGI才是目的。

邏輯是這樣：當更多硬體選擇變得可用、當算力需求本身被技術創新大幅壓低，DeepSeek就能以更低的成本啟動更大規模的訓練——特別是強化學習（RL）後訓練和遞迴自我改進（RSI）。

大規模RL意味著模型需要生成海量的推理軌跡——兆級token的生成量，計算成本極其恐怖。而100萬上下文的長程任務，要求軌跡本身也足夠長。

如果沒有極致的硬體效率最佳化，這種訓練根本跑不起來。

RSI則更加大膽——讓AI自己設計實驗、執行實驗、分析結果、改進自身。這是一個試錯密度極高的過程，對算力的需求是無底洞。

但如果DeepSeek通過重構硬體生態把算力成本打下來，這條路就變得可行。

從MoE到MLA，從DSA到CSA，從Engram到TileLang，從KV Cache壓縮到LPDDR流式載入——所有這些創新，最終都匯聚到同一個終點：讓AGI的訓練從「燒不起」變成「燒得起」。

梁文鋒與DeepSeek的星辰大海，從來不是海面上的浪花，而是洋流本身。 (新智元)

科技

梁文鋒與DeepSeek的十兆美元棋盤

英雄之旅 一場反共識的技術長征

一道有趣的數學題 KV Cache的秘密

十兆美元的棋盤 硬體生態的重構

不賺快錢的邏輯

終極使命 大規模強化學習與AGI

英雄之旅一場反共識的技術長征

十兆美元的棋盤硬體生態的重構

終極使命大規模強化學習與AGI