【新智元導讀】DeepSeek正用開源、降價和底層架構創新,重畫AI硬體生態的成本曲線,把目標指向十兆美元產業與AGI的星辰大海。
DeepSeek最近動作頻頻。
先是5月22日,彭博社爆出他們正在推進700億元人民幣的融資,投前估值高達450億美元。
同一天,DeepSeek官宣V4-Pro API永久降價75%——把促銷價直接焊死成正價。
一邊向投資人要錢,一邊向開發者讓利。這操作,多少有點讓人迷糊。
那麼問題來了,DeepSeek到底要靠什麼賺錢,而且還要賺很多很多錢?
畢竟,AGI可不是能口嗨出來的。
這正是x博主@bookwormengr最近研究的一個狠問題。
他在長文《DeepSeek's 10 trillion USD grand strategy》中提出一個非常大膽的判斷:DeepSeek真正的星辰大海,可能不是賣程式設計套餐,不是賣語音助手,而是參與塑造一個價值10兆美元等級的AI硬體生態,並在這個生態裡衝擊兆美元級估值。
仔細讀完@bookwormengr的這篇萬字長文,你會發現:梁文鋒不是瘋子,他是棋手。
而且是高手,他下的是一盤價值10兆美元的棋。
英雄之旅 一場反共識的技術長征
回顧DeepSeek的成長軌跡,用「英雄之旅」來形容不為過。
在所有人都在堆Dense模型、卷參數量的時候,DeepSeek去啃最難訓的MoE(混合專家模型),用更少的計算量撬動更高的智能。
別人用PPO做強化學習,他們從第一性原理出發,發明了更便宜的GRPO演算法。
別人還在討論RLHF的天花板,他們已經跑通了RLVR(基於可驗證獎勵的強化學習),把推理能力拉上了新台階。
MLA、DSA(解耦稀疏注意力)、mHC(流形約束超連接)、CSA和HCA——這些都不是論文裡的花拳繡腿,每一項都在回答同一個問題:怎樣在有限的硬體條件下,榨出最大的AI算力?
英雄從來不是一開始就知道自己的使命。他在路上不斷戰鬥、不斷髮現,最終找到了自己的終極宿命。
DeepSeek的宿命,從來都不是賣API套餐。
一道有趣的數學題 KV Cache的秘密
讓我們從一個具體的數字開始講這個故事。
打開kvcache.ai的線上計算器,輸入100萬token上下文、8bit KV精度、16bit索引精度,你會看到一組讓人瞠目的對比:DeepSeek V4僅需 5.48GB HBM。
相比之下,其他頂級開源模型則動輒需要 60GB HBM。
注意,DeepSeek V4是一個1.6兆參數的模型,體量遠大於其他開源模型,KV Cache佔用卻只有它們的零頭。
這意味著DeepSeek可以把快取命中的價格定到一個令人髮指的低位——V4-Pro快取命中價僅0.025元/百萬Token,不到Claude Sonnet 4.6同類價格的3%,而且可以持續快取數小時。
永久降價後,輸入快取未命中3元/百萬Token,輸出6元/百萬Token,全部是原價的四分之一。
梁文鋒兩年前就說過DeepSeek的定價哲學:我們的原則是不貼錢,也不賺取暴利。
現在看來,他說的是實話——當你的KV Cache只有別人的十分之一,你的成本就是別人的零頭。
但更深的問題是:這個紅利到底流向了那裡?
十兆美元的棋盤 硬體生態的重構
答案藏在三個縮寫裡:SSD、LPDDR、HBM。
第一層:SSD與NAND快閃記憶體。 KV Cache被壓縮到極小之後,可以高效地解除安裝(offload)到SSD上,等需要時再快速載入回HBM。
DeepSeek在Dual Path論文中還專門最佳化了從SSD載入KV Cache的速度。這直接減少了對昂貴HBM的依賴。
誰是SSD和NAND快閃記憶體的大玩家?DeepSeek每壓縮一分KV Cache,就在為NAND和SSD創造一個龐大的新市場。
第二層:LPDDR記憶體。SGLang團隊發表的研究表明,LPDDR完全可以作為「權重暫存區」——模型權重先放在LPDDR裡,需要時再流式傳輸到HBM中,大幅緩解HBM的容量壓力。
DeepSeek的MoE架構天然適配這個方案:專家數量多、權重可以4bit量化,流式載入非常高效。
誰在做LPDDR?國產速度只落後0.5代,密度落後1代,追趕的腳步已經很近。
第三層:GPU/ASIC的減壓。 Engram模組用LPDDR中的雜湊查表替代Transformer的前向傳播計算,本質上是用每位元成本極低的「記憶體讀取」替代每位元成本極高的「GPU運算」。
這對中國AI晶片意義重大——由於EUV光刻機受限,國產GPU在原始FLOPs上落後。但如果你能用更多的便宜記憶體來替代更少的昂貴算力,那這種「換道超車」就變得合理了。
再加上TileLang——DeepSeek投資的跨硬體核心編譯框架,可以讓一套計算程式碼同時跑在多種硬體平台上,相當於繞過了「CUDA護城河」。國產晶片廠商,都有可能因此獲得生態層面的突破。
現在你明白了嗎?DeepSeek做的每一項技術創新,都在指向同一個方向:降低對頂級硬體的依賴,讓中國現有的儲存、晶片、網路生態變得足夠用,甚至好用。
@bookwormengr算了一筆大帳:全球AI相關股票的總市值早已遠超10兆美元。
如果DeepSeek能幫助中國建構一個等量級的AI硬體生態,它自己在這盤棋裡拿到1兆美元的估值,完全合乎邏輯。
不賺快錢的邏輯
回頭看DeepSeek的所有「不做」——不做多模態(V4.1才開始試水圖像和音訊)、不做語音模型、不做視訊模型、API一降再降——就說得通了。
不是「不會賺錢」,而是「暫時不屑於賺這種錢」。
@bookwormengr提出了一個精彩的類比:OpenAI拿到了AMD和Cerebras的股權認購權證,只要達成算力採購里程碑就可以低價買入股票。這本質上是「用承諾換股權」——你幫我造晶片,我給你訂單,我們一起把蛋糕做大。
DeepSeek完全可以複製這個模式。
只不過它面對的不是AMD和Cerebras,而是整條國產AI硬體產業鏈。
梁文鋒是量化基金出身,被稱為「 Jim Simmon的忠實粉絲」。這樣一個人,不可能不懂資本運作的精妙之處。
事實上,融資消息傳出前,他已經在2026年4月完成了一次關鍵的股權調整——通過直接與間接持股控制公司約84.29%的股權,表決權100%。
寧德時代投DeepSeek——它要鎖定未來AI資料中心的儲能訂單。京東、網易入局,各有各的戰略訴求。
國家大基金下場,更是把DeepSeek定位成了國家級AI基礎設施。
這些投資者看到的,不是一個賣API的小生意。他們看到的,是一個可能重塑全球AI硬體格局的戰略支點。
終極使命 大規模強化學習與AGI
但如果你以為DeepSeek的終點是「做中國AI硬體生態的發動機」,那可能還是低估了梁文鋒。
據彭博社報導,梁文鋒在投資者會議上明確表態:DeepSeek的主要目標是推動技術邊界,追求AGI。
硬體生態是手段,AGI才是目的。
邏輯是這樣:當更多硬體選擇變得可用、當算力需求本身被技術創新大幅壓低,DeepSeek就能以更低的成本啟動更大規模的訓練——特別是強化學習(RL)後訓練和遞迴自我改進(RSI)。
大規模RL意味著模型需要生成海量的推理軌跡——兆級token的生成量,計算成本極其恐怖。而100萬上下文的長程任務,要求軌跡本身也足夠長。
如果沒有極致的硬體效率最佳化,這種訓練根本跑不起來。
RSI則更加大膽——讓AI自己設計實驗、執行實驗、分析結果、改進自身。這是一個試錯密度極高的過程,對算力的需求是無底洞。
但如果DeepSeek通過重構硬體生態把算力成本打下來,這條路就變得可行。
從MoE到MLA,從DSA到CSA,從Engram到TileLang,從KV Cache壓縮到LPDDR流式載入——所有這些創新,最終都匯聚到同一個終點:讓AGI的訓練從「燒不起」變成「燒得起」。
梁文鋒與DeepSeek的星辰大海,從來不是海面上的浪花,而是洋流本身。 (新智元)
