DeepSeek與中國算力合力,實現token成本的大幅降低後,又會反向利多AI應用市場,催生更大的市場空間。兩天兩次降價,效率成了DeepSeek最深護城河2026年4月的最後一個周末,中國AI產業被一連串消息徹底點燃,而消息背後的主角只有一個,DeepSeek。4月24日,DeepSeek正式發佈V4系列預覽版,同步開源Pro與Flash兩款模型,均支援百萬token超長上下文。緊接著的25日與26日,DeepSeek連續兩晚出手降價——先是V4-Pro限時2.5折,再是全系API輸入快取命中價格永久降至首發價的十分之一。兩天兩次調價之後,V4-Flash每百萬tokens輸入快取命中價格僅為0.02元,V4-Pro為0.025元,創下全球大模型價格新低。這樣一場精心策劃的閃電戰,背後是DeepSeek長達一年的艱難求索。但如果依舊將目光放在“價格戰”的淺層敘事,就低估了DeepSeek此番出手的深意。V4的降價已經無關於燒錢換市場,其更大的意義是底層架構效率革命帶來的成本變化。正如高盛Ronald Keung團隊在最新研報中所指出的,“V4的核心意義在於以更低成本支援更複雜的智能體應用落地,從而打開AI應用規模化的新空間”。在DeepSeek-V4的技術報告裡,效率是極致的。V4-Pro在100萬token上下文場景下,單token推理所需浮點運算量僅為V3.2的27%,KV快取佔用僅為10%;V4-Flash更為激進——FLOPs降至10%,KV快取壓縮至7%。這意味著什麼?通俗地說,過去跑一條百萬字上下文需要三台機器的算力,現在一台機器就能從容應對,而且記憶體開銷僅是過去的十分之一。效率飛躍背後,有V4在架構層面的三項關鍵創新:混合注意力機制(CSA/HCA)、流形約束超連接(mHC),以及Muon最佳化器。其中最核心的突破在於混合注意力——CSA(壓縮稀疏注意力)沿序列維度壓縮KV快取後執行稀疏注意力計算,每m個token的KV快取被壓縮為一條記錄;HCA(重度壓縮注意力)則施加更激進的壓縮策略,將m'個token的KV快取合併為單條記錄,但仍保留稠密注意力。這套組合拳在幾乎不影響模型性能的前提下,將長上下文場景的計算與儲存成本砍掉了一個數量級。更精妙的設計體現在細節處:對KV條目採用混合儲存格式,旋轉位置編碼維度保持BF16精度,其餘維度使用FP8精度,這一項便將KV快取容量壓縮近半。閃電索引器內部的注意力計算以FP4精度執行,進一步加速長上下文下的注意力運算。技術壓縮效率,效率兌現成本。這才是DeepSeek敢於連續降價的真正底牌。理解了這一邏輯,便能看穿此次降價的產業含義:相比於其他AI大模型降價拚命上桌,這一次DeepSeek直接用技術優勢主動建構了成本壁壘。V4-Flash以0.02元/百萬tokens的價格橫掃市場背後,每一分錢的降價都有底層架構最佳化作為支撐,而不是資本燒錢補貼的邏輯。競爭對手要跟進,首先得在技術上追平這份效率——而這顯然不是一朝一夕之功。從模型等晶片,到晶片靠模型與兩次降價幾乎同步發生的,是國產晶片陣營的集體“起立”。V4發佈當日,華為昇騰、寒武紀、海光資訊、摩爾線程、沐曦股份、崑崙芯、平頭哥真武、天數智芯8家國產AI晶片品牌,以及輝達,均宣佈完成對DeepSeek-V4的適配。尤其值得注意的是,這是大模型產業首次實現“Day 0”等級的全端適配:模型發佈即適配上線,晶片廠商不再需要數月的“追逐式”偵錯周期。這裡有一個細節必須拆解清楚。DeepSeek官方在技術報告中表示,“我們在輝達GPU和華為昇騰NPU兩個平台上驗證了細粒度EP(專家平行)方案,在通用推理任務中實現1.50至1.73倍加速;在延遲敏感場景下最高達到1.96倍”。這是DeepSeek歷史上首次將國產晶片與輝達GPU並列寫入硬體驗證清單,確立對等地位。華為昇騰的反應也十分迅猛。昇騰官方在B站直播中稱,在推理部署層面,昇騰950PR平台針對V4實現了多項深度適配。量化方面,原生的硬體加速精度明確支援MXFP8與MXFP4等低精度資料格式,兼顧模型精度與記憶體佔用最佳化。算子層面,華為官方宣佈昇騰950通過融合kernel與多流平行技術,大幅降低了混合注意力機制的計算和訪存開銷,顯著提升了推理性能。而MoE模組中路由專家與共享專家的計算重疊等深度最佳化,則進一步確保了兆參數模型在國產硬體上的高效平穩運行。圖|昇騰直播間截圖寒武紀則在基於自研NeuWare軟體生態與vLLM框架上,完成了對V4的“Day 0”適配並同步開源自研算子庫。這已是寒武紀連續第二次在DeepSeek新模型發佈首日便推出適配方案,其技術迭代速度同樣不容小覷。更有說服力的訊號來自財務上的持續好轉,國產開源大模型的極速發展,正在把中國算力產業拉入良性發展的通道里。4月26日晚,摩爾線程發佈2026年一季報:一季度營業收入7.38億元,同比增長155.35%;歸母淨利潤2935.92萬元,同比扭虧為盈。這家被稱為“中國輝達”的國產GPU廠商,此前因研發投入高達營收86.68%而備受市場質疑,如今終於交出了一份逆轉的答卷。與此同時,摩爾線程還與某客戶簽訂了金額達6.6億元的誇娥智算叢集銷售合同。寒武紀此前發佈的年度業績快報亦顯示已率先實現盈利,沐曦股份則呈現出虧損持續縮小的態勢。三家國產AI晶片代表企業同步進入業績改善通道,已經是十分有力的回應。國產算力生態臨界點的到來當DeepSeek的技術效率革命與國產晶片的產能釋放在同一時間窗口交匯,一條完整的產業閉環開始浮出水面。中銀國際在4月26日發佈的研報中判斷:“DeepSeek V4的發佈標誌著國產大模型已基本跑通全端國產化,理論上已形成從底層硬體、基礎軟體、平台服務到上層應用、安全體系的完整技術鏈條,國產算力類股或迎來自己的質變臨界點。”反過來看,DeepSeek與國產算力實現合力,在大幅降低token成本後,又會反向利多AI應用市場,催生更大的市場空間。據華泰證券表述,“市場容易將V4理解為‘降本壓低算力、儲存需求’,但更重要的邊際變化在於長上下文成本下降後,複雜Agent、多文件分析、長周期任務、線上學習等場景可用性提升,推理呼叫量與儲存訪問頻次有望擴張。”換句話說,降價不會縮減蛋糕,還會做大蛋糕——越便宜用得越凶,總呼叫量反而會暴增。同樣在4月24日,新版本OpenClaw 發佈,直接接入了最新的DeepSeek V4雙版本,並將V4 Flash設定為了默認大模型。據OpenRouter平台資料,DeepSeek V4 flash今日呼叫量較前一天上漲了62%。值得一提的是,DeepSeek已明確將華為昇騰950超節點量產納入其商業路徑,並預告下半年實現大規模供貨後API定價將迎來顯著下降。這意味著當前的降價可能只是一個預告,真正的主菜還在後面。資本市場已作出熱烈反應。4月27日早盤,A股算力晶片概念延續強勢,CPU方向領漲,海光資訊、摩爾線程等跟漲;港股半導體類股領漲,瀾起科技漲超6%,中芯國際漲近5%。產業鏈上下游——從晶片設計到伺服器整機,從算力租賃到AI應用——都在重新定價這一歷史性的產業變局。這個4月,DeepSeek以一組硬核效率資料為矛、以兩次精準降價為鼓,打出明牌——AI的長上下文時代已經到來,而它的“高速公路”將由國產算力鋪就。對那些剛剛登陸科創板的國產晶片企業而言,這個春天確實比往年都暖。 (鳳凰網科技)