首發被華為搶了!為了擺脫輝達,DeepSeek V4硬生生推遲了半年

如果頂尖AI模型被最佳化在華為晶片上運行,對美國而言將是“可怕的後果”——這是輝達CEO黃仁勳日前在採訪中說的。沒想到,他的話僅過了9天就一語成讖。


4月24日上午,上百萬AI從業者抱著螢幕刷了一整天的DeepSeek官網。一隻靴子終於落地了。

時隔145天,DeepSeek正式推送V4預覽版本。但讓開發者們“驚愕”的不只是這款模型的各種技術參數和1M長上下文標配,而是一行樸素簡短的灰色小字:“受限於高端算力,目前Pro版的服務吞吐十分有限,預計下半年昇騰950超節點批次上市後,Pro的價格會大幅下調。”

這句話翻譯成大白話就是:延遲了半年也要適配華為晶片,DeepSeek這次大改動,就是一個訊號,國產大模型正在集體斷奶,努力擺脫對輝達的依賴。

1

為什麼遲到半年?算力“斷供”倒逼換芯

DeepSeek V4原計畫在2026年春節前後發佈,但一拖再拖。從2月推到3月,又從3月延期到4月。期間友商們趁機“偷家”:OpenAI月更,Anthropic密集發佈Claude 4系列,而DeepSeek在這段時間裡卻長期沉默。

當大家以為DeepSeek“掉隊”的時候,真正的內幕浮出水面。據知情人士透露,V4延期的核心原因並非模型本身的技術瓶頸,而是一場極其複雜的底層硬體大遷移:從輝達晶片全面轉向華為昇騰等國產晶片。

過去DeepSeek所有模型都基於輝達晶片訓練,但V4要走一條完全不同的國產化道路。工程師們重寫了核心程式碼,完成了從輝達CUDA生態向華為CANN架構的底層遷移。從底層程式碼重寫到全端適配,這種體量的算力遷移本身就是巨大的工程挑戰。

而這也解釋了為什麼DeepSeek一反常態放慢迭代速度。不是做不動,是把大量資源投入了國產晶片適配這場“硬仗”。

2

技術報告裡的“世紀同框”:華為與輝達並列寫進同一本帳

DeepSeek在同步發出的V4技術報告中罕見地將華為昇騰和輝達共同寫進了硬體驗證清單:“我們在輝達GPU和華為昇騰NPU平台上驗證了細粒度EP方案。”這是DeepSeek第一次在正式文件中把華為昇騰和輝達並列。

華為方面則正式宣佈,通過雙方芯模技術緊密協同,實現昇騰超節點全系列產品支援DeepSeek V4系列模型。昇騰950通過融合kernel和多流平行技術大幅提升推理性能,昇騰A3超節點系列產品全面適配。

3

黃仁勳的擔憂成真:輝達當天“急眼”

最有戲劇性的一幕發生在V4發佈當天下午。華為官宣首發後,輝達官方技術部落格火速發文,宣佈DeepSeek V4已在Blackwell平台上完成適配,並曬出GB200 NVL72每使用者推理速度超過150 tokens/秒的實測資料。

這份同日官宣,措辭專業、資料齊全,但搶發節點之急迫,將焦慮暴露無遺。

為什麼?因為就在10天前,黃仁勳剛剛在播客中說過一句話:“如果DeepSeek首先在華為平台上發佈,那對我們而言將是災難性的。”他給出的理由是:如果中國頂尖AI模型被最佳化在華為晶片上跑得更好,輝達多年建構的CUDA生態護城河將不再牢固。

事實上,黃仁勳自己也承認:限制對華出口晶片,短期會延緩中國AI,但長期只會逼迫中國建立自己的生態鏈。而像DeepSeek這樣的開源大模型如果都跑在國產算力上,輝達即便仍是市場第一,也“將不再是唯一”。

4

資本市場的反應:國產晶片類股直線拉升

儘管V4-Pro版本目前僅限純文字,尚未上線多模態能力,且受限於算力吞吐有限,但這絲毫不影響資本市場的狂歡。

4月24日上午,算力晶片類股盤中直線拉升,截至午盤,海光資訊大漲超10%,龍芯中科、中芯國際、通富微電、寒武紀、摩爾線程等龍頭股紛紛大漲。國產晶片類股的這波“直線暴漲”,是資本市場對AI算力自主邏輯的響亮投票。

IDC報告顯示,2025年國產GPU與AI晶片廠商市場份額已攀升至41%,華為出貨量排名第一。按華為計畫,昇騰950將於2026年推出,2027年迭代到960,再到2028年的970,幾乎以“一年一代、算力翻倍”的速度向前衝刺。

隨著DeepSeek V4在昇騰首發、超節點全面適配、寒武紀、海光、沐曦等國產GPU廠商紛紛加入全適配陣營,一個“國產模型+國產算力”的生態閉環正在加速形成。

5

遲到的V4,不只一款新產品,而是一聲號角

在DeepSeek V4發佈稿的末尾,梁文鋒引用了《荀子·非十二子》裡的一句話:“不誘於譽,不恐於誹,率道而行,端然正己。”走出自己認定的路,走通它,不求速勝,但求不敗。

DeepSeek V4因“換芯”遲到了半年。但當它在國產算力上完成Day 0適配、讓華為昇騰和輝達同台驗證的那一刻,它已經不再只是一款新模型。

它是中國AI算力生態的一聲號角:從“沒得選”到“有的選”,這條路,DeepSeek和它的國產夥伴們,硬生生走通了。以後大模型跑在那家晶片上,中國終於可以自己說了算。 (縱我含情)