靠閹割版Blackwell晶片救市?輝達醞釀全新中國特供版產品,抵禦華為昇騰猛攻

面對在中國市場份額的快速流失,AI算力霸主輝達也是有點坐不住了。

據TrendForce研究資料顯示,中國AI Server市場預計外購輝達、AMD等晶片比例會從2024年約63%進一步下降至2025年約42%,這一數字跟輝達CEO黃仁勳近期在台北國際電腦展上透露的資訊接近:“四年前,輝達在中國的市場份額高達95%,如今只有50%。”

不少中國大模型廠商開始嘗試“去輝達化”,這促使以華為昇騰為代表的國產AI晶片市場佔有率開始攀升,輝達如果再不想辦法,市佔率跌破50%乃至失去中國AI市場都極有可能。

隨著H20晶片被限後,輝達拿什麼產品在中國AI市場繼續拚殺成為一個焦點。

據路透社最新獨家報導稱,輝達即將為中國推出一款新的AI晶片組,其價格將遠低於最近限售的H20型號,並計畫最早於6月開始量產,消息人士透露,輝達還在為中國開發另一款Blackwell架構晶片,最早將於9月投產,能否挽救市場頹勢在此一舉。

夾縫中“搞錢”的輝達

作為全球數一數二的AI大國,中國AI市場是輝達難以割捨的一塊肥肉。

輝達2025財年財報資料顯示其總營收為1305億美元,來自中國區的營收為171億美元(約合1228億元人民幣),佔比達13%,中國是輝達的第二大銷售額地區:美國佔比47%排第一,中國佔比13%排第二。

據悉,H20禁令迫使輝達註銷了55億美元的庫存以及約150億美元的計畫銷售額,短期來看,來自中國AI市場營收縮水會直接對輝達的業績基本盤造成震盪。

受美國政府晶片出口限制政策影響,2022年開始,輝達A100、H100被禁止出口中國,2023年美國進一步加強AI晶片禁令,A800、H800、L40、L40S等一系列晶片被列入限制名單,2025年4月,美國叫停輝達向中國出售H20晶片,這讓輝達原本絕對的市場優勢徹底陷入被動局面。

此外,中國大模型廠商近幾年在開源領域逐漸處於領跑地位,已成為全球AI生態中的重要一環,如果中國AI模型+AI算力的模式跑通產生廣泛影響力並加速滲透,可能會在全球市場進一步對輝達造成衝擊,短期銷售壓力之外的市場威脅輝達難以視而不見。

消息人士透露,輝達計畫推出的最新款中國特供版GPU將屬於輝達最新一代Blackwell架構AI處理器的一部分,預計定價在6500至8000美元之間,遠低於H20型號1萬至1.2萬美元的售價。

較低的價格預示著其性能規格較弱,製造要求更簡單。據悉,其中一款晶片將基於輝達的RTX Pro 6000D伺服器級圖形處理器開發,並將使用傳統的GDDR7記憶體,而非更先進的高頻寬記憶體(HBM),也不會使用台積電先進的晶片-晶圓-基板封裝(CoWoS)技術。

輝達發言人表示,公司仍在評估其 “有限” 的選項,“在我們確定新產品設計並獲得美國政府批准之前,我們實際上已被排除在中國500億美元的資料中心市場之外。”

輝達CEO黃仁勳上周也表示,在當前美國出口限制下,公司較舊的Hopper 架構(H20所使用的架構)已無法進行進一步修改。

消息人士稱,為了進一步維繫市場局面,輝達還在為中國開發另一款Blackwell架構晶片,最早或將於9月投產。

據悉,美國新規將記憶體頻寬限制在每秒1.7-1.8TB,相比之下,H20的記憶體頻寬可達每秒4TB。

Blackwell架構是輝達最新一代晶片架構,單晶片AI性能比上代Hopper H100提升了4倍,目前有多種配置變體包括GB200、HGX B200和HGX B100等。

據悉,正常情況下該晶片配備192GB HBM3e記憶體,頻寬高達8TB/s,GPU記憶體頻寬是衡量主處理器與儲存晶片之間資料傳輸速度的關鍵指標,這一能力對於需要大量資料處理的AI工作負載尤為重要,如果被閹割到每秒1.7-1.8TB只是工作站級或旗艦遊戲顯示卡的水平,其整體性能如何尚未可知,可能會更偏向於AI推理或邊緣計算場景。

對於輝達來說,打造合規並適合中國市場需求的晶片仍需要一段時間,但市場機會卻不等人。

來自華為的進擊挑戰

在中國本土的AI晶片廠商中,黃仁勳不止一次重點談到來自華為的競爭,表示美國對晶片的出口管制迫使輝達在中國市場失去了主導地位,而電信裝置巨頭華為這樣的本土企業填補了空白。

國際知名半導體研究和諮詢機構SemiAnalysis發佈報告稱,華為基於昇騰910C晶片打造的CloudMatrix 384伺服器系統在多項關鍵指標上的性能超過NVIDIA旗艦系統GB200 NVL72。

CloudMatrix 384由384塊昇騰910C晶片組成,雖然每塊GPU性能僅為輝達Blackwell晶片的三分之一,但有著擁有五倍的晶片數量。完整的CloudMatrix系統現在可以提供300 PFLOP的密集BF16計算能力,幾乎是GB200 NVL72的兩倍,雖然美中不足的是需要4.1倍GB200 NVL72的功率,但相比晶片開發來講,電力能耗短板相對更容易補全一些。

另有消息稱,華為在2025年5月底之前向選定的中國科技公司分發昇騰910D樣品批次進行測試,目標是讓這款晶片的性能達到或超越NVIDIA H100,進而廣泛用於訓練大型語言模型和其他複雜的AI任務。

過去多年,華為一直在低調推進昇騰系列晶片的演進,據DeepSeek團隊的實測資料顯示,昇騰910C的推理性能約為NVIDIA H100的60%,據瞭解,升級版昇騰910D將採用中芯國際 (SMIC) 7nm N+2工藝製造,預計將進一步縮小與輝達主晶片的性能差距。

據傳,昇騰920預計也將於2025年下半年開始推進量產,下一代昇騰920將採用6奈米製程,預計單卡計算能力將超過900 TFLOP,並使用HBM3模組實現4TB/s的記憶體頻寬,將比上一代產品提升約30%至40%的效率。

由於更具性價比優勢,華為昇騰晶片本來在東南亞、中東地區和部分歐洲國家開始有市場突破,但2025年5月,美國商務部宣佈在全球任何地方使用華為昇騰晶片均違反其出口管制規定,這一禁令涵蓋採購、部署、維修等二十余種行為,試圖通過 “長臂管轄” 阻攔華為在全球AI算力市場的進擊。

目前來看,短期內,中國市場仍是華為和輝達AI晶片較量的主戰場。

AI算力生態較量展開

儘管昇騰晶片開始在性能方面嶄露頭角,但生態系統仍是短板,與輝達成熟的CUDA生態相比,昇騰的AI生態還在發展中,需要吸引更多全球開發者參與,以完善軟體適配和應用開發等方面,提升整體生態競爭力。

不過,這對於搞出鴻蒙系統的華為來說可能並不缺乏經驗,需要的是時間和市場磨合。

相比輝達,華為的本土優勢在於能和國產AI模型廠商進行更深層的協同匹配,在gitcode開源平台上,華為近期分享的基於昇騰打造超大規模MoE模型推理部署技術報告吸引了不少關注。

據瞭解,這些技術報告相關的程式碼也會陸續開源,以此推進建構昇騰超大規模MoE模型推理的開源生態,其中涉及昇騰超大規模MoE模型推理負載平衡技術、投機推理技術與低位元量化技術、通算融合最佳化技術、昇騰親和硬體感知創新算子等等。

在日前舉辦的華為KADC2025開發者大會上,華為高管對外表示,截至2025年5月,鯤鵬、昇騰已發展超過665萬開發者,8800多家合作夥伴,其AI算力底座的角色越來越凸顯。

在當下的市場環境變遷和管制條件下,輝達想要收回丟失的中國市場份額,挑戰正在變得越來越大,靠減配的Blackwell晶片能否挽救頹勢充滿懸念。 (頭部科技)