2026年5月,黃仁勳在接受美國國會兩黨合作的“特別競爭研究項目”(Special Competitive Studies Project)採訪時表示:
“我們在中國的業務現在已經完全停滯了In China,we have now dropped to zero”
其實,去年10月份,黃仁勳就表示,“我們在中國的高端AI晶片市場份額已經從95%歸零”時,華爾街還不是太在意。
畢竟,靠著北美科技巨頭的瘋狂掃貨和中東土豪的“主權AI”大單,輝達的管理層預計這一季度收入為780億美元,同比增長約77%。
連黃仁勳自己之前也承認,雖然因為H20被禁一口氣吞下了45億美元的爛帳,但非中國市場的爆發,把這些窟窿全填上了。
既然錢沒少賺,老黃在到處“哭窮”什麼?
他在害怕什麼?
其實,真正的要害不是500億美元。
錢是小事,地盤是大事兒,讓這個矽谷皮衣刀客夜不能寐的,是美國政府正在親手幫輝達砸碎它賴以生存的護城河。
一、荒誕的25%“保護費”
讓我們回到2025年底。
當時,美國智庫發佈報告,信誓旦旦地預測“美國AI晶片性能將在2027年達到中國最強晶片的17倍”。
就是這篇報告,感興趣可以自己去看
言下之意是:封鎖奏效了,中國AI快彈盡糧絕了!
緊接著,美國政府又拋出了一個非常川普的“魔幻交易”:
他們允許輝達、AMD把更高級的H200晶片賣給中國,前提是,每賣一顆,要把25%的收入當成“保護費”上交美國國庫。
美國人打得一手好算盤:咱們只賣H200,一來能卡住最頂尖的Blackwell不賣,二來又能狂薅中國網際網路巨頭的羊毛,三來還能拿這筆稅收去補貼美國自己的科技公司。
妥妥的三贏啊!
如果放在2023年,那怕加價50%,國內的大廠也會為了搶晶片打破頭。但到了2026年,情況變了。
3月份,老黃剛高調宣佈“已收到中國客戶的H200訂單”。
4月份,美國商務部就在聽證會上被打臉:“截至目前,我們尚未向他們出售任何晶片。”
好消息:中國人不買了!
壞消息:中國人不買了!
好嘞,那中國買家為什麼不買了?
有一份不公開的內部戰略指引:由於長期面臨隨時斷供的風險,國內的算力補貼和採購,已經全面且絲滑地轉向了國產替代。
因為中國看透了這個局:
如果在此時為了圖省事,重新撲向輝達H200的懷抱,那麼過去三年多,舉國體制砸下千億資金、好不容易熬過“冷啟動”的國產AI晶片產業鏈(從代工產線到寒武紀、摩爾線程們),將瞬間面臨需求枯竭的滅頂之災。
既然已經被逼上了梁山,中國索性一腳踢翻了輝達的供桌。
二、生態脫鉤
那供桌被踢翻後,事情會如何發展?
在過去十年,輝達真正統治世界的不是矽片,而是CUDA軟體生態。
CUDA它就像是AI時代的Windows系統,讓全球開發者患上了嚴重的“路徑依賴”,只要全中國50%的頂尖AI研究員還在用CUDA寫程式碼,中國AI就永遠是輝達的打工仔。
正常情況下,想打破CUDA霸權,比登天還難。
沒有那家中國大模型公司願意承擔模型訓練崩潰的風險,去適配極其難用、Bug滿天的國產底層軟體。
但美國商務部的禁令,偏偏就幫了發改委一個大忙——因為中國企業徹底“無卡可用”了,生死存亡的壓力上來了,那怕前期效率折損一半,開發者們也被迫咬碎牙齒,向華為的CANN架構、向寒武紀和壁仞的工具鏈上遷移。
短短三年,由於失去美國晶片的“傾銷”,中國本土市場變成了一個練蠱場。
而到了2026年,市值飆升至1.3兆的中國“矽先鋒”們(寒武紀、摩爾線程等)不僅活下來了,而且活得很滋潤;
華為更是宣佈開源CANN生態。
用黃仁勳接受採訪時的話說就是:“當你把一個像中國這麼大的市場拱手讓人,這就叫弄巧成拙largely backfired。”
三、逼出來的奇蹟
那,中國是怎麼熬過這三年的算力饑荒的?
這恐怕是整個AI發展史上最精彩的“逆風翻盤”局。
面對艾斯摩爾EUV光刻機的禁運和高級記憶體(HBM)的封鎖,中國演化出了兩條極具本土特色的突圍路線。
第一條路,叫“窮鬼創新”(資源約束型演算法突圍)。
去年(2025年初)DeepSeek R1的橫空出世,當時矽谷被震懵了,因為DeepSeek靠首創的MLA機制和演算法極限壓縮,把訓練成本打到了OpenAI的幾十分之一。
而今,這顆“火種”如今已經燎原。
到了今年,面對持續收緊的算力封鎖,DeepSeek最新一代的V4模型,已經開始向華為昇騰950PR晶片大規模遷移,並直接針對華為底層的CANN架構進行程式碼重構。
老黃將這一幕極其罕見地形容為“對美國而言最可怕的結果”——因為這意味中國最頂尖的演算法團隊,正在實質性地與美國的硬體徹底解綁。
不僅是華為和DeepSeek,整個中國AI軍團都在進化!
阿里平頭哥、百度崑崙芯在瘋狂迭代自研路線;而以寒武紀(推出對標H100的思元690)、摩爾線程、壁仞、沐曦為代表的“矽先鋒”軍團,在2026年初市值已經爆炒突破1.3兆人民幣。這些企業一邊瘋狂相容舊的CUDA程式碼,一邊搞出了極具本土特色的演算法調優:
算力不夠,就用演算法層面的極度精簡來補;通訊頻寬不足,就用極其複雜的路由機制(MoE)來繞道。
美國智庫CSIS說:美國的封鎖不僅沒有鎖死中國,反而充當了最嚴酷的“自然選擇”。它把中國AI軍團硬生生逼上了“高效低耗、軟硬協同”的另一條科技樹分支,並在此刻枝繁葉茂。
第二條路,叫“重工業算力”(系統級暴力堆疊)。
單卡性能打不過怎麼辦?既然中芯國際的7nm製程受限,華為給出的解法是:大力出奇蹟的系統工程。
比如,2025年推出的CM384叢集,是華為對抗輝達GB200 NVL72的一個終極武器。它在一個16機櫃的Pod中塞進了384顆昇騰910C,通過近7000個400G光模組實現全互聯。
根據權威機構SemiAnalysis的分析,CM384雖然單系統功耗高達559千瓦,是NVL72(145千瓦)的近4倍,但它可以提供約300 PFLOPS的稠密BF16算力(是NVL72的1.7倍),具備49.2 TB的HBM總量(是NVL72的3.6倍)和2.1倍的總記憶體頻寬。
翻譯過來就是——雖然功耗極大、佔地極廣,但在特定任務上的表現,可以硬剛甚至超越輝達的頂級系統。
而且,在中國特殊的國情下是合理的。
我們有充沛且廉價的電力(煤炭與水電),華為非常聰明地利用了中國的“能源稟賦”來彌補“矽工藝的劣勢”。
四、平行世界
回望這三年,華盛頓的政客們確實“成功”了——他們拖慢了中國積累絕對算力總量的速度,為美國超級計算中心的建設買到了時間窗。
SemiAnalysis測算,如果沒有制裁,華為目前的年產能可以達到500萬片以上,而現在被死死壓制在80-100萬片左右。中國AI實驗室在前沿模型(如對標OpenAI下一代)的長上下文訓練穩定性、絕對算力密度上,依然存在客觀差距。
美國砸2859億,中國僅用124億,卻把AI差距壓到2.7%?2026史丹佛423頁AI報告裡的10個資料……
但也要感謝他們:
因為他們用制裁的鐵錘,幫中國砸碎了買辦式的科技幻想,在一定程度上摧毀了美國的“軟實力護城河”:在過去,CUDA生態是輝達最強大的武器。只要中國開發者還在用CUDA,中國的大模型就永遠長在輝達的地基上。但制裁打破了這種商業平衡。
正如黃仁勳所警告的,美國硬生生逼出了一個有別於美國的完整硬體與軟體棧。生態一旦建立並產生使用者粘性,即便未來美國完全取消制裁,中國大廠也絕不會再輕易把核心底座交還給外企。
美國將繼續依託最頂尖的台積電工藝,在單卡算力和前沿大模型上保持領先;
而中國,則沿著“受限晶片+重工業系統互聯+極限演算法最佳化+獨立軟體生態”的路徑,在端側AI、具身智能(機器人)、以及商業化落地上瘋狂滲透。
一旦中國跑通了這套“不依賴美國高階矽片”的全端AI體系,必將向急需AI能力但預算有限的中東、東南亞和拉美等“全球南方”國家傾銷——這才是老黃口中“對美國而言最可怕的結果”。
在這個infinite game裡,算力霸權從來不是永恆的。
這三年,中國AI失去的是曾經觸手可及的輝達旗艦卡;但得到的,卻是一個不再有軟肋、被千錘百煉打磨出真正全端能力的鋼鐵身軀。 (虎嗅APP)
