2026年4月15日,播客主持人Dwarkesh Patel做了一件許多主持人不敢做的事——他在採訪輝達CEO黃仁勳時,一路追問到這家全球最高市值公司的"核心命門"。當然,他自己說他是刻意站在被採訪人的對立方提問題,且以Dario支援晶片出口限制的觀點出發。
這場近兩小時的訪談,在第57分鐘時陷入僵局,我特別看了這部分內容,兩人的相關爭論持續了30分鐘左右,這在很多超大企業CEO的採訪中非常罕見。
雙方的分歧主要在於輝達高端晶片對中國市場的出口限制是否具有合理性。
我的看法:兩人分歧的根源,不在於生意,而在於不同的出發點、心態和競爭邏輯。
一場關於AI終局的假設之爭
Dwarkesh Patel在訪談中,提出了一個清晰的邏輯鏈:AI晶片就像是濃縮鈾——濃縮鈾可以發電,但限制濃縮鈾的流通,就能限制核武器的擴散。因此,限制高端AI晶片出口給中國,就能延緩中國大模型的發展速度;中國縱有強大的工程能力,也難以在算力落後的情況下追上通用人工智慧的"奇點"。
他把AI競賽定義為一場"誰先到達終點"的衝刺——終點是通用人工智慧(AGI)或更遠的超級智能。在這場衝刺中,任何能讓對手減速的策略,都具有戰略合理性。
或者,他把Anthropic封閉式發佈的Mythos模型作為一個例子:如果中國也研發出類似的模型,能快速識別網路漏洞,豈不是可以攻擊美國的網路?
這個假設,讓黃仁勳罕見地情緒激動。
黃仁勳的核心論點,是這個比喻從根本上就是錯誤的。他沒有選擇正面辯論AI是否需要那麼高的算力,而是直接拆解了Dwarkesh背後的邏輯鏈條:算力不是AI的唯一瓶頸,能源、架構、演算法也是。
他的"五層蛋糕"框架,將AI產業從底層到頂層依次定義為:能源→晶片→基礎設施→模型系統→行業應用。在這個框架裡,晶片只是第二層,能源才是第一層。如果中國擁有豐富的能源,那麼算力的差距可以通過其他方式彌補——比如用更多的晶片疊加、用更高效的演算法降低單位算力成本。
更重要的是,黃仁勳認為摩爾定律正在走向終結——晶片性能每年翻倍的時代已經過去了,今天最先進的晶片,其性能優勢不是永恆的護城河,而是有時間窗口的相對優勢。一旦製程逼近物理極限,後來者的追趕難度反而會降低。
基於這兩點,黃仁勳的結論是:限制晶片出口,短期確實會延緩中國AI的發展速度,但長期來看,這只會逼迫中國形成自己的生態鏈——一個內部整合、協同進化的完整體系。這個體系一旦形成,就不再需要依賴輝達,也不再容易被外部力量切斷。
而這,才是黃仁勳說出"災難性"的真正所指。
而Dwarkesh的假設,恰恰是黃仁勳的反面:AI的終局是某種"超級智能",算力是到達終點的核心燃料,任何對算力的限制都能有效延緩對手。這個假設為出口管制的合理性提供了道德基礎——"我們在爭取人類未來的制高點,暫時的封鎖是必要的代價"。
但這個假設本身成立嗎?通用人工智慧真的會以"超級智能"的形式出現,並成為某種決定性力量嗎?這至今仍是一個無法證明,也無法證偽的信念,而非已經被驗證的結論。黃仁勳對"核武器比喻"的憤怒,本質上是對這種未經檢驗的終極假設的拒絕。
即便是Mythos模型,黃仁勳並不認為是在最先進的晶片上訓練出來的,也不認為Mythos模型的優勢有那麼大,掃描網路漏洞是AI模型發展史上必然會出現的一類功能,但還達不到所謂“核武器”的層級。
黃仁勳甚至認為很多政策是建立在極端假設上,而這些極端假設是帶有一種“Loser”心態的,因為非常害怕輸,所以就選擇封閉別人。
從黃仁勳脹紅的臉色上,可以知道他內心已經很激動,並對這些想法有種“恨鐵不成鋼”的感覺。
逐漸的,兩種不同的競爭邏輯就體現出來了,一種是零和遊戲邏輯,一種是共生競爭邏輯。
回到商業:一個無法迴避的身份困境
訪談中還有一條更隱蔽的暗線:黃仁勳不希望把輝達定義為"國家的武器"。
輝達的市值已突破4兆美元,但它始終強調自己是一家商業公司——賣晶片、建生態、服務客戶、創造利潤。但在現實中,它的一舉一動都被華盛頓納入戰略框架:CHIPS Act補貼附帶著"在美國製造"的義務;出口管制政策直接決定了它的中國市場命運;美國政府把它視為AI霸權的基礎設施。
黃仁勳在訪談中說:"美國內部會優先獲得最新晶片,不會影響美國的領先——而服務中國市場,是為了讓輝達的生態持續創新。" 至於如何避免最先進的晶片被用作軍事用途,黃仁勳提出讓兩國的研發人員能保持更頻繁的學術交流,設立機制以保證AI的使用在一定倫理內。
這句話的商業邏輯是清晰的,但政治邏輯更複雜。
當政策制定者把輝達視為"等同於半導體國家競爭力"的存在,他們很難接受輝達在賺取中國市場利潤的同時,扮演"中立的商業角色"。你很難既被列為"國之重器",又保留完全的商業自主權。
這個張力,才是輝達最深層的困境。
理解黃仁勳的真實立場
把整場訪談的邏輯梳理清楚之後,黃仁勳的立場可以概括為以下幾個層次:
第一層:出口管制幫了誰?
短期確實幫了美國半導體裝置商(向中國出售成熟製程裝置),也讓CHIPS Act補貼有了戰略合理性。但對Nvidia本身而言,失去高價值市場是真實的商業損失。更關鍵的是:管制在戰略層面的實際效果,並沒有所謂"鎖死中國",而是"逼迫中國整合成一個更有凝聚力的生態"。
第二層:AI競爭的終局是什麼?
黃仁勳沒有提到AI的終局是某種"超級智能奇點",也不認為晶片性能是決定勝負的唯一變數。他的"五層蛋糕"框架,本質上是說:AI是電力革命、網際網路革命之後的下一代基礎設施,它需要的是能源、晶片、基礎設施、模型和應用的完整生態——在這個生態裡,單一晶片的優勢只是局部變數,不是決定性力量。
第三層:輝達需要什麼?
保持生態的開放性、保持對全球市場的服務能力、保持作為"商業公司"而非"國家工具"的身份——這是輝達最核心的商業利益。
黃仁勳不希望輝達成為那個被犧牲的代價。
黃仁勳所有的表態,都是圍繞這三個核心利益展開的。
為什麼CUDA是輝達真正的護城河
理解黃仁勳的擔憂,首先要理解輝達的護城河到底是什麼。
外界的普遍認知是:輝達的護城河是GPU的硬體性能——晶片算力強、功耗低、生態好。這固然沒錯,但黃仁勳本人在這次訪談中給出了一個更底層的定義:
"輸入是電子,輸出是Token,中間是輝達。"
這句話的意思是:輝達真正的護城河,不是某一個晶片型號的性能指標,而是從電子到Token的整套轉化體系的效率。硬體只是這個體系的最底層,往上是驅動層、編譯層、框架層、工具鏈層和開發者生態層——五層疊加,才是輝達真正的壁壘。
CUDA(Compute Unified Device Architecture)就是這個體系中承上啟下的核心軟體層。它不僅僅是"讓GPU做平行計算的工具",而是一套定義了"如何用算力"的語言和規則體系。
全球數百萬AI開發者,在研究生階段就學習CUDA程式設計;他們的論文程式碼、實習項目、開源貢獻,幾乎全部基於CUDA生態建構。當一個畢業生在CUDA上訓練了第一個模型,他的整個職業路徑都會被鎖定在這個生態上——換框架,意味著重寫程式碼;重寫程式碼,意味著放棄多年的積累。
更深的一層是:AI框架(PyTorch、TensorFlow)和最佳化庫(cuDNN、TensorRT)都深度繫結CUDA。這意味著當研究人員說"這個模型在A100上訓好了",他們實際上是在說"這個模型在CUDA生態裡建構好了"。晶片可以換,底層生態遷移的成本卻極高。
這就是為什麼黃仁勳在訪談中說:"這些生態系統很難替代,換掉它們需要花大量時間和精力,而且大多數人根本不願意換。"
他還提出了一套"AI五層蛋糕"理論自洽自己的邏輯:能源→晶片→基礎設施→模型系統→行業應用。每一層都不是孤立的,而是彼此深度耦合。輝達真正的優勢,是在基礎設施層和模型系統層,同時提供了硬體加速和軟體工具的整合方案——這種全端能力,是單一晶片廠商無法提供的。
中國是如何撕開這道裂縫的
黃仁勳口中"災難"的觸發點,是DeepSeek V4全面轉投華為昇騰晶片。
根據多方報導,DeepSeek V4將首次完全基於華為昇騰950PR(配合中芯國際7nm製程)進行訓練,底層程式碼從輝達CUDA生態重寫為華為自研的CANN框架。如果這一計畫按期落地,DeepSeek V4將成為全球第一個完全脫離輝達生態鏈路的頭部大模型。
這一步的難度,不能被低估。這也是V4為何延後到4月底發佈的原因之一。
從CUDA遷移到CANN,核心工作量相當於重寫整個模型的底層算子庫。DeepSeek團隊在V3時期積累了大量的CUDA最佳化程式碼,這些程式碼背後凝結了團隊對GPU硬體特性的深度理解。遷移到CANN,不僅僅是換一套API呼叫,而是需要工程師重新理解昇騰的架構特性,重新設計每一個計算核心的調度邏輯。
但DeepSeek選擇走這一步,恰恰說明:遷移的代價,在戰略收益面前已經變得可以接受。
撕開CUDA裂縫的力量,來自四個方向。
第一:華為昇騰的性能已經足夠用了。
昇騰910C配合中芯國際7nm工藝,在推理場景下的性能已經可以對標輝達H20。更關鍵的是,昇騰的硬體已經進入大規模量產階段——2026年一季度,昇騰950PR正式發佈並進入商用,國內外多個智算中心開始批次部署。
第二:CANN框架已經成熟到可以承接工業級模型。
CANN(Compute Architecture for Neural Networks)是華為自研的異構計算架構,定位對標CUDA。經過多年迭代,CANN在算子覆蓋度、編譯最佳化能力和偵錯工具上已經相對完善。DeepSeek V4若能成功遷移,說明CANN已經具備了承載頂級大模型的工程能力。
第三:中國AI生態正在形成完整的替代鏈。
晶片層:昇騰、寒武紀思元、燧原、沐曦、百度崑崙芯——五家主要廠商合計已佔據國內市場41%的出貨量(2025年資料);框架層:華為MindSpore、百度PaddlePaddle、阿里MQL;模型層:DeepSeek、通義、文心一言——越來越多的模型開始在國產算力上進行預訓練。
第四:政策壓力加速了遷移意願。
2022年以來,美國商務部將昇騰系列列入實體清單,倒逼中國科技公司必須在國產晶片上實現技術自主。這種"被迫"的生態整合,反而在客觀上加速了中國AI算力生態的內循環。
清華大學魏少軍教授在一次行業會議上曾指出:"當前全球AI發展已被輝達的GPU架構和CUDA生態深度繫結,形成了'模型-架構-生態'三重依賴。打破這種依賴,不是某一家公司的事,而是需要整個產業生態協同遷移。"
這條路的代價極高,但它正在發生。
這場突圍,能走多遠
黃仁勳的擔憂,還提出了一個反直覺的論斷:晶片不是AI的唯一瓶頸,能源才是。如果美國斷供晶片,中國AI發展的天花板將由電力而非算力決定;能源豐富的中國,有能力自己解決電力問題,屆時整個"晶片斷供"的邏輯就會反轉。
這個論斷有它的合理性,但也有盲點。盲點在於:晶片的製程工藝,不僅僅是"買不買得到"的問題,更是"能不能造出來"的問題。中國目前最先進的製程是中芯國際7nm,而輝達最新Blackwell系列已使用定製4nm/3nm工藝。晶片製造工藝的差距,不是兩三年可以彌合的。
專家們的預測,大致可以分為兩派。
一派相對審慎,認為中國AI晶片的"替代",更多是政治壓力下的被迫選擇,而非技術和商業上的自然結果。晶片性能的差距客觀存在,軟體生態的豐富度也遠不如CUDA,短期內很難在輝達傳統優勢的訓練場景實現完全替代。這一派的代表是部分美國半導體行業分析師,他們認為輝達的護城河依然堅實,"災難性後果"是黃仁勳在政策遊說時的誇大之詞。
另一派則更為激進,認為中國AI生態的整合速度,已經超過了西方觀察者的預期。DeepSeek V3已經證明了中國團隊能在極低訓練成本下做出頂級模型;同樣的工程能力一旦遷移到昇騰生態,迭代速度會顯著加快。昇騰950PR的實測性能,已經接近H20;按照摩爾定律,18到24個月內,昇騰與輝達旗艦晶片的性能差距將進一步縮小。
一個更值得關注的技術趨勢是:DeepSeek證明了,算力效率可以彌補晶片性能的差距。 DeepSeek V3用557萬美元完成了與GPT-4比肩的訓練,其核心方法正是極致的算力利用率最佳化。這意味著,即便中國晶片性能只有輝達的70%,通過演算法最佳化,差距可以被大幅壓縮。
一場沒有終點的生態戰爭
回到黃仁勳那句話。
"如果DeepSeek先在華為平台上發佈,那對我們國家(美國)來說將是災難性的。"
這句話的語境,不應該被簡化為"黃仁勳害怕華為"。它背後真實的焦慮是:輝達最害怕的,不是華為做出一款好晶片,而是中國通過政策壓力+市場整合+技術迭代,形成一個能夠自我進化的AI算力生態閉環。
晶片禁運的政策壓力,反而加速了這個閉環的形成——這個邏輯反轉,是黃仁勳"災難"二字的真正所指。
對於中國而言,目前還不意味著勝利。輝達的護城河,並非一紙禁令就能拆除。CUDA生態積累了十五年的開發者心智和使用習慣,不可能在一夜之間遷移;國產晶片在製程工藝、工具鏈成熟度上,與輝達的差距依然顯著;完整的替代生態,需要晶片廠商、模型廠商、雲服務商和終端使用者的協同共進,這是一場以十年為單位的耐力賽。
但趨勢的方向已經確認。
當DeepSeek V4全面適配昇騰的那一刻,那不只是一個模型的遷移,而是一張多米諾骨牌的倒下。第一個吃螃蟹的人已經出現了,跟進者會越來越多。
黃仁勳的"災難",或許不會在一夜之間降臨。但它描述的未來,正在以肉眼可見的速度,逼近現實。
本文核心資訊來源:Dwarkesh Patel播客專訪黃仁勳全文(2026年4月15日),建議大家可以去看原視訊,資訊更豐富。 (首席商業評論)
