最新播客2萬字實錄|黃仁勳:逼DeepSeek與華為深度繫結,這對美國太可怕了

輝達CEO黃仁勳最近接受了美國知名科技播客主持人德瓦克什·帕特爾(Dwarkesh Patel)的專訪,全面回應了關於公司護城河、GoogleTPU競爭、對華晶片出口等關鍵議題。

他強調輝達的護城河已延伸至供應鏈深處,通過上千億美元的採購承諾與台積電及儲存供應商建立了深度繫結。

對於TPU競爭,黃仁勳指出Anthropic只是ASIC增長的獨特個例而非趨勢。輝達的加速計算覆蓋了分子動力學、資料處理、流體力學等遠超越AI的廣闊市場,且CUDA的高可程式設計性使其能每年實現10到50倍的性能飛躍。

他同時解釋了為何輝達不親自成為超大規模雲服務商。儘管現金流充沛,輝達仍恪守做必須做的事且儘可能少做的原則,選擇通過投資CoreWeave、OpenAI、Anthropic等支援生態系統,而非親自下場與客戶爭利。他同時承認未能更早大規模投資Anthropic是自己的失誤。此外他強調即使AI革命從未發生,輝達仍會憑藉加速計算在物理、化學、資料處理等領域成為一家非常大的公司。

關於對華出口,他批評極端的出口管制政策十分幼稚。黃仁勳指出AI算力是晶片與能源的結合,儘管受到EUV光刻機的限制,中國仍擁有龐大的7nm晶片製造能力。考慮到當前主流大模型主要還是在Hopper這一代架構上訓練,中國完全可以通過充沛的電力能源和擴大晶片叢集規模,來彌補單顆晶片的性能差距。

不僅如此,中國龐大的AI研究團隊正通過更高效的電腦科學來提升模型性能。黃仁勳以DeepSeek為例警告稱這絕非無關緊要的進步。如果這類優秀的開源模型被迫專門針對華為等本土硬體進行深度最佳化且運行效果最佳,客觀上將直接削弱美國技術堆疊的全球優勢。他認為主動放棄全球第二大市場將迫使中國建立獨立於美國的底層計算架構。隨著這些基於開源標準的技術逐步向全球南方輸出,美國極有可能在長期的AI生態標準競爭中陷入被動。

以下為黃仁勳專訪全文:

01 控制供應鏈是輝達最大護城河?

帕特爾:很多軟體公司估值在跌,因為大家覺得AI會把軟體變成大宗商品。有種看法是輝達把設計檔案發給台積電,台積電造邏輯晶片和開關,再用SK海力士、美光、三星的HBM封裝,然後送到台灣地區的ODM那裡組裝成機架。本質上輝達做的是軟體,硬體是別人造的。如果軟體被商品化,輝達是否也會被商品化?

黃仁勳:最終總得有人把電子轉化成Token。這個轉化過程很難被完全商品化。讓一個Token比另一個更有價值就像讓一個分子比另一個分子更有價值一樣,需要大量的技術、工程、科學和發明。這些工作遠未被完全理解也遠未結束。我不認為這種被商品化的情況會發生。

但我們會讓這個過程變得更高效。你問這個問題的方式其實就是我對公司的思考模型,輸入是電子且輸出是Token,中間是輝達。我們的原則是做必要的事但儘量少做。所謂儘量少做就是我自己不需要做的就找夥伴合作,讓它成為我生態系統的一部分。

今天的輝達可能是擁有最大合作夥伴生態系統的公司,包括上游下游供應鏈、所有電腦公司、應用開發者、模型廠商。AI就像一個五層蛋糕,我們在每一層都有自己的生態。我們儘量少做但我們必須做的那部分極其困難,我不認為那部分會被商品化。

另外我也不覺得企業軟體公司會被商品化。現在大多數軟體公司是工具廠商,比如Excel、PowerPoint、Cadence、Synopsys。我的看法和很多人相反,AI智能體的數量會指數級增長且工具使用者的數量也會指數級增長。這些工具的實例數量很可能會暴增。

比如Synopsys的設計編譯器會有大量智能體來用它做佈局、設計規則檢查。今天限制我們的是工程師數量,明天每個工程師身後都會有一群智能體。我們能用前所未有的方式探索設計空間,用的還是今天的工具。工具的高頻使用會讓軟體公司飛速發展。現在之所以還沒發生是因為智能體還不夠會用工具。要麼這些軟體公司自己造智能體,要麼智能體會變得足夠好去熟練使用這些工具,我覺得兩者都會發生。

帕特爾:我看你最新的檔案裡對代工廠、記憶體、封裝有近1000億美元的採購承諾。半導體研究機構SemiAnalysis認為這個數字會達到2500億美元。一種解讀是輝達的護城河在於鎖定了未來多年的稀缺元件。別人或許有加速器但拿不到記憶體和邏輯晶片。這是否是你們未來幾年的主要護城河?

黃仁勳:這是我們能做到而別人很難做到的事情之一。我們向上游做了巨大承諾,有些是顯性的就是你提到的那些。有些是隱性的,比如上游很多投資是我跟那些CEO說我來告訴你這個行業會有多大、為什麼會有這麼大,我推理給你看並讓你看到我所看到的,然後他們才投的。

他們為什麼願意為我投資而不是為別人?因為他們知道我有能力買下他們的供應並通過我的下游賣出去。輝達的下游需求和下游供應鏈太龐大了,所以他們願意在上游投資。

你看GTC大會,大家驚嘆於它的規模和人氣。那是整個AI社區聚在一起,因為他們需要互相交流與被看見。我讓他們聚在一起,讓下游看到上游且上游看到下游,所有人看到AI的進步。他們還能見到所有AI原生代、所有初創公司。這樣他們就能親眼驗證我告訴他們的事情。我花大量時間,直接或間接地讓供應鏈、合作夥伴、生態系統理解面前的機會。

有人說我的主題演講像是在上課且有點折磨人。其實那就是我的用意。我得讓整個供應鏈、上下游、生態系統理解即將發生什麼、為什麼發生、何時發生、規模多大,並且能像我一樣系統性地思考。

關於護城河我們其實是在為未來提前佈局。如果我們未來幾年真的成長到兆美元規模,到那時自然有能力搭建與之匹配的供應鏈。但前提是沒有我們今天的業務體量和影響力也沒有我們業務的高速流轉,就像現金流一樣供應鏈也有自己的流轉和周轉速度。如果業務周轉慢沒有人會願意為一個空架子搭建供應鏈。我們今天能維持這樣的規模,根本原因在於下游需求極其旺盛。當他們親眼看到、聽到、意識到這一切正在真實發生,才讓我們得以在現有規模下做成現在這些事。

帕特爾:我想具體瞭解一下上游能否跟得上。你們連續多年收入翻倍,每年向世界提供的算力增長超過兩倍。

黃仁勳:在這個規模上還能翻倍確實很驚人。

帕特爾:但你看邏輯晶片。你們是台積電N3節點的最大客戶也是N2節點的最大客戶之一。SemiAnalysis發現今年AI會佔N3產能的60%,明年到86%。如果你已經佔了大頭怎麼翻倍?年復一年地翻倍?我們是否已經進入一個階段,即AI算力增速必須因為上游限制而放緩?你看到解決辦法了嗎?歸根到底我們怎麼才能年復一年地把晶圓廠產能也翻一倍?

黃仁勳:在任何一個時間點,瞬時需求都可能大於全球上下游的總供應。甚至可能被水管工數量限制,這確實發生過。

帕特爾:水管工應該被邀請參加明年的GTC。

黃仁勳:好主意。但這其實是個好現象。你希望一個行業的瞬時需求大於總供應,反過來就不太好了。如果某個元件缺口太大,整個行業會蜂擁去解決。你看現在已經沒太多人討論CoWoS了。因為過去兩年我們拚命解決這個問題現在情況已經不錯了。台積電現在知道CoWoS的供應必須跟得上邏輯和記憶體的需求。他們正在以和擴展邏輯同樣的速度擴展CoWoS和未來封裝技術。這非常好,因為CoWoS和HBM記憶體以前是比較小眾的,現在它們成了主流計算技術。

我們現在能影響更廣泛的供應鏈了。AI革命剛開始時我說的這些話五年前就說過了。有人相信並投資了,比如美光CEO桑傑·梅赫羅特拉(Sanjay Mehrotra)及其團隊。我清楚記得那次會議,我精準地說明了會發生什麼、為什麼發生以及今天的狀況。他們真的加倍投入了。我們在LPDDR和HBM記憶體上合作,他們大力投資結果取得了巨大的成功。有些人來得晚一些但現在都來了。

每個瓶頸都會得到大量關注。我們現在提前幾年就開始預判瓶頸。比如過去幾年我們在Lumentum、Coherent和矽光生態系統上的投資,重塑了供應鏈。我們圍繞台積電建立了整個供應鏈並和他們合作開發矽光整合平台COUPE,發明了很多技術並把專利授權給供應鏈保持開放。

我們通過發明新技術、新流程、新測試裝置比如雙面探測、投資公司幫他們擴產來增強供應鏈。我們在努力塑造生態系統,讓供應鏈能夠支撐這個規模。

帕特爾:有些瓶頸好像比其他瓶頸容易解決,比如CoWoS擴產。

黃仁勳:我們負責克服最難的那個。

帕特爾:那個?

黃仁勳:水管工和電工。這是我擔心那些末日論者的地方。他們說工作要消失、崗位要完蛋。如果我們阻止人們成為軟體工程師,我們就會耗盡軟體工程師。十年前就有同樣的預言。有些末日論者說無論如何別當放射科醫生,你現在還能在網上看到那些視訊說放射科會是第一個消失的職業,世界再也不需要放射科醫生了。猜猜我們現在缺什麼?放射科醫生。

帕特爾:有些東西可以規模化有些則不行,你每年怎麼造出兩倍的邏輯晶片?最終記憶體和邏輯都受限於EUV光刻機。你怎麼年復一年地拿到兩倍的EUV光刻機?

黃仁勳:這些產能都是可以快速規模化的,兩三年內就能做到。你只需要向供應鏈發出一個需求訊號。能造一個就能造十個,能造十個就能造一百萬個。這些東西複製起來並不難。

帕特爾:你會在供應鏈裡走多遠?會直接去找ASML說三年後輝達要做到年收入兩兆美元,我們需要多得多的EUV光刻機嗎?

黃仁勳:有些要直接說,有些間接說。如果能說服台積電,ASML也會被說服。我們要找到關鍵的瓶頸點。但如果台積電被說服了,幾年內你就會有足夠多的EUV。

我的觀點是沒有任何瓶頸會持續超過兩三年。與此同時我們還在把計算效率提高10倍、20倍,Hopper到Blackwell是30到50倍。因為CUDA很靈活我們在不斷髮明新演算法、新技術,在增加容量的同時提高效率。這些事情都不讓我擔心。讓我擔心的是我們下游的東西。能源政策阻止能源擴展,而沒有能源你建不了新產業。沒有能源你沒法搞一個新的製造業。

我們要讓美國再工業化。我們要把晶片製造、電腦製造、封裝帶回來。我們要造電動汽車、機器人。我們要造AI工廠。沒有能源這些都建不起來,而能源需要很長時間。晶片產能是兩三年能解決的問題。CoWoS產能也是兩三年能解決的問題。

02 TPU會打破輝達對AI算力的控制嗎?

帕特爾:世界上排名前三的模型裡,有兩個即Claude和Gemini都是在GoogleTPU上訓練的。這對輝達意味著什麼?

黃仁勳:我們做的東西很不一樣。輝達做的是加速計算,不只是一個張量處理單元。加速計算可以用在很多地方,涵蓋分子動力學、量子色動力學、資料處理、結構化資料、非結構化資料、流體動力學、粒子物理。除此之外也做AI。

加速計算比這廣泛得多。雖然AI是當下的話題且顯然很重要和影響很大,但計算比這寬泛得多。輝達重塑了計算的方式,從通用計算轉向加速計算。我們的市場覆蓋範圍比任何TPU或ASIC都要大得多,我們是唯一一家能加速各種應用的公司。我們有巨大的生態系統,各種框架和演算法都能在輝達上跑。

因為我們的電腦設計成讓別人可以操作,所以任何營運商都能買我們的系統。而大部分自建系統你得自己當營運商,因為它們的靈活性不夠導致別人操作不了。因為誰都能搭建並操作我們的系統,所以我們存在於每一個雲裡,包括Google、亞馬遜、Azure以及甲骨文的雲平台。

如果你想租給別人用,那你最好有來自很多行業的龐大客戶群做承購方。如果你想自己用,我們當然也能幫你自己營運,就像我們在xAI幫馬斯克那樣。而且我們能讓任何公司、任何行業的營運商都具備能力,你可以給禮來公司建一台用於科學研究和藥物發現的超級電腦,我們可以幫他們營運,用於整個藥物發現和生物科學領域。

有一大堆應用是TPU做不了的。輝達的CUDA也是一個很棒的張量處理單元,但它還能處理資料處理的每一個環節、計算、AI等等。我們的市場機會大得多,覆蓋範圍廣得多。因為我們支援現在世界上每一個應用,你可以在任何地方建輝達系統並且知道一定會有客戶。這是一個很不一樣的局面。

帕特爾:你們的收入很驚人但不是來自製藥也不是來自量子計算,而是主要來自AI。因為AI這個前所未有的技術正在以史無前例的速度增長。那問題就來了,什麼才是對AI本身最有利的?TPU本質上是一個巨大的脈動陣列,特別擅長做矩陣乘法。GPU則更靈活且適合那些有很多分支判斷或者記憶體訪問不規則的任務。但問題在於AI到底在幹什麼?說白了AI就是一遍又一遍地做那些非常可預測的矩陣乘法。既然如此你為什麼還要在晶片上留出面積給線程束調度器或線程與記憶體體之間的切換這類通用功能呢?這些面積本來可以全部用來做矩陣乘法。而TPU恰恰就是專門針對當下正在爆發的那部分計算需求設計的。你覺得呢?

黃仁勳:矩陣乘法是AI的重要部分但不是全部。如果你想出一種新的注意力機制、換一種分解方式、或者發明一個全新的架構即混合狀態空間模型(SSM),你需要一個普遍可程式設計的架構。如果你想做一個融合了擴散模型和自回歸的模型,你需要的也是一個普遍可程式設計的架構。我們能跑你能想到的任何東西。這就是優勢。因為它是可程式設計的,所以發明新演算法要容易得多。

發明新演算法的能力才是AI進步這麼快的原因。TPU和其他東西一樣都受摩爾定律影響,每年大概進步25%。要每年實現10倍或100倍的飛躍,唯一的方法是每一年都從根本上改變演算法和計算方式。

這就是輝達的根本優勢。Blackwell比Hopper能效高50倍。我第一次說35倍時沒人信。後來有人寫文章說我留了一手實際上是50倍。單靠摩爾定律做不到,我們靠的是新模型比如專家混合模型(MoE),它們被併行化、分解、分佈在整個計算系統裡。如果沒有CUDA也沒有真正深入去寫新核心的能力,這很難做到。

這是可程式設計架構和輝達極端協同設計能力的結合。我們甚至可以把一些計算解除安裝到網路結構本身比如NVLink,或者網路裡的Spectrum-X。我們可以同時改變處理器、系統、網路結構、庫和演算法。沒有CUDA我根本不知道從那下手。

帕特爾:這引出一個關於輝達客戶的有趣問題。你們60%的收入來自五個超大規模雲廠商。在另一個時代客戶是教授做實驗,他們需要CUDA且用不了別的加速器,他們只需要用CUDA跑PyTorch且一切都最佳化好了。但這些超大規模雲廠商有能力自己寫核心。事實上為了從特定架構裡擠出最後5%的性能,他們必須這麼做。Anthropic和Google主要跑自己的加速器即TPU和Trainium。就連用GPU的OpenAI也有Triton因為他們需要自己的核心。他們不用cuBLAS和NCCL而是有自己的軟體棧也能編譯到其他加速器上。如果你的大部分客戶能且正在做CUDA的替代品,那CUDA在多大程度上還是前沿AI跑在輝達上的關鍵因素?

黃仁勳:CUDA是一個豐富的生態系統。如果你想在任何電腦上做開發,首選CUDA是非常明智的。因為生態系統太豐富了,我們支援每一個框架。如果你想寫自訂核心,我們對Triton的貢獻巨大,Triton的後端有大量輝達技術。

我們很樂意幫助每一個框架變得更好。框架很多比如Triton、vLLM、SGLang。現在又冒出一堆強化學習框架比如verl和NeMo RL。後訓練和強化學習這塊正在爆炸。所以如果你想基於某個架構做開發選CUDA最有意義,因為你知道它的生態很好。

你知道如果出了問題,問題更可能出在你自己的程式碼裡而不是底下那堆積如山的底層系統上。別忘了你面對的是多麼龐大的程式碼規模。當系統不工作時你要問自己是我錯了還是電腦錯了?你當然希望每次都發現是自己錯了,因為只有這樣你才能始終信任電腦。顯然我們自己還有很多bug。但關鍵在於我們的系統已經被無數次檢驗過,你可以放心地在上面建構。這就是我想說的第一點即生態系統的豐富性、可程式設計性和能力。

第二點如果你是個開發者,你最想要的是一個裝機基礎。你希望自己的軟體能跑在很多其他電腦上。你不是只為自己寫軟體而是為你所在的叢集或別人的叢集寫,因為你是框架開發者。輝達的CUDA生態系統最終就是它最大的財富。

我們現在有數億個GPU在外面,每個雲裡都有。從A10、A100、H100、H200到L系列、P系列以及各種尺寸和各種形狀。如果你是個機器人公司,你希望那個CUDA堆疊能直接在機器人內部運行。我們幾乎無處不在。這個裝機基礎意味著一旦你開發了軟體或模型,它在任何地方都能用。這個價值無可估量。

最後我們存在於每一個雲裡,這讓我們真正獨一無二。如果你是個AI公司或開發者,你不確定會和那個雲服務商合作也不知道想把負載跑在那裡。沒關係,我們無處不在包括你自己的機房。生態系統的豐富性、裝機基礎的廣泛性、存在位置的多樣性,這些加在一起讓CUDA價值連城。

帕特爾:有道理。但我想問的是這些優勢對你最大的客戶來說到底有多重要?對很多人來說CUDA可能很有價值。但你收入的大頭其實來自那些有能力自己搭建軟體棧的大客戶。特別是如果未來AI進入一些可以用強化學習進行嚴格驗證的領域,那問題就變成了誰能寫出在大型叢集上跑得最快的矩陣乘法和注意力核心?這是一個非常可驗證的最佳化問題。

那些超大規模雲廠商完全有能力自己寫這些定製核心。當然輝達的性價比可能還是更好所以他們可能依然會選擇輝達。但這樣一來問題就變成了最後是不是只比誰的硬體規格更好以及每美元能買到的算力和頻寬更多?

歷史上輝達靠著CUDA護城河,在AI硬體和軟體上都能保持70%以上的利潤率。但現在的問題是如果你最大的客戶其實有能力繞過這條護城河,你還能維持這麼高的利潤率嗎?

黃仁勳:我們分配給這些AI實驗室的工程師數量是驚人的,跟他們一起工作最佳化他們的軟體棧。原因是沒人比我們更懂我們的架構。這些架構不像CPU那麼通用。CPU有點像凱迪拉克且好開和不飆快車,誰都能開得不錯且有巡航控制,一切都很簡單。而輝達的GPU和加速器更像F1賽車。我能想像每個人都能開到160公里時速,但要推到極限需要相當多的專業知識。我們用大量AI來寫核心。

我很確定在相當長一段時間內我們仍然會被需要。我們的專業知識常常能讓AI實驗室合作夥伴輕鬆再提升2倍性能。最佳化完一個核心或整個軟體棧後,模型速度提升50%、2倍乃至3倍,這很常見。考慮到他們擁有所有Hopper和Blackwell的叢集規模,這是一個巨大的數字。提升一倍直接等於收入翻倍。

輝達的計算堆疊在總擁有成本TCO上是全世界最好的,沒人能比。沒有任何一個平台能向我展示出比我們更好的性能與TCO比。Dylan的InferenceMAX基準測試就擺在那裡,誰都可以用。但TPU不來測且Trainium也不來測。我很鼓勵他們用InferenceMAX來展示自己所謂的超低推理成本。但很難因為沒人願意來。

還有MLPerf,我也很想讓Trainium來展示他們一直宣稱的40%優勢。也很想聽他們展示TPU的成本優勢。但在我看來從第一性原理出發他們說的那些優勢完全說不通。所以我認為我們成功的原因很簡單就是我們的TCO太好了。

第二你說我們60%的客戶是前五大雲廠商,但這些業務大部分是面向外部的。比如AWS中使用輝達的晶片大部分是給外部客戶而不是內部用。Azure裡的客戶顯然也都是外部的,甲骨文的同樣如此。他們青睞我們是因為我們的影響力大,我們能給他們帶來全世界最優秀的客戶且這些客戶都建在輝達上。而這些公司之所以建在輝達上,是因為我們的影響力和多功能性太強了。

所以我認為這個飛輪是裝機基礎、架構的可程式設計性、生態系統的豐富性,再加上世界上有成千上萬家AI公司。如果你是AI初創公司你會選那個架構?你會選最豐富的而我們就是最豐富的,你會選安裝基礎最大的而我們就是最大的,你會選生態最完善的。這就是飛輪。

結合以上幾點來看我們的每美元性能最好且客戶的Token成本最低。我們的每瓦性能世界最高,所以如果一個合作夥伴建了一個1吉瓦的資料中心,這個資料中心最好能產出最大量的收入和Token,這直接等於收入。你希望它產出儘可能多的Token來最大化收入,而我們是世界上每瓦Token數最高的架構。另外如果你的目標是出租基礎設施,我們有世界上最多的客戶。這就是飛輪運轉的原因。

帕特爾:有意思。我想問題歸根結底是實際的市場結構到底是什麼樣?因為即使有其他公司存在,可能有一個世界裡面成千上萬家AI公司每家都佔大致相等的算力份額。但現實情況是即便通過這五大雲廠商,真正在亞馬遜上用算力的其實是Anthropic、OpenAI以及那些大型基礎實驗室。這些大玩家自己有能力也有資源讓不同的加速器跑起來。

如果你說的這些關於性價比和每瓦性能等等都是真的,那為什麼像Anthropic這樣的公司幾天前剛宣佈和博通與Google達成一項涉及多吉瓦的TPU交易,把他們大部分算力放在上面?對Google來說TPU也佔了他們絕大部分算力。所以如果我看這些大型AI公司似乎他們的算力曾經全是輝達現在不是了。我很好奇如果紙面上這些優勢都成立,他們為什麼偏偏選了別的加速器?

黃仁勳:Anthropic只是一個特例並不是什麼大趨勢。你可以想一想如果沒有Anthropic這家公司,TPU那來的增長?百分之百是因為Anthropic。同樣如果沒有Anthropic,Trainium又那來的增長?百分之百也是因為Anthropic。這基本上是公開的秘密了。不是什麼ASIC的機會變得很多而是只有一個Anthropic而已。

帕特爾:但OpenAI和AMD有交易且他們自己在造Titan加速器。

黃仁勳:是的,但我覺得大家都承認他們絕大部分算力還是跑在輝達上。我們仍然會一起做很多工作。我不介意別人用別的東西、嘗試別的東西。如果他們不嘗試怎麼知道我們的有多好?有時候你需要被提醒一下。我們必須不斷贏得我們現在的位置。

總有人誇下海口。你看看有多少ASIC項目被取消了。僅僅因為你要造一個ASIC你還得造出比輝達更好的東西這沒那麼容易。實際上這不合理除非輝達一定有什麼缺陷。但我們的規模和速度擺在這裡,我們是世界上唯一一家每年都推出新品的公司且每年都實現巨大飛躍。

帕特爾:我猜他們的邏輯是它不需要比輝達更好,只要不比70%差太多就行,因為他們付給你70%的利潤率。

黃仁勳:不,別忘了ASIC的利潤率也很高。假設輝達利潤率是70%且ASIC利潤率是65%。你到底省了什麼?

帕特爾:你是說像博通那樣的?

黃仁勳:對。你得付錢給別人。據我所知ASIC利潤率非常高,他們自己也這麼認為且對他們驚人的ASIC利潤率很自豪。

所以你問為什麼。很久以前我們就是沒能力做。當時我沒有深刻意識到做一個像OpenAI、Anthropic這樣的基礎AI實驗室有多難以及他們需要供應商本身的巨額投資。我們當時沒能力投資Anthropic幾十億美元來換取他們用我們的算力。但Google和AWS有能力。他們一開始就投入巨資且作為回報Anthropic用了他們的算力。我們當時就是沒能力。

我的失誤是我沒有深刻意識到他們真的別無選擇,沒有風投會投50到100億美元到一個AI實驗室指望它變成Anthropic,這是我的失誤。但即使我當時理解了我也不認為我們有能力那麼做。但我不會再犯同樣的錯誤了。

我很樂意投資OpenAI也很樂意幫他們擴展,我相信這是必要的。後來當我有能力時Anthropic來找我們,我很樂意成為投資者且很樂意幫他們擴展。我們當時就是做不到。如果我能讓一切重來,如果當時的輝達有現在這麼大我會非常樂意那麼做。

03 輝達為什麼不成為超大規模雲廠商?

帕特爾:多年來輝達一直是AI領域賺錢並賺大錢的公司。現在你在投資,比如據報導你們已向OpenAI投了300億美元並向Anthropic投了100億美元。現在他們的估值漲了且我相信還會繼續漲。所以如果這些年來你一直在給他們提供算力且你看到了它的發展方向,而他們一兩年前的價值只有現在的十分之一甚至一年前,而你又有那麼多現金,那要麼輝達自己成為一個基礎實驗室投入巨資去做,要麼在現在這個估值下更早地做你這些交易。而且你有現金。所以為什麼不更早做呢?

黃仁勳:我們在力所能及的時候盡快做了且一有能力就盡快做了。如果我能我會更早做。在Anthropic需要我們做的時候我們就是沒能力,那時這不在我們的考慮範圍內。

帕特爾:怎麼講?是錢的問題嗎?

黃仁勳:是的即投資規模。我們當時從未在公司外部做過投資,更不用說那麼大數額了。我們沒有意識到我們需要這麼做。我一直以為他們可以像所有公司一樣去風投那裡融資。但他們想做的事風投做不到。OpenAI想做的事風投做不到。我現在認識到了但我當時不知道。

但這就是他們的天才之處,他們聰明就聰明在這裡。他們當時就意識到必須做那樣的事。我很高興他們做到了。即使這導致Anthropic去找了別人,我仍然很高興它發生了。Anthropic的存在對世界是好事且我為此高興。

帕特爾:我想你們仍然在賺很多錢而且每個季度都賺得更多。既然你有這麼多不斷賺來的錢,輝達應該用它做什麼?有一個答案是已經出現了一整套中間商生態系統,把資本支出轉化為這些實驗室的營運支出讓他們可以租算力。因為晶片很貴但它們生命周期裡能賺很多錢,因為AI模型越來越好。它們產生的Token價值在增加但部署成本高。輝達有錢做資本支出。事實上據報導你們正在支援CoreWeave且金額高達63億美元並已經投了20億。輝達為什麼不自己成為一個雲服務商?為什麼不自己成為超大規模雲廠商並自己出租算力?

黃仁勳:這是我們公司的理念且我認為是明智的。我們應該做必要的事但儘量少做。意思是說在我們建構計算平台的工作上如果我們不做,我真心相信沒人會做。如果我們不冒我們冒的那些險,如果我們不按我們的方式做NVLink並不建構整個軟體棧,不按我們的方式建立生態系統並不投入20年CUDA並在大部分時間裡虧損,如果我們不做沒人會做。

如果我們不建立所有CUDA-X庫使它們面向特定領域,十五年前我們開始做特定領域庫,因為我們意識到如果我們不建立這些特定領域庫,無論是光線追蹤、圖像生成還是早期AI工作、這些模型,或者資料處理、結構化資料處理、向量資料處理,如果我們不建立沒人會做。我完全相信這一點。我們為計算光刻做了一個庫叫cuLitho,如果我們不做沒人會做。所以加速計算之所以能有今天的進步是因為我們做了這些。

所以我們應該做那件事且應該全身心投入並全力以赴去做。然而世界上有很多雲,如果我不做總有人會做。所以我們奉行做必要的事但儘量少做的理念,它存在於我們公司的每一天。我做的每一件事都用這個視角來看。

就雲而言如果我們不支援CoreWeave存在,這些新雲、這些AI雲就不會存在。如果我們不幫CoreWeave它們就不會存在。如果我們不支援Nscale他們就不會有今天的成就。如果不支援Nebius他們也不會是今天這樣。現在他們做得非常好。

這是一種商業模式。我們應該做必要的事且儘量少做。所以我們投資於我們的生態系統因為我希望我的生態系統蓬勃發展。我希望這個架構、AI能夠連接儘可能多的行業、儘可能多的國家,讓整個星球都建立在AI之上並建立在美國技術堆疊之上。這個願景正是我們在追求的。

還有一件事,有很多優秀的基礎模型公司且我們儘量投資所有人。這是我們做的另一件事。我們不挑贏家且我們需要支援所有人。這是我們應該做的也是我們的樂趣所在。這對我們的業務至關重要。但我們也不遺餘力地不去挑贏家所以我投了一家就會投所有。

帕特爾:你為什麼特意不挑贏家?

黃仁勳:首先這不是我們的工作。其次輝達剛起步時有60家3D圖形公司而我們是唯一活下來的。如果你從這60家裡猜誰會成功,輝達會排在最不可能成功名單的首位。

這是很久以前的事了。輝達的圖形架構恰恰是錯的且不是有點錯。我們造了一個完全錯的架構,開發者沒法支援它且它永遠不會成功。我們基於良好的第一性原理推理但最終得出了錯誤的解決方案。每個人都會把我們排除在外但我們活下來了。

所以我有足夠的謙遜認識到這一點即不要挑贏家。要麼讓他們自己照顧自己,要麼就照顧所有人。

帕特爾:有一點我沒明白,你說我們不是因為他們是新雲就優先考慮他們想扶持他們,但你也列舉了一堆新雲說沒有輝達它們就不會存在。這兩件事怎麼相容?

黃仁勳:首先他們自己得想存在並且來請求我們幫助。當他們想存在並且有商業計畫、專業知識和熱情時,他們顯然覺得自己有些能力。但如果歸根結底他們需要一些投資來啟動,我們會支援他們。但他們越早啟動飛輪越好。

你的問題是我們想不想做融資業務?答案是不想。有人在做融資業務,我們寧願和他們合作而不是自己當融資方。我們的目標是專注於我們做的事且保持商業模式儘可能簡單並支援我們的生態系統。

當像OpenAI這樣的組織需要300億美元規模的投資因為他們在IPO之前,而我們深信他們會成為一家不可思議的公司,世界需要他們存在且世界希望他們存在,我希望他們存在並且他們順風順水,讓我們支援他們並讓他們擴展。這些投資我們會做因為他們需要我們。但我們不是想做儘可能多的事而是想做儘可能少的事。

帕特爾:這可能是個顯而易見的問題,但我們在GPU短缺的情況下過了好幾年,現在因為模型變好導致短缺還在加劇。

黃仁勳:我們確實缺GPU。

帕特爾:是的。輝達以分配稀缺配額而聞名,不只看誰出價高而是看我們希望確保這些新雲存在,比如給CoreWeave一些,給Crusoe一些,給Lambda一些。這對輝達有什麼好處?首先你同意這種分化市場的描述嗎?

黃仁勳:不同意。你的前提完全錯了。我們對這些事情足夠謹慎且非常謹慎。第一如果你不下採購訂單光說沒用。在收到採購訂單之前我們能做什麼?所以第一件事是我們和每個人努力工作完成預測,因為這些東西要很長時間才能造好且資料中心也要很長時間。我們通過預測等方式來協調供需這是首要任務。

第二我們儘量和儘可能多的人做預測但最終你還是得下訂單。也許無論什麼原因你沒下訂單,我能怎麼辦?在某個時間點先到先得。除此之外如果你的資料中心還沒準備好,或者某些元件還沒準備好讓你啟用資料中心,我們可能會先服務別的客戶。這只是為了最大化我們自己工廠的吞吐量且我們可能會做一些調整。

除此之外優先順序是先到先得。你得下採購訂單。當然有一些故事。比如這一切始於一篇關於拉里·佩奇和馬斯克跟我吃飯時求取GPU的文章,那從未發生。我們確實吃了飯且是很愉快的一頓飯但他們從未求取GPU。他們只是需要下訂單。一旦下了訂單我們會盡力把產能分配給他們這不複雜。

帕特爾:好。所以聽起來有一個佇列,然後根據資料中心是否準備好、何時下採購訂單,你在某個時間拿到貨。但這聽起來仍然不是價高者得。有什麼理由不那樣做?

黃仁勳:我們從不那樣做。

帕特爾:為什麼不是價高者得?

黃仁勳:因為那是不好的商業實踐。你定好價格然後人們決定買不買。我理解晶片行業其他人會在需求高時漲價但我們不那樣做。這從來不是我們的做法。你可以信賴我們。我寧願做個可靠的人並做行業的基石。你不用事後猜測。如果我報了一個價那就是那個價,就這樣。如果需求飆升價格依然穩定。

帕特爾:另一方面這就是你們和台積電關係好的原因吧?

黃仁勳:是的,輝達和他們做生意快30年了。輝達和台積電沒有簽署法律合同但總有一些粗略的公平。有時我對且有時我錯。有時我拿了好deal且有時我拿了差deal。但總體而言這段關係非常好。我可以完全信任他們並且可以完全依賴他們。

你可以信賴輝達的一點是今年的Vera Rubin會不可思議。明年Vera Rubin Ultra會來。後年Feynman會來。再後一年我還沒介紹名字。每一年你都可以信賴我們。你去找世界上任何其他ASIC團隊隨便挑,你能說我可以把全部業務押在你身上且你每年都會為我服務嗎?你能說你的Token成本每年都會下降一個數量級且我可以像相信時鐘一樣相信你嗎?

我剛才對台積電說了類似的話。對歷史上任何其他代工廠你都不可能這麼說。但今天你可以對輝達這麼說。你可以每年都信賴我們。如果你想買10億美元的AI工廠沒問題。想買1億美元沒問題。1000萬美元或者只有一個機架都沒問題。或者只有一個顯示卡沒問題。如果你想下1000億美元的訂單也沒問題。我們是當今世界上唯一一家你可以這麼說的公司。

我也可以對台積電這麼說。我想買一個或者買十億個都沒問題。我們只需要經過規劃流程以及所有成熟的人會做的事。所以我認為輝達能成為世界AI產業的基石,這個地位我們花了幾十年才達到。這是巨大的承諾和巨大的奉獻。我們公司的穩定性與一致性非常重要。

04 是否應該向中國銷售AI晶片?

帕特爾:我想問關於中國的問題。我實際上不知道我是否支援向中國賣晶片但我喜歡對嘉賓唱反調。達里歐·阿莫代伊(Dario Amodei)支援出口管制,我問他為什麼美國和中國不能都在資料中心裡擁有一群天才?但既然你站在另一邊我會反過來問你。

一種思考方式是Anthropic幾天前發佈了Mythos預覽版。這個模型他們甚至沒有公開發佈,因為他們說它有很強的網路攻擊能力且世界還沒準備好,要等他們把那些零日漏洞修補好。但他們說它發現了所有主流作業系統和每個瀏覽器的成千上萬個高危漏洞。它在OpenBSD裡發現了一個漏洞且那個是專門設計來避免零日漏洞的作業系統,這個漏洞存在了27年。

所以如果中國公司、中國實驗室、中國政府能拿到AI晶片,來訓練一個像Claude Mythos這樣有網路攻擊能力的模型並用更多算力跑幾百萬個實例,這是否對美國公司、美國國家安全構成威脅?

黃仁勳:首先Mythos是在相當普通的算力上訓練的且算力規模也相當普通,只不過訓練它的是一家非常優秀的公司。它所用的算力類型和數量在中國其實非常充足。你要知道晶片在中國是存在的。

他們製造了全球60%以上的主流晶片,這個產業對他們來說非常大。他們擁有世界上最厲害的電腦科學家之一。如你所知幾乎所有AI實驗室裡大部分研究人員都是中國人,佔了全球50%的AI研究人員。所以問題來了,既然他們已經擁有這麼多資產如充足的能源與大量的晶片以及全球近半的AI人才,如果你真的擔心他們,那麼創造一個更安全的世界最好的方式是什麼?

去打壓他們把他們變成敵人可能不是最好的答案。他們是競爭對手且我們希望美國贏。但我認為進行對話、進行研究對話可能是最安全的。由於我們目前對中國的態度在這個領域明顯缺失。我們的AI研究人員和他們的AI研究人員交流至關重要。我們雙方都試圖就AI不應該被用來做什麼達成一致,這至關重要。

關於在軟體裡找漏洞,當然這正是AI應該做的。它會在很多軟體裡找到漏洞嗎?當然。有很多漏洞。AI軟體裡也有很多漏洞。這正是AI應該做的,我很高興AI達到了一個水平能幫我們提高這麼多生產力。

有一件事被低估了,就是圍繞網路安全、AI網路安全、AI安全、AI隱私的生態系統非常豐富。有一整個AI初創公司生態系統在試圖為我們創造那個未來,即一個不可思議的AI智能體周圍有成千上萬個AI智能體在保護它並確保它安全。那個未來一定會到來。

認為會有一個AI智能體到處跑而沒人看著這有點瘋狂。我們很清楚這個生態系統需要蓬勃發展。事實證明這個生態系統需要開源且需要開放模型和開放軟體棧,這樣所有AI研究人員與所有厲害的電腦科學家才能去建構同樣強大的AI系統並保證AI的安全。所以我們需要確保的一件事是保持開源生態系統的活力,這不能被忽視。其中很多來自中國且我們不應該扼殺它。

關於中國當然我們希望美國擁有儘可能多的算力。我們受限於能源但有很多人在解決這個問題,我們不能讓能源成為國家的瓶頸。但我們也希望世界上所有的AI開發者都在美國技術堆疊上開發,並把AI的進步尤其是開放原始碼的部分貢獻給美國生態系統。建立兩個生態系統將是極其愚蠢的,一個開放原始碼的且只能跑在外國技術堆疊上,一個封閉的且跑在美國技術堆疊上。我認為這對美國將是可怕的後果。

帕特爾:資訊量很多,我梳理一下。中國有算力但有些估計說因為他們沒有EUV也就是因為晶片製造出口管制,他們實際能生產的Flops只有美國的十分之一。那麼他們最終能訓練出像Mythos這樣的模型嗎?能。但問題在於因為我們有更多的Flops,美國實驗室能先達到這些能力水平因為Anthropic先達到了。

另外就算他們訓練出這樣的模型,大規模部署的能力也很重要。如果你有個網路駭客有一百萬個實例比有一千個危險得多。所以推理算力真的很重要。事實上他們有這麼多優秀的AI研究人員,這恰恰是可怕的地方,因為讓這些工程師研究人員更高效的是什麼?是算力。

如果你和美國任何一個AI實驗室聊他們會說限制他們的是算力。DeepSeek創始人、通義千問領導層都說過。他們說他們受限於算力。那麼問題來了,我們讓美國公司因為有更多算力而先達到Mythos等級的能力並讓我們的社會為此做好準備,這不是更好嗎?而中國因為算力少會更晚達到這個水平?

黃仁勳:我們的目標當然應該始終是第一個到達也始終擁有更多算力。但要讓你描述的那種結果成立,你必須把情況推到極端也就是他們得完全沒有算力。只要他們還有一些算力,問題就變成了到底需要多少才夠?事實上中國擁有的算力是巨大的。你剛才也說了他們是世界第二大計算市場。如果他們真想集中算力做一件事他們完全有能力做到。

帕特爾:但這是真的嗎?有人估計說中芯國際在工藝節點上落後。

黃仁勳:他們擁有的能源是驚人的對吧?AI是個平行計算問題不是嗎?為什麼他們不能因為能源幾乎免費就把4倍、10倍的晶片放在一起?他們有這麼多能源。他們有完全空置且完全通電的資料中心。他們的基礎設施容量巨大。如果他們想他們就把更多晶片聚在一起即使是7奈米的。

他們製造晶片的能力是世界上最大的之一,半導體行業知道他們壟斷了主流晶片。他們有超額產能且產能過剩。所以認為中國將無法獲得AI晶片的想法完全是胡說八道。當然如果你問我如果全世界根本沒有算力美國會不會遙遙領先?但那不是一個真實場景。他們已經擁有大量算力。你擔心的那個閾值他們已經達到並超過了。

所以我認為你誤解了,AI是一個五層蛋糕,最底層就是能源。當你能源充足時它可以彌補晶片的不足。如果你晶片充足它可以彌補能源的不足。例如美國能源稀缺,這就是為什麼輝達必須不斷推進架構並做極端協同設計,以便在晶片運出量少的情況下因為能源太有限而我們的每瓦吞吐量高得離譜。

但是如果你的瓦特數完全充足且幾乎是免費的,你會在乎每瓦性能嗎?你會有很多。你可以用舊晶片來做。7奈米晶片基本上就是Hopper。我必須告訴你今天的模型大部分是在Hopper這一代上訓練的。所以7奈米晶片已經足夠好了。能源豐富是他們的優勢。

帕特爾:但還有他們能否製造足夠多晶片的問題。

黃仁勳:但他們能。證據是什麼?華為剛剛度過了公司歷史上業績最好的一年。

帕特爾:他們出貨了多少晶片?

黃仁勳:大量。數百萬個,比Anthropic擁有的多得多。

帕特爾:問題在於中芯國際能生產多少邏輯晶片以及能生產多少記憶體?

黃仁勳:我告訴你實際情況。他們有大量的邏輯晶片也有大量的HBM2記憶體。

帕特爾:但如你所知訓練和推理的瓶頸往往是頻寬量。所以如果你用的是HBM2,我不記得具體數字,但和你最新的產品比記憶體頻寬可能差了一個數量級,這非常大。

黃仁勳:華為是一家網路公司。

帕特爾:但這不能改變你需要EUV來製造最先進HBM的事實。

黃仁勳:完全不對。你可以把它們聚在一起就像我們用NVL72聚在一起一樣。他們已經展示了矽光子技術,把所有計算連成一個巨大的超級電腦。你的前提完全錯了。

事實是他們的AI發展進展得相當順利。世界上最好的AI研究人員因為他們算力有限,他們也提出極其聰明的演算法。記住我剛才說摩爾定律每年大約進步25%。然而通過優秀的電腦科學我們仍然可以把演算法性能提高10倍。我的意思是優秀的電腦科學才是槓桿。

毫無疑問MoE是一個偉大的發明。所有那些令人難以置信的注意力機制減少了計算量。我們必須承認AI的大部分進步來自演算法進步而不僅僅是原始硬體。如果大部分進步來自演算法、電腦科學和程式設計,那告訴我他們的AI研究大軍不是他們的根本優勢?我們看到了。DeepSeek絕不是一個無關緊要的進展。要是那天像DeepSeek這樣的成果先在華為平台上出現,那對我們國家會是非常糟糕的結果。

帕特爾:為什麼?因為目前像DeepSeek這樣的模型如果是開放原始碼的,可以在任何加速器上跑。為什麼將來會不是這樣?

黃仁勳:假設它針對華為最佳化了且針對他們的架構最佳化了,那就會讓我們的處於劣勢。你描述了一種我認為是好消息的情況。一家公司開發了軟體並開發了一個AI模型且在美國技術堆疊上跑得最好。我認為那是好消息。你把它作為前提說那是壞消息。我來告訴你真正的壞消息即世界上所有的AI模型都是在非美國硬體上開發的並且跑得最好。

帕特爾:我想我只是沒看到證據表明存在巨大的差異會阻止你切換加速器。美國的實驗室正在跨所有雲且跨所有加速器跑他們的模型。

黃仁勳:我就是證據。你拿一個為輝達最佳化的模型,然後試著在別的東西上跑。

帕特爾:但美國的實驗室確實在那麼做。

黃仁勳:而且它們跑得並不更好。輝達的成功就是完美的證據。AI模型是在我們的軟體棧上建立的且在我們的軟體棧上跑得最好,這怎麼就不合邏輯了?

帕特爾:Anthropic的模型在GPU上跑也在Trainium和TPU上跑。

黃仁勳:需要做很多工作才能改過來。但是去全球南方並去中東。開箱即用,如果所有AI模型都在別人的技術堆疊上跑得最好,那你現在就是在提出一個荒謬的主張說這對美國是好事。

帕特爾:但我不理解這個論點。假設中國公司先推出了下一個Mythos。他們先在美國軟體裡發現所有安全漏洞,但他們可以在輝達硬體上運行然後擴展到全球南方。這怎麼會是好事?

黃仁勳:那不好。所以我們別讓那發生。

帕特爾:你為什麼認為這是完全可以替代的,如果你不給他們運算力,它就會被華為完全取代?他們是落後的對吧?他們的晶片比你差。

黃仁勳:現在有證據即他們的晶片產業巨大。

帕特爾:你可以直接比較一下H200和華為910C的Flops、頻寬或記憶體。華為那款大概只有H200的二分之一到三分之一。

黃仁勳:他們用更多的數量來彌補。

帕特爾:看來你的論點是他們有所有這些現成的能源對吧?他們需要用晶片來填充。

黃仁勳:而且他們擅長製造。

帕特爾:我相信最終他們也許能在製造上超過所有人。但眼下這幾年很關鍵。

黃仁勳:你說的關鍵幾年具體是那些年?

帕特爾:就是接下來的幾年。我們會擁有能發動各種網路攻擊的模型。

黃仁勳:在那種情況下如果接下來的幾年是關鍵,那麼我們必須確保世界上所有的AI模型都是在美國技術堆疊上建構的。

帕特爾:如果它們是在美國技術堆疊上建構的,那又怎麼防止它們如果它們擁有更先進的能力去發動等同於Mythos的網路攻擊呢?

黃仁勳:無論如何都沒有保證。

帕特爾:但如果你提早擁有它,我們可以為它做準備。

黃仁勳:聽著你為什麼要讓AI產業的一層失去整個市場以便你能讓另一層受益?有五層且每一層都必須成功。最需要成功的那一層是AI應用。你為什麼如此執著於那個AI模型和那一家公司?為了什麼?

帕特爾:因為這些模型實現了這些令人難以置信的攻擊能力而且你需要算力來運行它們。

黃仁勳:能源、晶片和AI研究人員生態系統使它成為可能。

帕特爾:好我們退一步說。中國得自己建出足夠的7奈米產能。別忘了他們現在還卡在7奈米,而你們會往3奈米、2奈米、1.6奈米走比如Feynman那一代。到時候你在用1.6奈米他們還在7奈米。他們只能靠數量來彌補單顆晶片的性能差距。而他們能源充足。你賣給他們越多晶片他們手裡的總算力就越多。

黃仁勳:聽著我只是覺得你的說法太絕對了。美國理應領先。美國的算力規模比世界上任何其他地方都高出100倍。美國理應領先。好吧美國現在就領先。輝達打造的是最先進的技術。我們確保美國實驗室最先知道這些技術並最先有機會購買。如果他們錢不夠我們甚至會投資他們。美國理應領先。我們想盡一切辦法確保美國領先。第一點你同意嗎?我們確實正在這麼做。

帕特爾:但如果他們的瓶頸是算力,把晶片運到中國怎麼能讓美國保持領先?

黃仁勳:不。我們有Vera Rubin給美國。Vera Rubin是給美國的。現在我算不算美國的一部分?你把我算作美國的一部分嗎?

帕特爾:算。

黃仁勳:那輝達呢?你把輝達算作一家美國公司對吧?第一為什麼我們不能拿出一種更平衡的監管方式讓輝達能在全球取勝,而不是把全球市場拱手讓掉?為什麼要讓美國把世界讓出去?

晶片產業是美國生態系統的一部分,是美國技術領導力的一部分,是AI生態系統的一部分也是AI領導力的一部分。為什麼你的政策和你的理念會導向讓美國放棄全球市場中如此巨大的一塊?

帕特爾:阿莫代伊曾引用過一句話,他說這就像波音吹噓我們向敵對國家出售核彈但導彈外殼是波音製造的。這在某種程度上支援了美國技術堆疊。從根本上說你在給敵國這種能力。

黃仁勳:把AI和你剛才提到的那些東西相提並論是荒唐的。

帕特爾:但AI類似於濃縮鈾對吧?它可以有積極用途也可以有消極用途。我們仍然不想把濃縮鈾送到其他國家。

黃仁勳:這是一個糟糕的類比且一個不合邏輯的類比。

帕特爾:但是如果這些算力可以運行一個能對美國所有軟體進行零日漏洞利用的模型,那它怎麼就不是一種武器呢?

黃仁勳:首先解決這個問題的方法是與研究人員、與中國、與所有國家進行對話,確保人們不以那種方式使用技術。這是必鬚髮生的對話。

第二點我們還需要確保美國領先,Vera Rubin、Blackwell在美國大量供應並堆積如山。顯然我們的結果會顯示這一點。我們有大量的算力。我們這裡有很棒的AI研究人員。

然而我們也必須認識到AI不僅僅是一個模型。AI是一個五層蛋糕。AI產業在每一層都很重要且我們希望美國在每一層都獲勝包括晶片層。放棄整個市場不會讓美國長期在晶片層、在計算堆疊中贏得技術競賽,這就是事實。

帕特爾:我想關鍵問題是現在向中國賣晶片怎麼能幫我們在長期獲勝?你看特斯拉向中國賣了很久的電動汽車,iPhone也在中國賣得很好。但這些並沒有把中國鎖定在美國的技術生態裡。他們照樣做出了自己的電動汽車且現在在全球佔主導。智慧型手機也是一樣。

黃仁勳:當我們今天開始對話時你承認輝達的地位非常不同。你用了護城河這樣的詞。對我們公司來說最重要的事情是我們生態系統的豐富性,這關乎開發者。50%的AI開發者在中國。美國不應該放棄這一點。

帕特爾:但我們美國有很多輝達開發者,這並不能阻止美國實驗室將來也能夠使用其他加速器。事實上現在他們也在使用其他加速器這很好。我不明白為什麼在中國情況不會是這樣,如果你向他們出售輝達晶片就像Google可以使用TPU和輝達一樣。

黃仁勳:我們得持續創新。你可能也知道我們的份額在增長而不是在縮小。你剛才隱含了一個前提即就算我們在中國市場競爭也遲早會輸掉。我不是那種一醒來就覺得自己會輸的人。這種輸家心態和輸家前提對我來說毫無意義。

我們不是在造汽車。汽車今天買這個品牌明天換另一個很容易。計算不是這樣。x86能活到今天是有原因的且ARM那麼有粘性也是有原因的。這些生態系統很難替代。換掉它們需要花大量時間和精力且大多數人根本不願意這麼做。所以我們的任務就是繼續培育這個生態系統並不斷推進技術,這樣我們才能在市場上競爭。

你基於遲早會輸這個前提就說我們應該放棄一個市場。我無法認同這種邏輯。這沒有道理。我不認為美國是輸家。我們這個行業不是輸家。

關鍵是你走向了極端。你的論點從極端開始認為如果我們在關鍵時刻給他們任何算力我們就會失去一切這很幼稚。

帕特爾:讓我為自己闡述一下我的論點。我的想法不是說存在某個關鍵的計算閾值而是任何邊際算力都是有幫助的。所以如果你有更多的算力你可以訓練一個更好的模型。

黃仁勳:我只想讓你承認對美國技術產業的任何邊際銷售都是有益的。

帕特爾:如果跑在這些晶片上的AI模型具備網路攻擊能力,或者這些晶片被用來訓練這類模型並運行更多攻擊實例,那它雖然不是核武器但確實啟用了一種武器。

黃仁勳:按你這個邏輯你不如把它用到微處理器和DRAM上。你甚至可以用到電上。

帕特爾:但事實上我們確實對製造最先進DRAM的相關技術實施了出口管制。我們對中國製造晶片的各種東西都有各種出口管制。

黃仁勳:我們向中國銷售大量的DRAM和CPU且我認為這是正確的。

帕特爾:我想這回到了根本問題即AI是否不同?如果你擁有那種能在軟體中發現零日漏洞的技術,我們是否希望最大限度地減少中國首先達到並廣泛部署它的能力?

黃仁勳:我們希望美國領先且我們可以控制這一點。

帕特爾:如果晶片已經在那裡且他們正用它們來訓練那個模型我們如何控制?

黃仁勳:我們有大量的算力。我們有大量的AI研究人員。我們在儘可能快地競賽。

帕特爾:再說一次我們擁有的核武器比任何人都多但我們不想把濃縮鈾送到任何地方。

黃仁勳:我們不是濃縮鈾且它是一個晶片而且是一個他們可以自己製造的晶片。

帕特爾:但他們從你這裡購買是有原因的。我們有中國公司創始人的引言說他們受限於算力。

黃仁勳:因為我們的晶片更好。總的來說我們的晶片更好。這是毫無疑問的。如果沒有我們的晶片你能承認華為經歷了創紀錄的一年嗎?你能承認一大批晶片公司已經上市了嗎?你能承認嗎?

帕特爾:能。

黃仁勳:你能否也承認我們曾經在那個市場擁有非常大的份額而我們現在不再擁有大份額?我們也可以承認中國約佔世界技術產業的40%。為美國技術產業放棄這個市場對我們的國家是一種傷害。對我們的國家安全是一種傷害且對我們的技術領先地位是一種傷害,這一切都為了一個公司的利益。這對我來說毫無意義。

帕特爾:我想我有點困惑,感覺你在說兩種不同的陳述。一是如果我們被允許競爭我們將贏得與華為的競爭因為我們的晶片會好得多。二是沒有我們他們也會做完全相同的事情。這兩件事怎麼能同時進行呢?

黃仁勳:這顯然是真的。在沒有更好選擇的情況下你會接受唯一的選擇。這怎麼不合邏輯了?這太合邏輯了。

帕特爾:他們想要輝達晶片是因為它們更好?

黃仁勳:是的。

帕特爾:晶片更好意味著更多的算力且更多的算力意味著你可以訓練更好的模型。

黃仁勳:我們的晶片更好不只是算力更高,還因為它更容易程式設計且我們有更好的生態系統。而且我們向中國賣晶片美國自己也在受益。我們維持了美國的技術領先地位且開發者繼續在美國技術堆疊上工作。當這些AI模型擴散到全球時美國技術堆疊仍然是那個最適合運行它們的平台。這樣我們就能持續推進和擴散美國技術。我認為這是好事也是美國技術領先地位中非常重要的一環。

現在你所倡導的政策導致美國電信行業基本上被政策排擠出世界,以至於我們不再控制自己的電信。我不認為那是明智的。這有點狹隘並且導致了我在向你描述的、你似乎很難理解的意外後果。

帕特爾:現在問題很清楚就是好處和成本那個更大。我想讓你承認一個潛在的成本。算力是訓練強大模型的輸入而強大模型確實有很強的攻擊能力比如網路攻擊。美國公司先達到Mythos那種能力水平然後暫緩發佈,給美國公司和美國政府時間修補漏洞並加固軟體這是好事。

但如果中國因為獲得了更多算力而更早做出類似的模型並大規模部署,那會很糟糕。這件事到現在還沒發生一個關鍵原因就是美國公司包括輝達擁有更多的算力。所以我們把晶片賣給中國就是在幫他們縮小這個差距。這是一個成本。先不談好處你承不承認這確實是一個潛在的成本?

黃仁勳:那我也告訴你另一個潛在的成本。如果我們放棄中國市場即世界第二大市場,就等於把AI堆疊中最重要的一層也就是晶片層整個讓了出去。他們會在自己的市場裡發展規模並建立自己的生態系統。未來的AI模型會針對他們的技術堆疊做最佳化而他們的模型又是開放的。隨著AI擴散到全球其他地方他們的標準和技術堆疊反而會變得比我們的更優越。

帕特爾:我想我只是足夠相信輝達的核心工程師和CUDA工程師,認為他們可以最佳化。

黃仁勳:AI不僅僅是核心最佳化你知道的。

帕特爾:當然但你可以做很多事情比如從蒸餾到一個非常適合你晶片的模型。

黃仁勳:我們會盡力的。

帕特爾:你擁有所有的軟體。很難想像即使他們在一段時間內有一個稍微更好的開源模型,會對中國生態系統產生長期鎖定。

黃仁勳:中國現在是全球開放原始碼軟體最大的貢獻者也是開放模型最大的貢獻者。而今天這些開源生態是建立在美國技術堆疊、建立在輝達之上的。

AI技術堆疊的五層都很重要且美國應該每一層都贏。當然最重要的是最上面的應用層,誰能把AI擴散到社會裡用得最多誰就從這場工業革命裡受益最大。但每一層都必須成功。

如果我們把這個國家嚇住讓所有人都覺得AI是核彈且所有人都討厭AI、害怕AI,我不知道這對美國有什麼好處。你這是在害美國。如果我們嚇唬所有人讓他們別去學軟體工程說AI會消滅所有軟體工程崗位,結果我們真的沒了軟體工程師那才是對美國最大的傷害。

如果我們嚇唬所有人讓他們別當放射科醫生,說電腦視覺已經免費了且AI讀片比人強,那我們是混淆了工作和任務。放射科醫生的工作是照護病人而讀片只是其中的一項任務。如果我們連這個都搞錯了且嚇得沒人去讀放射科,我們最後會缺放射科醫生並缺好的醫療服務。

所以我說當你從一個極端前提出發把一切看成要麼零要麼無窮,最後就會用一種不真實的方式嚇唬人。真實世界不是這樣的。

我們希望美國第一嗎?當然。我們需要AI技術堆疊的每一層都領先嗎?當然。

你今天談Mythos因為Mythos確實重要。但幾年後當美國想把我們的技術堆疊、我們的技術推廣到全世界比如到印度、中東、非洲、東南亞,當我們的國家想出口技術且想出口標準的時候,我希望到那時我們倆能再聊一次。到那天我會告訴你你今天設想的這些政策是如何讓美國無緣無故地放棄了世界第二大市場的。

我們不應該主動放棄這個市場。如果競爭不過失去也就失去了但為什麼要主動讓出去?現在沒人主張全有或全無,不是說我們要把所有東西都賣給中國。沒人這麼主張。

我們應該始終把最好的技術、最多的技術優先留在美國,並且讓美國最先擁有。但與此同時我們也應該去全球各地競爭並贏下市場。這兩件事可以同時做到。只是需要一些分寸、一些成熟而不是非黑即白。這個世界不是非黑即白的。

帕特爾:好關鍵在於這一點。他們會針對自己幾年後能造出的最好晶片來最佳化模型。這些模型會被出口到世界各地從而形成標準。由於EUV出口管制正如我們所說你們將邁向1.6奈米。但即使幾年後他們很可能仍然停留在7奈米。

在國內他們可能會說我們有這麼多能源且可以大規模量產所以繼續用7奈米也沒問題。但在出口市場上他們的7奈米晶片要直接跟你們的1.6奈米晶片競爭。到那時候他們的模型必須針對7奈米做極其深度的最佳化,以至於在7奈米上跑他們的模型反而比在你們的1.6奈米上跑效果更好。

黃仁勳:我們能不能先看看事實?Blackwell在光刻技術上比Hopper先進了50倍嗎?差得遠。我反覆強調過摩爾定律已經死了。從Hopper到Blackwell單看電晶體姑且說提升了75%吧而且中間隔了三年。但Blackwell比Hopper快50倍。

我的觀點是架構很重要且電腦科學也很重要。半導體物理學當然重要但電腦科學同樣重要。AI的影響力主要來自整個計算堆疊,這就是為什麼CUDA如此有效且如此受歡迎的原因。它是一個生態系統且一個計算架構並提供了極大的靈活性。你想徹底改變架構且搞出MoE、搞出擴散模型、搞出分解式架構都能做到而且很容易做到。

事實是AI對上層堆疊的依賴程度不亞於下層架構。從這個角度說我們的架構和軟體堆疊是針對我們自己的生態系統最佳化的這本身就是優勢。正如我們剛對話時就談到輝達的生態系統有多豐富。為什麼大家總是首選CUDA來程式設計?因為他們確實喜歡且中國的研究人員也一樣。

但如果我們被迫離開中國這是一個政策錯誤,顯然會適得其反且對美國不利。它會加速他們的晶片產業並迫使他們所有的AI生態系統專注於自己的內部架構。現在糾正還不算太晚但事情已經在發生了。

你將來會看到他們不會停留在7奈米這很明顯。他們擅長製造且會從7奈米繼續往前推進。那5奈米和7奈米之間有10倍的差距嗎?答案是否定的。架構很重要且網路也很重要,這就是輝達收購Mellanox的原因。能源也很重要。所有這些都很重要且事情並不像你說的那麼簡單。

05 輝達為什麼不製造多種不同的晶片架構?

帕特爾:我們之前討論了台積電和記憶體等環節的瓶頸。如果未來我們處在這樣一個局面即你已經佔了N3節點的大部分產能且接下來會佔N2的大部分,你會不會考慮回頭用N7的閒置產能?比如說AI需求太大且領先節點的擴產跟不上,那你就用舊節點來造Hopper或Ampere但加上我們今天知道的數值格式改進和其他最佳化。你覺得2030年之前會發生這種事嗎?

黃仁勳:沒必要。因為每一代架構的提升不光是靠電晶體尺寸。我們在工程、封裝、堆疊、數值格式、系統架構上做了大量工作。

產能不夠的時候再回頭去搞一個舊節點,那需要投入的研發成本沒人負擔得起。我們能負擔的是往前走而不是往回走。當然如果有一天全球產能真的徹底到頭了,問我願不願意回頭用7奈米?我當然願意。

帕特爾:有人跟我討論過一個問題即輝達為什麼不併行做幾個完全不同架構的晶片項目?比如像Cerebras那樣的晶圓級晶片或者像Dojo那樣的大封裝甚至做一個不帶CUDA的。你們有資源也有人才且可以同時做這些。既然AI和晶片架構的方向不確定為什麼要把所有雞蛋放在一個籃子裡?

黃仁勳:我們可以做只是我們沒有發現更好的方向。你說的那些我們都模擬過且結果證明它們不如現在的方案。所以我們不做。我們正在做的就是我們想做的。如果未來的工作負載發生根本性變化我不是指演算法而是指實際的計算任務類型,這取決於市場的需求形態,我們可能會考慮增加其他類型的加速器。

比如最近我們納入了Groq且會把它整合到CUDA生態裡。原因在於Token的價值現在已經很高了且可以對Token實行差異化定價。幾年前Token要麼免費要麼很便宜。現在不同客戶有不同的需求且願意為不同的答案付不同的錢。比如我們的軟體工程師如果能給他們響應更快的Token讓他們效率更高,我願意為此多付錢。

但這個市場是最近才出現的。所以我們決定擴展帕累托前沿並做一個響應更快但吞吐量更低的推理細分市場。以前吞吐量高就是更好,但現在我們認為可能存在一個高ASP(平均售價)Token的市場即使工廠的總吞吐量下降更高的單價也能彌補。這就是我們做這件事的原因。除此之外如果我有更多的錢我還是會投到輝達現有的架構上。

帕特爾:這種高端Token和推理市場細分的想法很有意思。假設深度學習革命沒有發生輝達現在在做什麼?

黃仁勳:加速計算且我們一直在做這個。我們公司的基本判斷是通用計算的擴展能力基本到頭了。

所以我們把GPU和CUDA跟CPU結合起來,把CPU上的某些工作負載解除安裝到GPU上加速。這樣可以把一個應用提速100倍甚至200倍。這些應用可以是工程、科學、物理、資料處理、電腦圖形、圖像生成等等。即使沒有AI,輝達也會是一家非常大的公司。

原因很簡單即通用計算繼續擴展的路基本走完了且出路在於特定領域的加速。我們起步於電腦圖形但還有很多其他領域涵蓋粒子物理、流體、結構化資料處理等等都能從CUDA受益。我們的使命就是把加速計算帶給世界並推進那些通用計算做不了的應用,幫助突破某些科學領域。早期的應用包括分子動力學、能源勘探的地震資料處理、圖像處理等等。

如果沒有AI我會很難過。但正因為我們在計算上取得的進步,我們讓深度學習變得普及了。任何研究人員、科學家、學生都能用一台PC或一張GeForce顯示卡做很厲害的科學。這個基本承諾一點都沒變。

你看GTC大會開頭那部分跟AI一點關係都沒有,包括計算光刻、量子化學、資料處理。這些工作依然非常重要。我知道AI很讓人興奮但還有很多人做著非常重要且跟AI無關的工作。張量不是唯一的計算方式。我們想幫助所有人。

帕特爾:非常感謝。

黃仁勳:不客氣。我很享受與你的對話。

帕特爾:我也是。 (網易科技)