在昨日一個採訪中,Vlogger Dwarkesh Patel向輝達CEO Jensen Huang 詢問了關於 TPU 競爭、輝達如何掌控日益緊張的先進晶片供應鏈、我們是否應該向中國出售 AI 晶片、輝達為什麼不轉型為超大規模資料中心、其投資策略等等問題。以下是我們總結的的三十個重要觀點:1、所有產能問題都可以在兩三年內輕鬆解決2、CPU有點像凱迪拉克,它是一款舒適的巡航車,速度不會太快,每個人都能輕鬆駕馭;它配備了巡航控制,一切都很簡單。但在很多方面,輝達的GPU和加速器就像F1賽車3、跟Elon Musk吃過飯,但Musk沒有懇求黃仁勳優先供貨GPU4、GPU訂單遵循先來後到原則5、不喜歡“價高者得”的經營方式6、後悔錯過Anthropic7、不喜歡挑選贏家進行支援,而是雨露均霑,讓他們自由發展8、依然不看好ASIC,沒有任何一個ASIC公司有輝達可靠9、和台積電沒有法律合同(We run on trust)(We’ve been working with TSMC for 30 years. We have no contract. Not a single contract in 30 years.We run on trust.Sometimes it’s unfair. Sometimes I win, sometimes I lose.Sometimes I get great pricing, sometimes not.But I trust them completely. I rely on them completely.It’s an incredible relationship.)10、今年的Vera Rubin將會非常出色;明年Vera Rubin Ultra將問世;後年,Feynman將橫空出世11、中國生產了全球60%的主流晶片,甚至更多12、中國擁有一些世界上最頂尖的電腦科學家13、中國擁有全球50%的人工智慧研究人員14、中國不是敵人,他們只是對手15、中國的計算能力非常龐大,中國是全球第二大計算市場。如果他們想整合計算資源,完全可以滿足需求。16、中國擁有的能源量驚人,充足的能源是中國的優勢17、如果中國願意,他們完全可以把更多的晶片集中起來18、認為中國無法製造人工智慧晶片的說法完全是無稽之談19、中國是全球最大的開放原始碼軟體貢獻國20、中國也是全球最大的開放模型貢獻國21、7nm晶片已經足夠好了22、建立兩個生態系統——一個只能運行在外國技術堆疊上的開源生態系統,另一個是運行在美國技術堆疊上的封閉生態系統——的做法是極其愚蠢的23、人工智慧本質上就是一個平行計算問題24、MoE 是一項偉大的發明25、DeepSeek 絕非無關緊要的進步,如果 DeepSeek 先在華為平台上發佈,那對美國來說將是災難性的26、x86 架構的存在是有原因的。ARM架構如此根深蒂固也是有原因的。這些生態系統難以替代。這需要耗費大量的時間和精力,而且大多數人都不願意這樣做27、輝達在中國份額大幅下降28、架構至關重要,電腦科學至關重要。半導體物理固然重要,但電腦科學才是重中之重29、即使人工智慧今天尚未出現,輝達的規模也會非常龐大30、如果沒有人工智慧,我會非常難過輝達最大的護城河是其對稀缺供應鏈的控制嗎?Q:我們已經看到許多軟體公司的估值暴跌,因為人們預期人工智慧會使軟體商品化。有一種可能過於天真的想法是:你看,輝達把GDS2檔案發給台積電。台積電製造邏輯晶片,製造交換機晶片,然後將它們與SK海力士、美光和三星生產的HBM記憶體封裝在一起。之後,台積電將封裝好的晶片發給台灣的ODM廠商,由他們組裝成機架。從本質上講,輝達製造的是其他人製造的軟體,如果軟體商品化了,輝達也會商品化嗎?黃仁勳:最終,總得有某種機制將電子轉化為tokens。將電子轉化為tokens,並隨著時間的推移提升這些tokens的價值,這很難完全商品化。從電子到tokens的轉化是一個不可思議的旅程。製造tokens就像讓一個分子比另一個分子更有價值,讓一個tokens比另一個更有價值。顯然,我們正在即時見證著tokens價值的提升,其中蘊含著大量的藝術、工程、科學和發明創造。這種轉化、製造以及所有相關的科學原理,我們遠未被完全理解,這段旅程也遠未結束。我懷疑它最終能否實現。我們當然會提高效率。你提出的問題正是我對我們公司的理解。輸入是電子,輸出是tokens。輝達位於中間。我們的工作是在必要範圍內儘可能少地干預,從而以驚人的能力實現這種轉型。我所說的“儘可能少地干預”,是指任何我不需要親自完成的事情,我都會與其他合作夥伴一起,將其納入我的生態系統。如果你看看今天的輝達,我們可能擁有規模最大的合作夥伴生態系統,涵蓋供應鏈的上下游,包括所有電腦公司、應用開發商和模型建構者。人工智慧就像一個五層蛋糕,我們的生態系統遍佈所有五個層面。我們儘量少做,但事實證明,我們必須做的那部分工作極其困難。我認為這部分工作無法商品化。(We try to do as little as possible, but the part that we have to do, as it turns out, is insanely hard)事實上,我也不認為企業軟體公司、工具製造商……如今大多數軟體公司都是工具製造商。當然,也有一些公司不是,它們開發的是工作流程編碼系統。但對很多公司來說,它們確實是工具製造商。例如,Excel 是工具,PowerPoint 是工具,Cadence開發工具,Synopsys也開發工具。實際上,我看到的恰恰與人們的看法相反。我認為代理的數量和工具使用者的數量都將呈指數級增長。所有這些工具的實例數量很可能會激增。Synopsys Design Compiler的實例數量很可能會激增,使用平面規劃器、佈局工具和設計規則檢查器的代理數量也會隨之大幅增長。如今,我們受限於工程師的數量。未來,這些工程師將得到大量agent的支援。我們將以前所未有的方式探索設計空間,並繼續使用我們今天使用的工具。我認為工具的使用將推動軟體公司蓬勃發展。之所以目前還沒有出現這種情況,是因為agents還不擅長使用這些工具。要麼這些公司會自行開發代理商,要麼agents會變得足夠熟練,能夠使用這些工具。我認為最終會是兩者的結合。Q:在你們最新的檔案中,你們與代工廠、記憶體和封裝廠商簽訂了近1000億美元的採購承諾。SemiAnalysis報導稱,你們這類採購承諾的總額將達到2500億美元。一種解讀是,輝達的護城河實際上在於你們鎖定了未來幾年這些稀缺元件的供應。其他廠商或許擁有加速器,但他們真的能獲得所需的記憶體嗎?他們真的能獲得所需的邏輯晶片嗎?這真的是輝達未來幾年最大的護城河嗎?黃仁勳:這是我們能做到而別人很難做到的事情之一。我們在上游投入了大量資源。有些是明確的,比如你提到的這些承諾。有些則是隱性的。例如,我們供應鏈上的許多上游投資都是由他們進行的,因為我曾對各位CEO說:“讓我告訴你們這個行業將會發展到多大的規模,讓我解釋一下原因,讓我和你們一起分析,讓我向你們展示我所看到的。”通過與上游各行各業的CEO們溝通、啟發和協調,他們才願意進行投資。為什麼他們願意為我而不是為其他人投資呢?原因在於,他們知道我有能力購買他們的產品,並通過我的下游管道銷售。事實上,輝達的下游供應鏈和我們的下游需求都非常龐大,因此他們願意進行上游投資。(As a result of that process of informing, inspiring, and aligning with CEOs of all different industries upstream, they’re willing to make the investments. Why are they willing to make the investments for me and not someone else? The reason for that is because they know that I have the capacity to buy their supply and sell it through my downstream. The fact is that Nvidia’s downstream supply chain and our downstream demand is so large, they’re willing to make the investment upstream.)如果你看看GTC大會,人們都會驚嘆於它的規模和參會人員之多。它涵蓋了人工智慧領域的方方面面,可謂包羅萬象。他們齊聚一堂,是因為彼此需要交流。我把他們聚集在一起,是為了讓下游企業瞭解上游,上游企業瞭解下游,讓所有人都能瞭解人工智慧的最新進展。更重要的是,他們還能與人工智慧領域的專家、正在蓬勃發展的人工智慧初創公司以及所有令人驚嘆的成果見面,親眼見證我所講述的一切。我花費大量時間,直接或間接地向我們的供應鏈、合作夥伴和生態系統傳達我們面前的機遇。有些人總是說:“Jensen,大多數主題演講都是一個接一個的公告。”但我們的主題演講總會有一部分內容讓人感覺有點“折磨”,因為它幾乎像是在進行教育。事實上,這正是我所關注的。我需要確保整個供應鏈,從上到下,整個生態系統,都瞭解即將發生的事情,它為什麼會發生,何時發生,規模有多大,並且能夠像我一樣系統地思考和分析它。關於您所描述的護城河,我們有能力為未來做好準備。如果未來幾年我們的規模達到兆美元,我們擁有相應的供應鏈。如果沒有我們的影響力,我們業務的發展速度……就像現金流、供應鏈和客戶流失一樣,如果業務流失率很低,沒有人會為一個架構建構供應鏈。我們之所以能夠維持如此龐大的規模,完全是因為下游需求巨大。他們看到了這一點,聽到了相關資訊,預見到了這一切。這使我們能夠以如此大的規模去做我們能夠做的事情。Q:我確實想更具體地瞭解上游能否跟上步伐。多年來,你們的收入每年都翻一番。你們提供給全球的flops數每年都增長三倍以上。黃仁勳:現在以這種規模翻倍真的太不可思議了。Q:沒錯。但你再看看邏輯。你是台積電N3工藝節點的最大客戶,也是N2工藝節點的最大客戶之一。今年人工智慧整體將佔N3工藝節點的60%,根據SemiAnalysis的預測,明年將達到86%。如果你已經佔據了大部分市場份額,如何才能實現翻番?又該如何逐年實現這一目標?我們現在是否正處於一個由於上游工藝的限制,人工智慧計算增長速度不得不放緩的階段?你認為有什麼辦法可以解決這個問題?最終,我們如何才能實現每年兩倍的晶圓廠建設量?黃仁勳:在某種程度上,瞬時需求大於全球上下游的供應。在任何時刻,我們都可能面臨plumbers數量不足的限制,而這種情況實際上也時有發生。Q:plumbers受邀參加明年的GTC大會。黃仁勳:順便說一句,這主意不錯。但這只是個好條件。你想要的是一個瞬時需求大於行業總供給的行業。反之則顯然不好。如果我們之間的距離太遠,如果某個特定元件的供應量太少,整個行業就會蜂擁而至。例如,你會發現現在人們很少再談論CoWoS了。原因在於,過去兩年我們全力以赴,實現了超負荷的產能擴張。我們連續數次加倍,每次都翻倍。現在我認為我們形勢相當不錯。台積電現在也意識到,CoWoS的供應必須跟上邏輯電路和儲存器的需求。他們正以與邏輯電路相同的速度擴展CoWoS和未來的封裝技術。這非常棒,因為長期以來,CoWoS和HBM儲存器都屬於小眾技術。但現在它們不再是小眾技術了。人們現在意識到它們已經成為主流的計算技術。當然,我們現在更有能力影響供應鏈的更大範圍。在人工智慧革命之初,我五年前就說過現在我說的這些話。有些人相信它並進行了投資,例如Sanjay和美光團隊。我仍然清楚地記得那次會議,會上我清楚地闡述了將會發生什麼、為什麼會發生以及今天的預測。他們確實加倍投入。我們在LPDDR和HBM記憶體領域與他們展開了合作,他們也確實投入了大量資金。這顯然對公司產生了巨大的影響。有些人加入得晚一些,但現在他們都在這裡了。這些瓶頸問題都受到了高度重視。現在,我們正在提前數年預先解決這些瓶頸問題。例如,過去幾年我們對Lumentum 、Coherent以及矽光子生態系統的投資,真正重塑了供應鏈。我們圍繞台積電建構了一條完整的供應鏈。我們與他們合作開發了COUPE 項目,發明了大量技術,並將這些專利授權給供應鏈,以保持其開放性和高效性。我們正在通過發明新技術、新工作流程、新型測試裝置(例如雙面探針測試)來建構供應鏈,同時投資於相關企業並幫助它們擴大產能。可以看出,我們正努力塑造整個生態系統,使供應鏈能夠支援規模化發展。Q:似乎有些瓶頸比其他瓶頸更容易解決。例如,擴展 CoWoS 與其他擴展方式相比。黃仁勳:順便說一句,我碰到的是難度最高的那一個。Q:那個?黃仁勳:水管工和電工。這就是我對那些描述工作終結和職業消亡的末日論者感到擔憂的原因之一。如果我們勸阻人們成為軟體工程師,我們就會面臨軟體工程師短缺的問題。十年前也出現過同樣的預測。一些末日論者告誡人們:“無論如何,千萬別當放射科醫生。”你可能還會在網上看到一些這樣的視訊,說放射科醫生將是第一個消失的職業,世界將不再需要更多的放射科醫生。猜猜我們現在缺什麼?放射科醫生。Q:回到之前關於有些東西可以規模化生產,而有些東西卻不行這一點……你究竟如何才能每年生產兩倍的邏輯電路?歸根結底,儲存器和邏輯電路的瓶頸都在於極紫外光刻(EUV)。你如何才能逐年獲得兩倍的極紫外光刻裝置?黃仁勳:這些都不是無法快速擴展的。所有這些都可以在兩三年內輕鬆實現。你只需要一個需求訊號。一旦你能造出一個,你就能造出十個;一旦你能造出十個,你就能造出一百萬個。這些都不難複製。Q:你會追溯到供應鏈的那個環節?你會去找ASML說:“嘿,如果我展望三年後,輝達的年收入達到兩兆美元,我們需要更多的EUV光刻機”嗎?黃仁勳:有些我必須直接說服,有些需要間接,還有一些……如果我能說服台積電,ASML也會被說服。我們必須考慮關鍵的瓶頸。但如果台積電被說服了,幾年後你們就會有很多EUV光刻機可用了。我的意思是,所有瓶頸都不會持續超過兩三年,一個都不會。與此同時,我們的計算效率提高了10倍、20倍,以Hopper到Blackwell為例,甚至提高了30倍到50倍。由於CUDA的靈活性,我們不斷開發新的演算法。我們正在開發各種新技術,以提高效率,同時提升產能。這些我都不擔心。真正讓我擔憂的是下游的問題。那些阻礙能源發展的能源政策……沒有能源,就無法建立任何產業。沒有能源,就無法建立一個全新的製造業。我們希望重振美國工業。我們希望恢復晶片製造、電腦製造和封裝產業。我們希望研發電動汽車和機器人等新產品。我們希望建設人工智慧工廠。所有這些都離不開能源,而且這些項目都需要很長時間。增加晶片產能,這需要兩到三年的時間。增加CoWoS產能,也需要兩到三年的時間。Q:有意思。我感覺有時候客人會跟我說完全相反的話。這種情況下,我確實缺乏相關的專業知識來判斷。黃仁勳:最妙的是,你是在和專家對話。TPU 能否打破輝達在 AI 計算領域的壟斷地位?Q:我想問問你們的競爭對手。如果你看看TPU ,可以說全球排名前三的模型中,有兩款——Claude和Gemini——都是用TPU訓練的。這對輝達未來的發展意味著什麼?黃仁勳:我們打造的是截然不同的東西。輝達打造的是加速計算,而不是張量處理單元。加速計算的應用範圍非常廣泛:分子動力學、量子色動力學、資料處理、資料幀、結構化資料和非結構化資料。它也用於流體動力學和粒子物理學。此外,我們還將其應用於人工智慧領域。加速計算的範疇遠比這廣泛得多。雖然人工智慧是當今的熱門話題,而且顯然非常重要且影響深遠,但計算的範疇遠不止於此。輝達徹底革新了計算方式,從通用計算轉向加速計算。我們的市場覆蓋範圍遠遠超過任何TPU或ASIC晶片所能企及的範圍。從我們的市場地位來看,我們是唯一一家能夠加速所有類型應用程式的公司。我們擁有龐大的生態系統。因此,各種框架和演算法都可以在輝達平台上運行。因為我們的電腦設計之初就考慮到了由他人操作,所以任何具備操作能力的人都可以購買我們的系統。而大多數自建系統則需要使用者自行操作,因為它們的設計初衷並非為了方便他人操作。由於任何人都可以操作我們的系統,因此我們的產品已部署在包括 Google、Amazon、Azure 和 OCI 在內的所有雲平台上。如果您想以租賃方式營運,最好擁有一個涵蓋多個行業的龐大客戶生態系統,以便他們成為承購方。如果您想自行營運,我們當然有能力幫助您,就像我們之前為埃隆·馬斯克提供的 xAI 服務一樣。而且,由於我們能夠賦能任何公司和任何行業的營運者,您可以利用這項技術為禮來公司建構一台用於科學研究和藥物研發的超級電腦。我們可以幫助他們營運自己的超級電腦,並將其用於我們所加速的各個藥物研發和生物科學領域。我們能夠解決很多TPU無法解決的應用問題。輝達打造CUDA的目的不僅在於使其成為一個出色的張量處理單元,它還能處理資料處理、計算、人工智慧等各個生命周期。我們的市場機會更大,覆蓋範圍也更廣。因為我們現在支援全球所有應用,所以無論你在那裡建構輝達系統,都無需擔心找不到客戶。這完全是兩碼事。Q:這將是一個很長的問題。你們的營收非常驚人,但你們每季度600億美元的收入並非來自製藥和量子計算領域。你們之所以能做到這一點,是因為人工智慧是一項前所未有的技術,而且它正以前所未有的速度發展。那麼問題就變成了:那種方案最適合人工智慧?我不太瞭解細節,但我跟我的人工智慧研究朋友聊過,他們說:“你看,我用TPU的時候,它是一個大型的脈動陣列,非常適合做矩陣乘法,而GPU則非常靈活。當你需要處理大量分支或不規則的記憶體訪問時,它就非常棒。”但人工智慧究竟是什麼?它不過是不斷重複進行這些非常可預測的矩陣乘法運算。你無需為線程束調度器或線程與記憶體庫之間的切換而犧牲任何晶片面積。而且,TPU 針對當前計算領域收入增長和應用場景的大量需求進行了最佳化。我想知道你對此有何看法。黃仁勳:矩陣乘法是人工智慧的重要組成部分,但並非全部。如果你想提出新的注意力機制、以不同的方式進行分解,或者發明一種全新的架構——例如混合SSM——你需要一個通用的可程式設計架構。如果你想建立一個融合擴散和自回歸技術的模型,你同樣需要一個通用的可程式設計架構。我們幾乎可以運行你所能想像的一切。這就是它的優勢所在。由於它是一個可程式設計系統,因此可以更輕鬆地發明新的演算法。人工智慧之所以能如此快速發展,真正的原因在於其不斷髮明新演算法的能力。與其他任何事物一樣,TPU(技術處理單元)也受到摩爾定律的影響,而摩爾定律的年增長率約為25%。要想真正實現10倍甚至100倍的飛躍,唯一的辦法就是每年從根本上改變演算法及其計算方式。這就是輝達的根本優勢。我們之所以能讓 Blackwell 的能效比 Hopper 高出 50 倍,唯一的原因是……當初我宣佈 Blackwell 的能效將比 Hopper 高出 35 倍時,沒人相信。後來Dylan寫了篇文章說我故意隱瞞,但實際上能效是 Hopper 的 50 倍。單憑摩爾定律是無法實現這一點的。我們解決這個問題的方法是採用新的模型,例如MoE(模組化執行單元),這些模型可以平行化、解耦並分佈在整個計算系統中。如果沒有能力真正深入研究並利用 CUDA 開發新的核心,這一切都很難做到。這得益於我們架構的可程式設計性,以及輝達作為一家極致的協同設計公司的優勢。我們甚至可以將部分計算任務解除安裝到架構本身(例如NVLink )或網路(例如Spectrum-X)中。我們可以同時對處理器、系統、架構、庫和演算法進行更改。如果沒有 CUDA,我真不知道該從何入手。Q:這引出了一個關於輝達客戶群的有趣問題。你們60%的收入都來自五大超大規模資料中心營運商。如果換個時代,面對不同的客戶群體——比如說進行實驗的教授——他們需要CUDA。他們無法使用其他加速器。他們只需要用CUDA運行PyTorch ,並且所有功能都得到最佳化。但這些超大規模資料中心營運商擁有編寫自有核心的資源。事實上,為了獲得其特定架構所需的最後 5% 的性能提升,他們必須這樣做。Anthropic 和 Google 大多運行著自己的加速器,或者使用 TPU 和Trainium 。即使是使用 GPU 的 OpenAI,也使用Triton ,因為他們需要自己的核心。甚至在 CUDA C++ 方面,他們也沒有使用cuBLAS和NCCL ,而是擁有自己的技術堆疊,該技術堆疊還可以編譯到其他加速器上。如果你的大多數客戶能夠並且確實找到了 CUDA 的替代方案,那麼 CUDA 在多大程度上真的能夠推動 Nvidia 平台上的前沿 AI 應用?黃仁勳:CUDA 擁有豐富的生態系統。如果您想先在任何電腦上進行建構,那麼首先基於 CUDA 進行建構是非常明智的選擇。正因為其生態系統如此豐富,我們才能支援所有框架。如果您想建立自訂核心……例如,我們為 Triton 做出了巨大貢獻。因此,Triton 的後端使用了大量的 Nvidia 技術。我們很高興能夠幫助每個框架發揮其最大潛力。框架種類繁多,例如 Triton、vLLM 、SGLang等等。現在又湧現出許多新的強化學習框架,例如verl和NeMo RL 。隨著訓練後處理和強化學習的不斷發展,整個領域正經歷著爆炸式增長。因此,如果您想基於某個架構進行開發,那麼基於 CUDA 無疑是最佳選擇,因為 CUDA 的生態系統非常完善。你知道,如果出了問題,更有可能出在你的程式碼裡,而不是底層那堆積如山的程式碼裡。建構這些系統時,別忘了你要處理的程式碼量有多大。如果出了問題,是你的問題還是電腦的問題?你肯定希望問題總是出在你身上,並且能夠信任電腦。當然,我們自己也存在很多 bug,但我們的系統已經過充分測試,至少你可以在這個基礎上繼續開發。這就是第一點:生態系統的豐富性、可程式設計性和強大功能。第二點是,如果你是一名開發者,無論開發什麼軟體,你最看重的就是使用者基數。你希望你編寫的軟體能夠在大量的其他電腦上運行。你開發軟體並非僅僅為了自己,而是為了你的伺服器群,或者其他所有人的伺服器群,因為你是一名框架建構者。輝達的 CUDA 生態系統最終是其最大的財富。現在市面上已經有數億個GPU。每個雲平台都配備了GPU。從A10 、A100 、H100 、H200 ,到L系列、P系列等等,種類繁多,尺寸和形狀也各不相同。如果你是一家機器人公司,你肯定希望CUDA協議棧能夠直接在機器人上運行。我們的產品幾乎無處不在。龐大的使用者群意味著,一旦你開發出軟體或模型,它就能在任何地方使用。這簡直太有價值了。最後,我們能夠覆蓋所有雲平台,這使我們真正獨樹一幟。如果您是一家人工智慧公司或開發者,您可能並不確定應該與那家雲服務提供商合作,或者在那裡運行。我們幾乎可以在任何地方運行,如果您願意,我們也可以為您提供本地部署服務。豐富的生態系統、龐大的使用者群以及我們靈活的部署方式,共同造就了 CUDA 的無可比擬的價值。Q:這很有道理。我好奇的是,這些優勢對你的主要客戶來說是否重要。對很多人來說,這些優勢可能很重要。能夠建構自己軟體棧的那類人貢獻了你的大部分收入。尤其是在人工智慧越來越擅長那些具有嚴格驗證循環、可以進行強化學習的領域……如何編寫一個核心,使其在規模化應用中能夠最高效地處理注意力機制或多層感知器(MLP)?這是一個非常容易驗證的反饋循環。所有超大規模資料中心營運商都能自行編寫這些定製核心嗎?輝達的性價比依然很高,所以他們可能仍然更傾向於使用輝達的產品。但問題在於,最終會不會演變成誰能以最低的價格提供最佳的規格、浮點運算能力和記憶體頻寬?歷史上,輝達憑藉CUDA的護城河,在人工智慧領域(包括硬體和軟體)一直保持著最高的利潤率,高達70%。而問題是,如果大多數客戶能夠負擔得起自行建構,而不是依賴CUDA的護城河,輝達還能維持這樣的利潤率嗎?黃仁勳:我們為這些人工智慧實驗室配備了數量驚人的工程師,他們與這些實驗室合作,最佳化他們的技術堆疊。原因在於,沒有人比我們更瞭解我們的架構。這些架構不像CPU那樣通用。CPU有點像凱迪拉克,它是一款舒適的巡航車,速度不會太快,每個人都能輕鬆駕馭。它配備了巡航控制,一切都很簡單。但在很多方面,輝達的GPU和加速器就像F1賽車。我估計每個人都能以每小時一百英里的速度駕駛它,但要將其性能發揮到極致,則需要相當豐富的專業知識。我們運用了大量的人工智慧技術來建立我們的核心。我非常肯定,在相當長的一段時間內,我們仍然會被需要。我們的專業知識通常能幫助我們的人工智慧實驗室合作夥伴輕鬆地將他們的技術堆疊性能提升兩倍。我們完成技術堆疊最佳化或特定核心最佳化後,他們的模型速度提升三倍、兩倍甚至五成的情況並不少見。這是一個巨大的數字,尤其考慮到他們龐大的裝置基數,包括他們所有的 Hopper 和 Blackwell 等計算單元。性能提升一倍,收入也會翻倍。這直接轉化為實際收益。輝達的計算堆疊是全球性價比最高的,沒有之一。目前世界上沒有任何一個平台能證明它的性能/總擁有成本比更高。沒有一家公司能做到。事實上,現有的基準測試,比如Dylan的InferenceMAX ,人人都能用,但沒有任何一家公司能做到……TPU不會推出,Trainium也不會推出。我鼓勵他們使用 InferenceMAX 來展示他們驚人的推理成本。這真的很難。沒人願意來。MLPerf 。我倒是很想聽聽 Trainium 展示一下他們一直聲稱的 40% 的成本優勢。我很想聽聽他們如何證明 TPU 的成本優勢。在我看來,這完全說不通。一點道理都沒有。從根本上來說,這根本說不通。所以我認為我們如此成功的原因很簡單,就是我們的總體擁有成本 (TCO) 非常低。其次,您提到我們 60% 的客戶是前五大企業,但其中大部分業務都是外部業務。例如,AWS 上的輝達產品大部分是為外部客戶而非內部使用者提供的。Azure 上的所有客戶也都是外部客戶。OCI 上的所有客戶也都是外部客戶,而非內部使用者。他們之所以青睞我們,是因為我們的覆蓋範圍非常廣。我們可以為他們帶來全球所有優秀的客戶。這些客戶都基於輝達的產品。而所有這些公司之所以都基於輝達的產品,正是因為我們覆蓋範圍廣、功能多樣。所以我認為真正的飛輪效應在於使用者基數、我們架構的可程式設計性、我們生態系統的豐富性,以及全球人工智慧公司數量眾多這一事實。現在有成千上萬家人工智慧公司。如果你是其中一家人工智慧初創公司,你會選擇那種架構?你會選擇最普及的架構。而我們的架構是全球最普及的。你會選擇使用者基數最大的架構。而我們的使用者基數最大。你還會選擇擁有豐富生態系統的架構。這就是飛輪效應。原因在於:首先,我們的每美元性能如此之高,以至於他們的tokens成本最低。其次,我們的每瓦性能是全球最高的。因此,如果我們的合作夥伴建造了一個1吉瓦的資料中心,那麼這個1吉瓦的資料中心必須能夠產生最大的收益和tokens數量,這直接轉化為收入。您希望它產生儘可能多的代幣,從而最大化資料中心的收益。我們擁有全球最高的每瓦代幣產量架構。最後,如果您的目標是租用基礎設施,我們擁有全球最多的客戶。這就是飛輪效應發揮作用的原因。Q:有意思。我想問題的關鍵在於,實際的市場結構究竟如何?因為即便還有其他公司……原本可能存在成千上萬家人工智慧公司,它們大致平分計算資源。但即便通過這五家超大規模資料中心,真正使用亞馬遜計算資源的仍然是 Anthropologie、OpenAI 以及那些有能力且能夠自行部署不同加速器的大型基金會實驗室。黃仁勳:不,我認為你的前提是錯誤的。Q:也許吧。不過,我想問你一個稍微不同的問題。如果價格、性能、每瓦性能等等這些說法都是真的,那麼你認為為什麼像 Anthropic 這樣的公司會在幾天前宣佈他們與 Broadcom 和 Google 達成了一項數吉瓦的 TPU 協議,用於他們的大部分計算呢?顯然,對Google來說,TPU 佔據了大部分計算資源。所以,如果我觀察這些大型人工智慧公司,會發現它們的很多計算資源……曾經有一段時間它們都依賴輝達的加速器,但現在情況並非如此。因此,我很好奇,如果這些說法在理論上成立,它們為什麼會選擇其他加速器呢?黃仁勳:Anthropic 是一個特例,而非一種趨勢。如果沒有 Anthropic,TPU 又怎會增長?它完全是 Anthropic 的功勞。如果沒有 Anthropic,Trainium 又怎會增長?它也完全是 Anthropic 的功勞。我認為這一點已廣為人知。ASIC 的機會並不多,Anthropic 只有一個。Q:但OpenAI 與 AMD 達成了協議……他們正在打造自己的Titan加速器。黃仁勳:是的,但我想我們都應該承認,它們很大程度上是輝達的產品。我們仍然會繼續合作。我不介意其他人使用其他產品或嘗試其他技術。如果他們不去嘗試,又怎麼知道我們的產品有多好呢?有時候,我們需要有人提醒自己這一點。我們必須不斷地努力才能保住現在的地位。總是有很多誇張的說法。看看有多少ASIC項目被取消就知道了。就算你打算造ASIC……你還得造出比輝達更好的產品。造出比輝達更好的產品可沒那麼容易。實際上,這根本不現實。輝達肯定漏掉了什麼,真的。因為我們的規模和速度,我們是世界上唯一一家每年都能持續產出新產品的公司。每年都有巨大的飛躍。Q:我猜他們的邏輯是,“嘿,它不需要更好。它只需要比原來的差不超過70%就行了”,因為他們付給你的是70%的利潤率。黃仁勳:不,別忘了,即使是ASIC晶片,利潤率也相當高。比如說,輝達的利潤率是70%。但ASIC晶片的利潤率只有65%。你到底能省多少錢?Q:哦,你是說博通之類的公司嗎?黃仁勳:當然,總得付錢給別人吧。就我所知,ASIC的利潤率非常高。他們自己也這麼認為,而且他們對ASIC驚人的利潤率相當自豪。所以,你問了為什麼。很久以前,我們確實沒有能力做到這一點。當時,我並沒有深刻意識到建立像 OpenAI 和 Anthropic 那樣的基礎性人工智慧實驗室有多麼困難,也沒有意識到他們需要供應商投入巨資。我們當時根本無力向 Anthropic 投資數十億美元,讓他們使用我們的計算資源。但Google和 AWS 有。他們一開始就投入了巨資,作為回報,Anthropic 可以使用他們的計算資源。而我們當時確實沒有能力做到這一點。我覺得我的錯誤在於,我沒有真正理解他們其實別無選擇,風險投資家絕不會把50億到100億美元投資到一個人工智慧實驗室,指望它能像Anthropic那樣成功。所以這是我的失誤。但即便我當時理解了這一點,我想我們當時也沒有能力這麼做。但我不會再犯同樣的錯誤了。我很高興能投資 OpenAI,也很高興能幫助他們擴大規模,而且我認為這樣做至關重要。後來,當 Anthropic 找到我們時,我也很高興能成為他們的投資者,幫助他們擴大規模。只是當時我們力不從心。如果一切可以重來——如果輝達當時就能達到現在的規模——我絕對會非常樂意這麼做。為什麼輝達不成為超大規模資料中心營運商?Q:這確實很有意思。多年來,輝達一直是人工智慧領域最賺錢的公司,賺了很多錢。現在你們開始投資人工智慧了。據報導,你們在OpenAI投資了高達300億美元,在Anthropic投資了100億美元。現在它們的估值都提高了,我相信還會繼續增長。所以,如果你這些年來一直為他們提供計算資源,並且預見到它的發展方向,而幾年前——甚至在某些情況下,一年前——他們的價值只有現在的十分之一,而你又手握大量現金——那麼,輝達完全可以轉型為基金會實驗室,進行巨額投資來實現這一目標,或者更早地以現在的估值完成你現在達成的這些交易。而且你當時也有足夠的資金這樣做。所以我很想知道,為什麼你沒有更早地這樣做呢?黃仁勳:我們儘早完成了這件事。如果可以,我甚至會更早去做。當時Anthropic需要我們做這件事的時候,我們卻無能為力。這樣做也不符合我們的本性。Q:怎麼會這樣?是現金交易之類的嗎?黃仁勳:是的,投資規模的問題。當時我們從未在公司外部投資過,而且投資額也不大。我們當時沒意識到需要投資。我一直以為他們可以像其他公司一樣,直接去風投那裡融資,我的天那。但他們想做的事情,風投是做不到的。OpenAI想做的事情,風投是做不到的。我現在明白了。當時我並不知道。但這就是他們的過人之處。這就是他們聰明的原因。他們當時意識到自己必須做這樣的事。我很高興他們這麼做了。儘管我們導致Anthropic不得不轉投他人,但我仍然為此感到高興。Anthropic的存在對世界意義重大。我為此感到欣慰。Q:我猜你仍然賺了很多錢,而且每個季度都在賺得更多。黃仁勳:有遺憾也是正常的。Q:所以問題依然存在。既然我們已經到了這裡,而且你們也一直在賺這筆錢,那麼輝達應該怎麼用呢?一個答案是,現在已經出現了一個完整的中間商生態系統,可以將這些實驗室的資本支出轉化為營運支出,以便他們能夠租用計算資源。因為晶片非常昂貴,而且由於人工智慧模型不斷改進,它們在其生命周期內能帶來巨額利潤。因此,它們創造的價值,也就是它們的代幣,正在不斷增長,但搭建這些系統成本很高。輝達有足夠的資金來承擔這些資本支出。事實上,據報導,你們為CoreWeave項目提供了高達63億美元的支援,並且已經投資了20億美元。為什麼輝達不自己做雲服務商?為什麼不自己做超大規模雲服務商,把計算資源出租出去?他們有這麼多錢可以這麼做。黃仁勳:這是公司的理念,我認為很明智。我們應該儘可能少地投入,只做必要的事情。這意味著,如果我們不去建構我們的計算平台,我相信這項工作就無法完成。如果我們不承擔現在承擔的風險——如果我們不以現在的方式建構 NVLink,如果我們不建構整個技術堆疊,如果我們不以現在的方式建立生態系統,如果我們不投入 20 年的時間,即使大部分時間都在虧損,也要致力於 CUDA 的發展——如果我們不去做,其他人就不會去做。如果我們當初沒有建立所有CUDA-X 庫,使它們都針對特定領域……十五年前,我們開始大力開發領域特定庫,因為我們意識到,如果我們不建立這些領域特定庫,無論是光線追蹤、圖像生成,甚至是早期人工智慧的模型,無論是資料處理、結構化資料處理還是向量資料處理,如果我們不建立它們,就不會有人建立。我對此深信不疑。我們建立了一個名為cuLitho的計算光刻庫。如果我們不建立它,就不會有人建立。因此,如果我們不做這些,加速計算就不會發展到今天這樣的程度。所以我們應該這樣做。我們應該傾盡全力,全心全意地投入到這項工作中。然而,世事難料。如果我不做,也會有人去做。因此,我們公司至今仍然秉持著“儘可能多做,但儘可能少做”(doing as much as needed but as little as possible)的理念。我所做的每一件事,都遵循著這個原則。就雲端運算而言,如果我們當初不支援CoreWeave ,這些 neoclouds、這些 AI 雲就不會存在。如果我們當初沒有幫助 CoreWeave 發展,它們也不會存在。如果我們當初沒有支援Nscale ,它們就不會有今天的成就。如果我們當初沒有支援Nebius ,它們也不會有今天的成就。如今,它們發展得非常出色。這算是一種商業模式嗎?我們應該儘可能多地做事,儘可能少地干預。所以我們投資於我們的生態系統,因為我希望我們的生態系統蓬勃發展。我希望架構和人工智慧能夠與儘可能多的行業、儘可能多的國家連接起來,使整個地球能夠基於人工智慧和美國的技術堆疊而運轉。這正是我們正在追求的願景。您剛才提到的一點是……有很多非常優秀的基金會模式公司,我們儘量投資所有這些公司。這也是我們所做的。我們不挑選贏家。我們需要支援所有公司。這是我們投資的樂趣所在,也是我們業務的必要組成部分。但我們也會刻意避免挑選贏家。所以,當我投資一家公司時,我也會投資所有相關的公司。Q:你為什麼刻意不去挑選贏家?黃仁勳:第一,這不是我們的職責。第二,輝達創立之初,有60家3D圖形公司。我們是唯一一家存活下來的。如果你把這60家圖形公司都列出來,問問自己那家會成功,輝達肯定排在失敗名單的首位。這事發生在你很久以前,但輝達的圖形架構一開始確實是錯的,不是一點點錯,而是我們創造了一個徹頭徹尾的錯誤架構,開發者根本無法維護。它註定失敗。我們當初的出發點是好的,但最終卻得到了錯誤的解決方案。所有人都認為我們會失敗。而我們現在卻成功了。所以我足夠謙遜,能夠認識到這一點。不要人為地挑選贏家。要麼讓他們各自發展,要麼就幫助他們所有人。Q:有一點我不明白,你說:“我們優先發展這些NeoCloud項目,並非僅僅因為它們是NeoCloud,我們想扶持它們。”但你又列舉了一堆NeoCloud項目,說如果沒有NVIDIA,它們根本不會存在。這兩件事怎麼能自相矛盾呢?黃仁勳:首先,他們必須有創業的意願,並且主動來尋求我們的幫助。當他們有創業意願,並且擁有商業計畫、專業知識和熱情時……他們顯然也必須具備一定的自身能力。但如果最終他們需要一些投資才能啟動項目,我們也會全力支援。不過,他們越早啟動自己的發展引擎越好……你的問題是:“我們是否想涉足融資業務?”答案是否定的。融資業務已經存在,我們更願意與他們合作,而不是自己成為融資者。我們的目標是專注於我們自身的核心業務,儘可能簡化我們的商業模式,並支援我們的生態系統。像 OpenAI 這樣的公司,在上市前就需要 300 億美元的投資,而我們深信他們,我也深信他們將會成為……嗯,他們現在就已經是一家非凡的公司了。他們將會成為一家了不起的公司。世界需要他們,世界希望他們存在,我也希望他們存在。他們現在順風順水。讓我們支援他們,讓他們發展壯大。我們會進行這些投資,因為他們需要我們這樣做。但我們並非試圖儘可能多地投資,而是試圖儘可能少地干預。Q:這可能是一個顯而易見的問題,但我們已經在 GPU 短缺的情況下生活了很多年,而且隨著模型性能的提高,這種情況現在變得更加嚴重了。黃仁勳:我們缺少GPU。Q:是的。眾所周知,輝達在分配稀缺資源方面並非只看出價,而是會考慮“我們想確保這些新雲平台能夠存在。所以我們給CoreWeave分配一些,給Crusoe分配一些,給Lambda分配一些。”這對輝達有什麼好處呢?首先,你是否同意這種將市場分割的說法?黃仁勳:不,不。你的前提完全錯誤。我們對這些事情非常重視。首先,如果沒有採購訂單,再多的討論也無濟於事。在拿到採購訂單之前,我們能做什麼?所以,首要任務是與所有人密切合作,努力完成預測,因為這些項目需要很長時間才能建成,資料中心的建設更是如此。我們通過預測來確保供需平衡等等。明白嗎?這是首要任務。第二,我們已盡力與儘可能多的人進行預測,但最終您仍然需要下單。或許由於某種原因,您尚未下單。我能怎麼辦?在某些情況下,我們會遵循先到先得的原則。但除此之外,如果您因為資料中心尚未準備就緒,或者某些元件尚未到位而無法搭建資料中心,我們可能會優先服務其他客戶。這只是為了最大限度地提高我們工廠的產能。我們可能會對此進行一些調整。除此之外,優先順序是先進先出。你必須下訂單。如果你不下訂單……當然,這方面有很多傳聞。比如,這一切都源於一篇關於拉里和埃隆和我共進晚餐的文章,文章裡他們懇求我提供GPU 。這事根本沒發生過(That never happened)。我們確實一起吃了頓飯。我們確實一起吃了頓飯,而且那是一頓非常棒的晚餐。他們從來沒有懇求我提供GPU。他們只需要下訂單。一旦他們下訂單,我們會盡力滿足他們的產能需求。我們的流程很簡單。Q:好的。聽起來好像有個排隊機制,然後根據你的資料中心是否準備就緒以及你何時下訂單,你才能在特定時間獲得資源。但這仍然不像是價高者得。這樣做有什麼原因嗎?黃仁勳:我們從來不那樣做。Q:為什麼不直接選擇價高者得呢?黃仁勳:因為這是糟糕的商業做法。你定好價格,然後讓別人決定買不買。我知道晶片行業的其他公司會在需求旺盛時調整價格,但我們不會。這從來都不是我們的行事方式。您可以信賴我們。我更願意做一個可靠的人,成為行業的基石。您無需猜測。如果我報了價,那就是我們報的價格。就是這樣。如果需求激增,那就順其自然。Q:另一方面,這就是為什麼你和台積電保持著良好的合作關係,對吧?黃仁勳:是的,輝達和他們合作已經快30年了。輝達和台積電之間沒有正式的法律合同。所以總會有些不公平的待遇。有時候我判斷對,有時候我判斷錯。有時候我能拿到更好的價格,有時候會拿到更差的價格。但總的來說,我們之間的關係非常棒。我完全信任他們,完全可以依靠他們。選擇輝達,有一點可以肯定:今年,Vera Rubin將會非常出色。明年,Vera Rubin Ultra將問世。後年,Feynman將橫空出世。再後年,我還沒公佈名字呢。每年,你都可以信賴我們。你得去全世界找找其他 ASIC 團隊——隨便挑一個——才能找到一個可以讓你說:“我可以把我的全部家產都押上,我可以把我的整個公司都押上,你們每年都會為我服務。你們的token成本每年都會下降一個數量級,我可以像信賴時鐘一樣信賴你們。”(“I can bet the farm, I can bet my entire business that you will be here for me every single year. Your token cost will decrease by an order of magnitude every single year. I can count on it like I can count on the clock.”)我剛才提到了台積電。歷史上沒有任何其他代工廠能做到這一點。但如今,你可以這樣評價輝達。每年你都可以信賴我們。如果你想購買價值十億美元的AI工廠計算資源,沒問題。如果你想購買價值一億美元的,沒問題。你想購買價值一千萬美元的,或者僅僅是一個機架,都沒問題。或者僅僅是一張顯示卡,好的,沒問題。如果你想訂購價值一千億美元的AI工廠,沒問題。我們是當今世界上唯一一家可以這樣說的公司。台積電的情況也一樣。我想買一台,買十億台,都沒問題。我們只需要按部就班地做好規劃,做所有成熟企業都會做的事情。所以我認為,輝達能夠成為全球人工智慧產業的基石,是我們花了二十多年才取得的成就。這需要巨大的投入和奉獻。公司的穩定性、公司的持續發展,對我們來說至關重要。我們應該向中國出售人工智慧晶片嗎?Q:好的。我想問問關於中國的問題。其實我也不知道對向中國出售晶片到底好不好有什麼看法,但我喜歡和嘉賓唱反調。所以,上次達里歐做客“誰支援出口管制”節目時,我問他,為什麼美國和中國不能都擁有資料中心領域的天才人才呢?不過既然你持相反觀點,那我就反過來問你。換個角度來看,Anthropic Games幾天前發佈了Mythos Preview 。他們甚至沒有公開發佈這款Mythos模型,因為他們說它擁有如此強大的網路攻擊能力,在確保所有零日漏洞都被修復之前,世界還沒有做好準備。但他們表示,Mythos在所有主流作業系統和瀏覽器中都發現了數千個高危漏洞。他們甚至在OpenBSD中也發現了一個漏洞,而OpenBSD正是專門設計用來避免零日漏洞的作業系統。他們發現的這個漏洞已經存在了27年。因此,如果中國能夠獲得人工智慧晶片,訓練像 Claude Mythos 這樣具有網路攻擊能力的模型,並利用更強大的計算能力運行數百萬個實例,這會構成威脅嗎?黃仁勳:首先,Mythos 的訓練所用的計算能力和計算量都相當普通,但訓練所用的卻是一家非常優秀的公司。這種計算能力和計算類型在中國非常普遍。所以你首先需要明白,晶片在中國是存在的。他們生產了全球60%的主流晶片,甚至可能更多。對他們來說,這是一個非常龐大的產業。他們擁有一些世界上最頂尖的電腦科學家。眾所周知,所有這些人工智慧實驗室中的大多數人工智慧研究人員都是中國人。他們擁有全球50%的人工智慧研究人員。所以問題是,考慮到他們已經擁有的所有資源——他們擁有豐富的能源、大量的晶片、以及絕大多數的人工智慧研究人員——如果你擔心他們,那麼創造一個安全世界的最佳方法是什麼?將他們視為受害者,把他們變成敵人,可能並非最佳方案。他們是對手。(Victimizing them, turning them into an enemy, likely isn’t the best answer. They are an adversary.)我們希望美國獲勝。但我認為,開展對話和研究性對話或許是最穩妥的做法。由於我們目前將中國視為對手的態度,這方面明顯缺失。我們的人工智慧研究人員和他們的人工智慧研究人員必須進行真正的對話。我們必須努力就人工智慧的用途達成共識。至於尋找軟體漏洞,這當然是人工智慧的職責所在。它會在很多軟體中發現漏洞嗎?當然會。軟體漏洞數不勝數。人工智慧軟體中也存在大量漏洞。這正是人工智慧的職責所在,我很高興人工智慧已經發展到能夠幫助我們大幅提高生產力的水平。網路安全、人工智慧網路安全、人工智慧安全、人工智慧隱私和人工智慧保障等領域的生態系統非常豐富,但卻常常被忽視。一個龐大的人工智慧初創企業生態系統正在努力為我們創造這樣的未來:一個功能強大的人工智慧代理被成千上萬個其他人工智慧代理環繞,共同守護著它的安全。這樣的未來必將到來。讓人工智慧代理在無人監管的情況下四處運行,這簡直是瘋了。我們非常清楚,這個生態系統需要蓬勃發展。事實證明,這個生態系統需要開源。這個生態系統需要開放的模型。他們需要開放的技術堆疊,這樣所有的人工智慧研究人員和優秀的電腦科學家才能建構強大且安全的AI系統。因此,我們必須確保開源生態系統的活力。這一點不容忽視。很多開放原始碼專案都來自中國。我們不應該扼殺它。關於中國,我們當然希望美國擁有儘可能多的計算能力。我們受限於能源,但我們已經投入大量資源來解決這個問題。我們絕不能讓能源成為國家發展的瓶頸。但我們也希望確保全世界的人工智慧開發者都基於美國的技術堆疊進行開發,並將人工智慧的貢獻和進步——尤其是在開放原始碼的情況下——貢獻給美國生態系統。如果建立兩個生態系統——一個是只能運行在外國技術堆疊上的開源生態系統,另一個是運行在美國技術堆疊上的封閉生態系統——那將是極其愚蠢的。我認為這對美國來說將是一個糟糕的結果。Q:由於事情很多,我先簡單概括一下。我認為,回到駭客攻擊中提到的浮點運算能力差距問題,沒錯,他們的確擁有計算能力,但他們實際能夠生產的浮點運算能力只有美國的十分之一。那麼,他們最終能否訓練出像 Mythos 這樣的模型呢?答案是肯定的。但問題在於,由於失敗案例更多,美國實驗室能夠率先達到這種能力水平。因為 Anthropic 公司搶先一步,他們會說:“好吧,我們先保留一個月,讓所有美國公司都有機會使用。他們會修復所有漏洞,然後我們再發佈。”此外,即便他們訓練出了這樣的模型,大規模部署的能力也至關重要……如果一個網路駭客擁有上百萬個這樣的模型,那肯定比只有一千個要危險得多。所以推理計算能力真的非常重要。事實上,他們擁有如此多優秀的AI研究人員,這才是真正令人擔憂的地方,因為是什麼讓這些工程師研究人員如此高效?答案是計算能力。如果你和美國的任何一家人工智慧實驗室交談,他們都會說瓶頸在於計算能力。無論是DeepSeek的創始人,還是Qwen的領導層,都說過類似的話。他們都認為瓶頸在於計算能力。那麼問題來了,難道不應該讓美國公司憑藉更強大的計算能力率先達到Mythos等級,為我們的社會做好準備,趕在中國之前,因為中國計算能力較弱,這樣做不是更好嗎?黃仁勳:我們應該永遠爭第一,永遠擁有更多。但要讓你描述的結果成真,就必須走極端。他們必須完全沒有計算能力。如果他們有一些計算能力,問題在於需要多少?中國的計算能力非常龐大。要知道,中國可是全球第二大計算市場。如果他們想整合計算資源,完全可以滿足需求。而且,他們擁有的能源量簡直驚人,不是嗎?人工智慧本質上就是一個平行計算問題,不是嗎?既然能源是免費的,為什麼他們不能把晶片的數量增加4倍、10倍甚至更多呢?他們擁有如此多的能源。他們的資料中心空空蕩蕩,電力卻依然充足。你知道他們有“鬼城”,他們的資料中心也一樣空置。他們的基礎設施容量如此龐大。如果他們願意,他們完全可以把更多的晶片集中起來,那怕是更落後工藝的晶片他們的晶片製造能力位居世界前列。半導體行業都知道他們壟斷了主流晶片市場。他們的產能過剩。因此,認為中國無法製造人工智慧晶片的說法完全是無稽之談。當然,如果你問我,如果全世界完全沒有計算能力,美國會不會更領先?但這根本不可能。這並非現實。他們現在的計算能力已經非常充足了。你所擔心的那個問題,他們所需的計算能力閾值,他們早已達到,甚至超過了。所以我認為你誤解了人工智慧的本質,它就像一個五層蛋糕,最底層是能源。能源充足時,晶片就足夠了;晶片充足時,能源就足夠了。例如,美國能源匱乏,這就是為什麼輝達必須不斷改進我們的架構,並進行這種極致的協同設計,以便在我們出貨的晶片數量有限的情況下——因為能源供應極其有限——實現每瓦吞吐量的驚人水平。但如果你的瓦數完全充足,而且是免費的,你又何必在意每瓦性能呢?你已經綽綽有餘了。你可以用舊晶片來做。所以7nm晶片本質上就是Hopper。Hopper的能力……我必須告訴你,如今的模型大多都是基於Hopper演算法訓練的,也就是Hopper演算法的生成。所以7nm晶片已經足夠好了。充足的能源是中國的優勢。Q:但問題在於,他們是否真的能夠生產出足夠的晶片。黃仁勳:但他們的確做到了。證據是什麼?華為剛剛經歷了公司歷史上業績最好的一年。Q:最先進的HBM一定需要EUV?黃仁勳:不對。完全不對。你可以把它們組合起來,就像我們把它們和NVL72組合起來一樣。他們已經展示了矽光子學技術,可以將所有這些計算能力連接起來,形成一台巨型超級電腦。你的前提完全錯誤。事實上,他們的AI研發進展順利。世界上最頂尖的AI研究人員,由於計算能力有限,反而創造出了極其智能的演算法。別忘了,我剛才說過摩爾定律每年大約推進25%。然而,憑藉卓越的電腦科學,我們仍然可以將演算法性能提升10倍。我的意思是,卓越的電腦科學才是關鍵所在。毫無疑問,MoE 是一項偉大的發明。毫無疑問,所有令人驚嘆的注意力機制都減少了計算量。我們必須承認,人工智慧的大部分進步都源於演算法的進步,而不僅僅是硬體的改進。既然大部分進步都來自演算法、電腦科學和程式設計,那麼他們龐大的人工智慧研究人員隊伍難道不是他們最根本的優勢嗎?我們都看到了這一點。DeepSeek 絕非無關緊要的進步。如果 DeepSeek 先在華為平台上發佈,那對我們國家來說將是災難性的。Q:為什麼會這樣?因為目前像 DeepSeek 這樣的模型,只要是開放原始碼的,就可以在任何加速器上運行。為什麼將來情況會改變呢?黃仁勳:假設並非如此。假設它是針對華為最佳化的,假設它是針對他們的架構最佳化的。那將使我們處於劣勢。你描述的情況在我看來是好消息。一家公司開發了一款軟體,開發了一個人工智慧模型,而它在美式技術堆疊上運行效果最佳。我認為這是好消息。但你卻把它設定為壞消息。現在我要告訴你壞消息:世界各地的人工智慧模型都是在非美國硬體上開發的,而它們在非美國硬體上運行效果最佳。這對我們來說是壞消息。Q:我感覺並沒有證據表明存在如此巨大的差異,足以阻止你更換加速器。美國實驗室正在所有雲平台、所有不同的加速器上運行他們的模型。黃仁勳:我就是證據。你拿一個針對輝達顯示卡最佳化的模型,然後試圖在其他顯示卡上運行它,這是行不通的。Q:但美國實驗室確實會這樣做。黃仁勳:它們的運行效果並沒有更好。輝達的成功就是最好的證明。人工智慧模型是在我們的技術堆疊上建立的,在我們的技術堆疊上運行效果也最好,這難道不合邏輯嗎?Q:Anthropic 的模型可以在 GPU 上運行,可以在 Trainium 上運行,也可以在 TPU 上運行。黃仁勳:要改變現狀,需要付出很多努力。但看看全球南方國家,看看中東地區。如果所有人工智慧模型在別人的技術堆疊上運行效果最佳,那麼你現在提出的“這對美國來說是件好事”的說法就太荒謬了。Q:但我不太明白這個論點。假設中國公司率先開發出下一代Mythos系統。他們率先發現了美國軟體的所有安全漏洞,但他們可以在輝達硬體上運行,然後把產品運往全球南方國家。他們用輝達硬體開發,這有什麼好處呢?好吧,它的確能在輝達硬體上運行——黃仁勳:這不好,這不好,我們不能讓它發生。Q:你為什麼認為它(指代輝達GPU)是完全可替代的,即使你不向他們供貨,華為也能完全替代?他們落後了,對吧?他們的晶片比你的差。黃仁勳:完全是這樣……現在就有證據。他們的晶片產業規模龐大。Q:你只要對比H200和華為910C的浮點運算能力、頻寬或記憶體容量就知道了,它們的性能大概只有前者的一半到三分之一。黃仁勳:他們用量更多。他們用的量是原來的兩倍。Q:你的論點似乎是,他們擁有巨大的能源,他們需要用晶片來填充這些能源。黃仁勳:而且他們很擅長製造業。Q:我相信最終他們肯定能在生產能力上勝過所有人。但現在還有這關鍵的幾年。黃仁勳:你所說的關鍵年份是指那一年?如果未來幾年至關重要,那麼我們必須確保在這關鍵的幾年裡,全世界所有的人工智慧模型都建立在美國的技術堆疊之上。人工智慧產業有五個層面,每個層面都必須成功。而最需要成功的層面實際上是人工智慧應用。你為什麼如此執著於那個人工智慧模型?那家公司?究竟是出於什麼原因?能源、晶片以及人工智慧研究人員的生態系統使這一切成為可能。Q:如果美國的計算能力存在瓶頸,那麼向中國出口晶片又如何能使美國保持領先地位呢?黃仁勳:我認為美國理應領先。美國的計算能力是世界其他任何地方的100倍。美國理應領先。好吧。美國確實領先。輝達致力於研發最先進的技術。我們確保美國實驗室能夠第一時間獲悉這些技術,並擁有優先購買權。如果他們資金不足,我們甚至會投資扶持他們。美國理應領先。我們希望竭盡所能確保美國保持領先地位。這一點您同意嗎?我們正在為此竭盡全力。你認為輝達是一家美國公司?好的。首先,為什麼我們不制定一個更平衡的監管政策,讓輝達能夠在全球範圍內取得成功,而不是讓美國放棄全球市場?你為什麼要讓美國放棄全球市場?晶片產業是美國生態系統的一部分,是美國技術領先地位的一部分,也是人工智慧生態系統的一部分,更是人工智慧領先地位的一部分。為什麼你們的政策和理念會導致美國放棄世界市場的大部分份額?將人工智慧與你剛才提到的任何東西相提並論都是荒謬的。Q:所以關鍵在於,現在賣晶片對我們長遠發展有何幫助?特斯拉長期以來一直向中國銷售性能卓越的電動汽車。iPhone在中國也暢銷,而且質量極佳。特斯拉並沒有造成中國市場的壟斷。中國仍然會生產自己的電動汽車,並且佔據主導地位。他們的智慧型手機也佔據主導地位。黃仁勳:今天我們開始對話時,您也承認輝達的處境非常特殊。您用了“護城河”這樣的詞。對我們公司而言,最重要的就是我們生態系統的豐富性,而這離不開開發者。全球50%的人工智慧開發者都在中國。美國不應該放棄這塊寶地。Q:但是我們在美國有很多輝達的開發者,但這並不妨礙美國實驗室未來使用其他加速器。事實上,他們現在就在使用其他加速器,這很好,也很棒。如果你向中國銷售輝達晶片,我不明白為什麼在中國就不能這樣做,就像Google可以使用TPU和輝達晶片一樣。黃仁勳:我們必須不斷創新,而且正如你可能知道的,我們的市場份額正在增長,而不是下降。那種認為即使我們在中國競爭,最終也會失去那個市場的想法……你不是在跟一個醒來就覺得自己是個失敗者的人說話。那種失敗者的態度,那種失敗者的假設,在我看來毫無道理。我們不是汽車。我們不是汽車。我可以今天買這個牌子的車,明天再買另一個牌子的車,這很容易。但電腦領域並非如此。x86 架構的存在是有原因的。ARM架構如此根深蒂固也是有原因的。這些生態系統難以替代。這需要耗費大量的時間和精力,而且大多數人都不願意這樣做。因此,我們的職責是繼續培育這個生態系統,不斷推進技術發展,從而在市場競爭中保持優勢。如果按照你描述的那種前提來劃分市場,我根本無法接受。這完全說不通。因為我不認為美國是失敗者,我們的行業也不是失敗者。這種失敗論調,這種失敗心態,在我看來毫無道理。Q:但他們之所以從你這裡購買是有原因的。我們有來自中國公司創始人的引述,他們表示公司在計算能力方面遇到了瓶頸。黃仁勳:因為我們的晶片更好。總的來說,我們的晶片更好。這一點毋庸置疑。如果沒有我們的晶片……您能承認華為今年的業績創下紀錄嗎?您能承認一大批晶片公司都上市了嗎?您能承認嗎?您是否也承認,我們過去在該市場佔據了很大的份額,而現在份額已經大幅下降?我們也可以承認,中國佔據了全球科技產業約40%的份額。為了美國科技產業的利益而放棄這個市場,是對我們國家的損害,是對我們國家安全的損害,也是對我們科技領導地位的損害。這一切僅僅是為了一家公司的利益。這在我看來毫無道理。Q:我有點糊塗了。感覺你好像在說兩件事。一是如果我們能參與競爭,我們的晶片性能會遠勝華為,所以我們肯定能贏下這場與華為的競爭。二是就算沒有我們,他們也會做同樣的事情。這兩件事怎麼可能同時成立呢?黃仁勳:這顯然是事實。如果沒有更好的選擇,你只能選擇唯一的選擇。這怎麼會不合邏輯呢?這明明很合乎邏輯。Q:他們想要輝達晶片的原因是,輝達晶片性能更好。黃仁勳:是的Q:更好的模型需要更多的計算資源。更多的計算資源意味著你可以訓練出更好的模型。黃仁勳:不,它就是更好。它更好,因為它更容易程式設計。我們擁有更好的生態系統。但無論“更好”指的是什麼,無論“更好”指的是什麼……當然,我們會把計算資源輸送給他們。那又怎樣?事實是我們能從中受益。別忘了,我們能享受到美國技術領先地位帶來的好處。我們能享受到開發者們在美國技術堆疊上工作的益處。隨著這些人工智慧模型擴散到世界各地,我們也能享受到美國技術堆疊因此成為最佳選擇帶來的好處。我們可以繼續推進和推廣美國技術。我認為這是一件好事。這是美國技術領先地位中非常重要的一部分。現在,你所倡導的政策導致美國電信行業基本上被排擠出了世界市場,以至於我們甚至無法掌控自己的電信業務。我認為這並不明智。這種做法有些目光短淺,而且導致了一些意想不到的後果,我現在正在向你描述這些後果,但你似乎很難理解。Q:好的,我們先退一步。問題的關鍵似乎在於,這裡既有潛在的收益,也有潛在的成本。我們正在努力弄清楚的是,收益是否值得付出成本?我想讓你們意識到潛在的成本。計算是訓練強大模型的輸入。強大的模型確實擁有強大的攻擊能力,例如網路攻擊。美國公司率先達到 Mythos 等級的能力是一件好事,現在他們決定暫緩發佈這些能力,以便美國公司和美國政府能夠在正式發佈該等級能力之前,更好地保護他們的軟體。如果中國擁有更強大的計算能力或更多的眾包計算資源,如果他們能夠更早地開發出類似 Mythos 那樣的計算模型並進行廣泛部署,那將會非常糟糕。這種情況沒有發生的原因之一是,由於像輝達這樣的美國公司,我們擁有了更強大的計算能力。這是將計算資源轉移到中國所要付出的代價。所以,我們暫且不談好處。您是否意識到這是一種潛在的代價?黃仁勳:我還要告訴你,潛在的代價是,我們允許人工智慧技術堆疊中最重要的一層——晶片層——拱手讓出整個市場——全球第二大市場——讓他們得以發展規模,建立自己的生態系統,從而使未來的人工智慧模型以與美國技術堆疊截然不同的方式進行最佳化。隨著人工智慧在全球擴散,他們的標準和技術堆疊將會超越我們,因為他們的模型是開放的。Q:我想我只是對輝達的核心工程師和CUDA工程師有足夠的信心,相信他們能夠進行最佳化——黃仁勳:如你所知,人工智慧不僅僅是核心最佳化。中國是全球最大的開放原始碼軟體貢獻國。這是事實。中國也是全球最大的開放模型貢獻國。這是事實。如今,它建立在美國的技術堆疊之上,也就是輝達的技術堆疊。這是事實。人工智慧技術堆疊的五個層面都至關重要。美國應該力爭拿下所有五個層面。它們都不可或缺。當然,最重要的層面是人工智慧應用層。這一層會滲透到社會各個角落,被應用最為廣泛,也將從這場工業革命中獲益最多。但我的觀點是,每一層都必須成功。如果我們嚇唬全國人民,讓他們覺得人工智慧就像核彈一樣,讓每個人都憎恨人工智慧、害怕人工智慧,我不知道這對美國有什麼好處。這只會害了美國。如果我們嚇得所有人都不敢從事軟體工程工作,因為人工智慧會扼殺所有軟體工程崗位——結果導致我們一個軟體工程師都沒有——那我們也是在害美國。如果我們因為電腦視覺完全免費,人工智慧的工作能力不會比放射科醫生差,就嚇跑所有人,讓大家都不想當放射科醫生,那我們就誤解了工作和任務之間的區別。放射科醫生的工作是照護病人,而任務是解讀掃描結果。如果我們對這一點理解如此深刻,嚇跑所有人去讀放射科,那麼我們將面臨放射科醫生短缺和醫療資源匱乏的問題。所以我的意思是,當你設定一個如此極端的前提,一切都從零到無窮大,最終只會嚇到人們,而這根本不是事實。生活並非如此。我們希望美國領先嗎?當然希望。我們需要在各個層面都保持領先地位嗎?當然需要。當然需要。今天你談到Mythos,是因為Mythos很重要。沒錯。太好了。但幾年後,我預言,當我們想要推廣美國技術體系,當我們希望美國技術走向世界——走向印度、走向中東、走向非洲、走向東南亞——當我們的國家想要出口,因為我們想要出口我們的技術,我們想要出口我們的標準時,我希望你我再次進行同樣的對話。我會詳細地告訴你今天的對話,告訴你你的政策和你的設想是如何導致美國毫無理由地拱手讓出世界第二大市場。我們不應該放棄。如果輸了,那就輸了。但我們為什麼要放棄呢?現在沒人主張非此即彼。沒人主張非此即彼,也就是說我們應該一直把所有東西都運到中國去。沒人主張那樣。我們應該始終擁有最先進的技術。我們應該始終擁有最多的技術,並且是第一。但我們也應該努力在全球範圍內競爭並取得勝利。這兩件事可以同時進行。這需要一些細緻入微的思考,一些成熟的態度,而不是絕對的。世界本來就不是絕對的。Q:因為受到各種限制(例如拿不到EUV光刻機),中國的晶片真的能出口到世界各地,從而確立行業標準嗎?黃仁勳:那我們直接看事實吧?Blackwell的光刻技術真的比Hopper先進50倍嗎?真的有50倍嗎?差遠了。我一直在重複這句話:摩爾定律已經失效了。從電晶體本身的性能來看,Hopper和Blackwell之間的差距大概是75%。兩者相隔三年,差距高達75%。Blackwell爾的性能是Hopper的50倍。我的觀點是,架構至關重要。電腦科學至關重要。半導體物理固然重要,但電腦科學才是重中之重。人工智慧的影響很大程度上源於計算棧,這也是CUDA如此高效、如此受人喜愛的原因。它是一個生態系統,一種計算架構,它提供了極大的靈活性,以至於如果你想徹底改變架構——比如建立類似MoE的架構、類似擴散的架構、或者建立解耦架構——你都能做到。這很容易。所以事實是,人工智慧不僅關乎底層架構,也關乎上層技術堆疊。如果我們擁有針對自身技術堆疊和生態系統進行最佳化的架構和軟體棧,那當然是好事,因為我們今天一開始就討論了輝達生態系統的豐富性。為什麼人們總是喜歡先寫CUDA?確實如此。中國的研究人員也是如此。但如果我們被迫離開中國,首先,這是一個政策錯誤。顯然,這會引發強烈反彈。這對美國來說後果很嚴重。它促進了中國的晶片產業發展,加速了其人工智慧生態系統的轉型升級,迫使其人工智慧生態系統專注於內部架構。現在亡羊補牢,為時未晚,但事已至此。未來你會看到,他們顯然不會止步于于此。他們的製造工藝很出色,他們會繼續在現有及更先進的工藝基礎上發展。先進工藝的差距有10倍嗎?答案是否定的。架構很重要,網路也很重要。這就是輝達收購Mellanox的原因。網路很重要,能源也很重要。所有這些都很重要。事情並不像你試圖簡化的那樣簡單。為什麼輝達不生產多種不同的晶片架構?Q:我們之前討論過台積電在記憶體等方面的瓶頸問題。所以,如果我們身處這樣一個世界:你已經佔據了N3的大部分份額——而且在某個時候你會進入N2時代,並佔據N2的大部分份額——你是否認為你可以回到N7時代,也就是利用舊工藝節點的剩餘產能,然後說:“嘿,人工智慧的需求如此巨大,而我們擴展前沿技術的能力卻無法滿足,所以我們要製造一個Hopper或Ampere架構的處理器,但要運用我們目前掌握的所有數值計算知識以及你提到的所有其他改進”?你認為這種情況會在2030年之前發生嗎?黃仁勳:沒必要。原因在於,每一代產品的架構都不僅僅侷限於電晶體的尺寸。它還涉及到大量的工程設計、封裝、堆疊、數值計算和系統架構。當產能耗盡時,想要輕易地回到之前的製程節點……那需要投入大量的研發資源,誰也負擔不起。我們有能力向前發展,但我認為我們負擔不起回頭路。現在,假設有一天,我們突然意識到:“我們再也無法擁有更多的產能了。”我會選擇回到7nm製程嗎?當然會毫不猶豫地選擇它。Q:我之前和人討論時,有人問過我一個問題:為什麼輝達不同時開展多個架構完全不同的晶片項目?比如,可以開發類似Cerebras的晶圓級晶片,也可以開發類似Dojo 的大型封裝晶片,還可以開發不使用 CUDA 的晶片。輝達擁有足夠的資源和工程人才來平行開發所有這些晶片。考慮到人工智慧和架構的未來發展方向難以預測,為什麼要把所有雞蛋都放在一個籃子裡呢?黃仁勳:哦,我們當然可以。只是我們沒有更好的辦法。我們能做所有這些事情,但效果並不理想。我們在模擬器裡模擬了所有情況,結果證明更糟。所以我們不會這麼做。我們現在做的正是我們想做的項目。如果工作負載發生巨大變化——我指的不是演算法,而是工作負載本身,而這取決於市場格局——我們可能會考慮增加其他加速器。例如,我們最近新增了Groq ,並且計畫將其整合到我們的 CUDA 生態系統中。我們現在這樣做是因為token價值飆升,可以採用不同的定價策略。就在幾年前token要麼是免費的,要麼價格非常低廉。但現在,我們的客戶群體各不相同,他們需要不同的解決方案。因為客戶收入很高——例如我們的軟體工程師——如果我能為他們提供響應速度更快的代幣,從而讓他們比現在更高效,我願意為此付費。但這個市場是最近才出現的。所以我認為我們現在有能力基於響應時間,將同一個模型劃分成不同的細分市場。這就是我們決定擴展帕累托前沿,並建立一個響應時間更快、但吞吐量更低的推理細分市場的原因。在此之前,更高的吞吐量總是更好的。我們認為,未來可能會出現平均售價(ASP)非常高的代幣,即使工廠的吞吐量較低,ASP 也能彌補這一點。這就是我們這麼做的原因。但除此之外,從架構角度來看,如果我有更多資金,我會加大對輝達架構的投入。Q:最後一個問題。假設深度學習革命沒有發生,輝達會做什麼?黃仁勳:加速計算,這和我們一直以來所做的一模一樣。我們公司的理念是摩爾定律將會……通用計算在很多方面都很出色,但對於很多計算任務來說,它並非理想之選。因此,我們將一種名為GPU(CUDA)的架構與CPU結合起來,從而加速CPU的工作負載。不同的程式碼核心或演算法可以解除安裝到GPU上執行。這樣一來,應用程式的運行速度就能提升100倍、200倍。這項技術有那些應用呢?顯然,它適用於工程、科學、物理、資料處理、電腦圖形學、圖像生成等各個領域。即使人工智慧今天尚未出現,輝達的規模也會非常龐大。原因相當根本,那就是通用計算的擴展能力已基本達到極限。而唯一的方法……或者說,實現這一目標的方法之一,就是通過領域特定加速。我們最初關注的領域之一是電腦圖形學,但還有許多其他領域。種類繁多,包括粒子物理和流體動力學、結構化資料處理,以及各種各樣能夠從 CUDA 中受益的演算法。我們的使命是真正將加速計算帶給全世界,推進通用計算無法勝任的應用,並擴展到足以幫助某些科學領域取得突破的水平。早期的一些應用包括分子動力學、用於能源勘探的地震資料處理、圖像處理等等,所有這些領域通用計算的效率都太低,無法勝任。如果沒有人工智慧,我會非常難過。但正因為我們在電腦領域取得了進步,深度學習才得以普及。我們讓任何研究人員、任何科學家、任何學生,無論身處何地,都能使用個人電腦或GeForce顯示卡,開展令人驚嘆的科學研究。這一根本承諾從未改變,絲毫未變。如果你看過GTC,就會發現它最初的部分完全與人工智慧無關。無論是計算光刻、量子化學,還是資料處理等等,都與人工智慧無關。而且這些內容仍然非常重要。我知道人工智慧非常有趣,也很令人興奮,但還有很多人在做著與人工智慧無關的重要工作,張量也不是唯一的計算方法。我們希望能夠幫助到所有人。 (芯榜)