黃仁勳重新定義輝達。
比預定的時間晚了幾分鐘,黃仁勳來到了GTC媒體會的現場,在回答媒體提問之前,他要了一杯加冰的可樂。
黃仁勳本人不喜歡接受採訪,所以每年GTC媒體會成為了全球媒體為數不多可以向他本人提問的機會。
從輝達最新發佈的GPU Rubin以及將在2028年發佈的GPU Feynman開始,黃仁勳回答了AI基礎設施與工廠化、GPU與AI的未來、全球供應鏈與合作、AI與能源、物理AI與機器人以及輝達的定位與核心競爭力等問題。
黃仁勳重新定義了輝達:“我們不是一家晶片公司,而是一家演算法公司。”
他在會上反覆向媒體強調AI工廠的概念,他認為AI工廠是數字經濟的新引擎,資料中心將會升級為AI工廠,它們不僅僅是託管應用,而是直接創造收入。
這也引發了媒體的質疑,有媒體記者提問:“輝達正在發生轉變,不僅提供世界領先的晶片,還提供演算法、基礎設施和軟體,正在成為一站式AI解決方案提供商。這對公司的未來意味著什麼?輝達之所以偉大,在於它一直是一個成功的平台,受到廣泛歡迎。而現在,你們正在進入部分客戶的領域,如果在某些方面成為他們的競爭對手,他們會如何反應?”
黃仁勳對這個問題給出很高的評價,並回應:“我們是全球唯一一家與所有AI公司合作的AI公司。”
而談到中國時,黃仁勳說:“我們能做的就是始終確保合規,並全力在市場中服務客戶。”他還肯定了中國的AI研究:“全球50%的AI研究人員來自中國,沒有任何其他國家能接近這個比例。據此可以推測,未來大量AI研究成果將來自中國。”
黃仁勳在大約一個小時的媒體會上顯得有些疲憊,他坦言:“這兩天裡我只攝入了大約100卡路里的食物。”
但他依然強調這次GTC非常重要,它展示了輝達從電腦技術公司向AI基礎設施公司的轉型,展現了資料中心如何從資料訪問和應用託管進化為AI工廠,他希望大家見證一個全新行業的崛起。
比較遺憾的是,在今天的媒體會上,黃仁勳沒有回答任何中國大陸地區媒體的提問。
「甲子光年」現場參加了媒體會,並精選了部分問答內容。為了方便閱讀,相關內容做了不改變原意的翻譯、編輯和備註。
問:為什麼輝達能夠如此快速地推出新軟體?你們有多少軟體工程師?
黃仁勳:輝達製造晶片,但我們不是一家晶片公司,而是一家演算法公司。
我們是目前全球電腦圖形學領域最領先的演算法開發者。當GoogleDeepMind和迪士尼研究院(Disney Research)想要合作開發高精度物理演算法時,他們最終選擇了輝達。
再舉個例子,計算光刻(註:Computational Lithography,是一種利用計算技術來最佳化和改進光刻工藝的方法)。輝達是唯一一家與所有計算光刻公司都合作的企業,而計算光刻正是“逆向物理”(註:Inverse Physics,已知輸出,反推出系統輸入或系統參數的過程)的典型應用。我們在物理學、逆向物理學、電腦圖形學和光線追蹤等領域都非常擅長,而這些技術本質上都涉及物理學——無論是正向物理(forward physics)還是逆向物理(inverse physics)。
我們擅長演算法,將所有演算法知識提煉到一個通用架構CUDA,並沿此框架拓展。在許多方面,我們從演算法和數學的角度看待計算世界。這也是為什麼當深度學習興起時,我們能迅速適應。
我們擁有數百名人工智慧研究人員,並且比許多公司更早開始研究。
在擴散模型流行之前,你可能見過我們在漸進式增長(註:Progressive Growth, 通常指的是通過逐步增加複雜性或能力來改進AI系統的性能或表現)方面的早期研究,擴散模型正是其中的一種漸進式方法。
你可能也見過我們在變分自編碼器(註:Variational Autoencoders,VAE,是一種基於機率圖模型的深度生成模型)方面的研究。
通常,很多公司的CEO不會談論這些內容,但我們的研究是先鋒性的,我們對演算法領域非常熟悉,這是輝達的核心競爭力,我們的基礎是數學。
輝達是少數幾家能夠完整設計從處理器、交換機到網路整個計算系統的公司。我們開發網路演算法和協議,擅長髮明新網路協議,並在此基礎上設計自己的交換機,將網際網路拓展為“超級網際網路”。
輝達之所以能快速創新,正是因為我們從底層演算法出發,全面掌握計算系統。
我認為晶片設計反而是次要的。雖然我們對此感到自豪,且能製造極其複雜的晶片,但我們真正的優勢在於解決問題的能力,包括製造體系的最佳化。
問:輝達每年都會推出新一代加速產品,與此同時,儲存器製造商是否需要同步升級?你們在系統設計和供應鏈協作中的關係有多緊密?供應規模的增長是否推動了生產整合度(PII)?
黃仁勳:合作關係非常緊密。如果我向他們明確提供了輝達的產品路線圖,這種關係會變得更加緊密。這正是我向全球公佈輝達未來三到四年發展規劃的原因。
第一,我們已經不再只是製造晶片的廠商,發展模式也不再是購買晶片,將其安裝到電腦中,然後銷售電腦。
我們正在建構的基礎設施規模非常龐大,部署規模達到了數千億美元,因此規劃必須做到極致完善。AI基礎設施並不是今天決定購買,明天就能部署的。它需要提前兩年投資,並進行全方位的規劃,然後在合適的時間完成部署。這意味著所有相關資訊必須保持一致,我們需要協同規劃,共同打造這一基礎設施。
我的產品迭代周期需要同時考慮上游和下游的多年規劃。
第二,我們是一家AI工廠。
這意味著,這家AI工廠可以直接幫助客戶創造收入。它不僅僅關乎某一塊晶片或某個產品,而是一個極其複雜的整體系統,這已經接近物理極限。
我們將相關產品的單位功率性能、單位能耗性能推向物理極限。這意味著如果你的功率受到自然法則的限制,事實上每家公司都面臨這種限制,那麼你能實現的最大收入也受到這個限制。因此,AI工廠的最佳性能直接決定了客戶收益的百分比。
我們正在打造AI工廠,而在這一領域,商業門檻、競爭門檻比以往任何時候都要高,而客戶的風險容忍度比以往更低。這是一個跨越多個投資周期,涉及數千億美元的基礎設施建設。
第三,AI是一項基礎性技術。
不僅對我們如此,對所有公司、所有行業都是如此,這也是為什麼這麼多合作夥伴齊聚在GTC,他們來自汽車、金融、零售等行業,我們已經成為眾多企業賴以建構自身業務的基礎性公司。
這三個核心理念,是過去一兩年發生的重大變化。大家已經注意到,GTC的氛圍發生了明顯變化,現場影響力、活力以及參與者的構成都已不同往昔。我認為,這種變化正是來自上面三個核心理念,而我也意識到了這一點,因此我決定調整我們對外溝通的方式。
我們是歷史上首家一次發佈四代產品的科技公司。這就像……你想想看,有人站出來說:“今天,我要發佈我未來幾年的所有工作流。”這似乎聽起來毫無道理,但我們必須這樣做。
問:輝達正在發生轉變,不僅提供世界領先的晶片,還提供演算法、基礎設施和軟體,正在成為一站式AI解決方案提供商。這對公司的未來意味著什麼?輝達之所以偉大,在於它一直是一個成功的平台,受到廣泛歡迎。而現在,你們正在進入部分客戶的領域,如果在某些方面成為他們的競爭對手,他們會如何反應?
黃仁勳:非常感謝你的提問。顯然,我們在解釋我們所做的事情上做得很糟糕。
實際上,我會這樣描述。輝達是唯一一家同時擁有雲端AI、汽車AI、機器人AI和企業AI的AI公司。正如你所說,我們是全端的,擁有完整的基礎設施、網路、交換機,現在還包括儲存技術,當然還有計算技術,涵蓋從小型DGX Spark(註:輝達最新推出的桌面個人AI超級電腦)SuperPOD(註:輝達為支援大規模 AI 和高性能計算任務而設計的超級計算叢集)各種形態。
從多個層面來看,我們在整個技術堆疊和各個行業中提供基礎技術。然而,關鍵在於,我們雖然建構了完整的技術體系,但始終以客戶希望的方式將其提供給世界。
我們不是一家解決方案公司,我們提供核心技術,並與生態系統合作建立解決方案。
這就是為什麼在企業網路領域,我們與思科合作;在企業計算領域,我們與戴爾、HPE、聯想合作;在儲存領域,我們與DDN、NetApp、戴爾EMC、日立、IBM等公司合作。
這也是為什麼雖然我們是一家AI公司,但Salesforce、ServiceNow、SAP、Cadence、Synopsys等企業依然是我們的AI合作夥伴。我們將核心技術開放,讓他們整合到自身解決方案中,並推向市場。
我們是全球唯一一家與所有AI公司合作的AI公司。
我們能夠毫無障礙地適應任何客戶的需求,與任何企業合作,這正是輝達的獨特之處。我們不設限制,讓客戶以最適合他們的方式使用我們的技術。如果他們決定自主研發更多技術,減少對我們的依賴,我們也完全接受。
這就是為什麼我們在多個技術層面進行研發。無論是晶片、系統、系統軟體還是演算法,都由客戶決定他們需要那部分。他們可以選擇從我們這裡獲取兩項、三項、四項,甚至不獲取任何產品。我們的理念是:客戶可以自由選擇,但希望他們能從我們這裡採購所需的技術。
我們建構了大量核心技術,但目的不是取代客戶,而是賦能生態系統,使他們能夠更好地運作。
問:中國在AI方面雄心勃勃,正常情況下,輝達在中國市場將有巨大的機會。你能告訴我們,在中國,你對輝達和AI的願景是什麼嗎?這些願景是否會受到貿易戰和關稅的影響?
黃仁勳:我們的首要責任是經營好業務,遵守法律,盡最大努力競爭並服務客戶。全球局勢變得更加複雜,但這些並不是我們能左右的。我們能做的就是始終確保合規,並全力在市場中服務客戶。
我觀察到,全球50%的AI研究人員來自中國,沒有任何其他國家能接近這個比例。據此可以推測,未來大量AI研究成果將來自中國,僅僅因為其龐大的研究人員基數。在美國的每個AI實驗室,都有許多出色的來自中國的研究人員,毫無例外。無論中國是如何做到的,請繼續保持。
問:你在之前的受訪中提到了關稅,並表示短期內不會有實質性影響。我理解你對台積電的立場,你也提到了富士康,但畢竟美國的製造業能力仍然遠未達到理想水平,為什麼不會有實質性影響?
黃仁勳:我們擁有一個高度靈活的供應鏈網路。供應商不僅限於台灣地區,以及墨西哥、越南,而是分佈在多個國家或地區。關稅的具體影響取決於生產地、採購地以及最終產品的目的地。這其中涉及許多變數,最終受那國關稅影響,要看具體情況。
在短期內,根據我們目前所知的情況,我們不認為會有顯著影響。我們的供應鏈目前已具有很強的靈活性,而如果進一步增強本土製造能力,將使供應鏈更加完善。我們今年在增加製造能力上應該有所進展。
問:想瞭解輝達在美國的生產情況。台積電最近宣佈了在美國追加投資,並表示將繼續在亞利桑那州生產晶片。那麼,輝達會有多少產品在美國生產?
黃仁勳:我們具備在美國大規模製造的能力,但並非所有產品都會在美國生產。
問:近年來,輝達加深了與聯發科、富士康等企業的合作,同時也在全球投資越來越多的初創公司。能否分享這些合作夥伴關係和投資在當前階段對輝達的戰略意義?你希望實現那些目標?
黃仁勳:我們與台達電子、聯發科、台積電、富士康等公司合作,因為它們是世界一流的企業。
這種合作始於敬佩和尊重,已經持續了約30年,彼此之間自然會建立深厚的關係。就像大家知道的那樣,我是全球任職時間最長的科技公司CEO之一。
關於技術投資,我們關注具有創新能力的公司,特別是那些突破傳統創新路徑的企業,這與供應鏈合作並無直接聯絡。
我們選擇合作夥伴的唯一標準是卓越。通過合作,將他們的卓越與我們的能力結合,可以共同實現更偉大的目標。
輝達是一家規模相對較小的公司,全球僅有36000名員工,遠少於矽谷的大多數科技公司,我們的策略是只專注做必要的事情。
輝達不會為市場競爭而戰,那不是我們的風格。我們的員工不會談論爭奪市場份額,因為我們的目標是創造新事物。
如果某家公司打造了優秀的產品,我們會使用它,無論它是誰。我們與AMD、英特爾、博通、Marvell等公司合作,並與聯發科達成重要合作,共同開發新產品。
我們始終與各家公司合作,以便將有限的精力集中在世界上尚不存在的技術上。
問:最近有報導稱,輝達是收購英特爾聯盟成員之一,未來會發生什麼?
黃仁勳:我不知道這個消息的來源,但沒有人邀請我們加入任何聯盟。我不是說這不是真的新聞,但至少沒有人找過我。所以可能有其他人在參與,但我不清楚。或許有個計畫,但我沒被邀請。
問:輝達宣佈加入由xAI、黑石集團和微軟等共同參與的300億美元人工智慧基礎設施基金。想瞭解輝達在這個聯盟中的具體角色是什麼?
黃仁勳:這是一個投資合作,因為所有參與方都投入了資金。這個基金是一個投資工具,主要用於支援資料中心能源基礎設施的建設,而這需要大量資本。
AI行業需要大量資金和能源,至少需要龐大的資本投入。這個合作關係允許各方共同出資,幫助資助AI資料中心和AI工廠的建設、開發和資金支援。
輝達的角色之一是提供專業知識,同時也參與資本投入。這個行業的發展將離不開充足的資金支援。
問:我的問題關於輝達與通用汽車的合作,此前輝達也與Rivian、Lucid等廠商合作,這些車輛已上市。你認為未來消費者會因為汽車搭載輝達技術而購買,就像他們因為輝達或英特爾的晶片而選擇個人電腦一樣嗎?
黃仁勳:是,也不是。
我自己的車就沒有搭載輝達技術,我覺得完全沒問題,我的法拉利對我來說太重要了。(笑)
不過,我的Rimac Concept Two(註:一款高性能電動超級跑車)搭載了輝達技術,我對此很滿意。
首先汽車對人們而言是高度個性化的,它反映了個人風格和生活方式,因此技術並不能完全左右人們的購車選擇。
另一方面,在自動駕駛領域,汽車屬於機器人技術的一部分,這對我們來說至關重要。我們研究物理AI、機器人系統和自主系統已超過十年。
我們的戰略不僅針對汽車電腦,而是涵蓋三大電腦架構:機器人AI基礎設施、機器人AI模擬器和機器人AI電腦。
首先必須訓練AI,然後在部署之前,AI需要經過模擬測試,比如車要在虛擬道路上行駛,機器人要在虛擬廚房中操作。這種方法稱為Sim-to-Real adaptation,即通過模擬來訓練AI,再部署到真實環境中。
目前我們幾乎與全球所有機器人公司和汽車公司,在這三種電腦架構中至少有一種展開了合作。
我們甚至開發了完整的軟體系統。就像昨天發佈的,我們宣佈了全球首個通用人形機器人基礎模型GR00T N1,並建立了一個用於開發物理AI的平台——Cosmos。
在機器人系統中實現AI安全極具挑戰性,需要在晶片系統、作業系統、演算法、軟體堆疊、工具和方法論等方面實現多樣性、冗餘性、透明度和可解釋性。整個系統必須是可訪問的,以確保安全,這類似於航空的安全標準。未來人們將採用我們開發的系統。
我們在這一領域制定了嚴格標準,稱之為Halos(全端式綜合安全系統)。
我相信,這種專業能力未來將帶來巨大回報。如果機器人普及,我們希望它們是安全的。
我們在這個領域已投資十年。不論是四輪車、兩輪車、雙足機器人還是無腿機器人,無論是什麼機器人系統,我們都有適合的計算架構。
這已經成為一個價值數十億美元的業務,年收入已超5億美元。我相信,長期來看,它將成為輝達最大的業務之一,也是AI最重要的應用之一。
問:你昨天在主題演講談到了新一代晶片架構Vera Rubin,Vera Rubin似乎使用了台積電3奈米工藝,我想知道再下一代晶片架構Feynman是否會使用環繞式柵極電晶體(gate-all-around transistors)。如果是,我們能從這種新型電晶體中獲得怎樣的性能和優勢?
黃仁勳:如果我們使用新型電晶體,性能估計能提升20%。這個結果可以接受,但這不會改變核心問題。
雖然在大規模計算中,20%的提升是非常可觀的,但在AI工廠、AI基礎設施這樣規模的計算中,每個處理器都很重要,也就是說,在整體格局中,它們的重要性會相對降低。
原因是,管理所有這些處理器的開銷成為最關鍵的因素。擴展這些處理器系統是最困難的事情,如果擴展不到位,損失將是巨大的。
昨天我解釋過,應該始終先擴展(scale up)再縮小(scale down)。在將一百萬個GPU連接到網路之前,應該先在計算結構(fabric)上連接幾百甚至上千個GPU。
問:你能否為全球資料中心的能源供應提供一些建議?
黃仁勳:AI行業也是製造業,但它是工業化製造業,產品由機器製造,而製造業需要能源。
問題的關鍵不是某個國家是否想建造資料中心,而是他們是否希望參與這個新行業的生產。AI是一種生產活動,而生產需要能源。
那麼問題就變成:在所有需要消耗能源的行業中,國家更願意支援那一個?是用於生產水泥、鋼鐵,還是AI?這其實是一個選擇題。
我相信,在未來10年內,AI將成為一個兆美元等級的行業,並在全球範圍內發展。
問:根據當前資料中心行業的反饋,他們認為未來幾年內能夠實際支援的技術極限是什麼?
黃仁勳:目前一個資料中心的功率大約是250兆瓦,這是機架的上限,其餘的只是工程細節。
如果說一個資料中心的功率達到1吉瓦,那麼每個機架1吉瓦聽起來就是合理的限制。但關鍵在於,是否有必要將所有計算能力都集中在一個機架中?
如果縱向擴展非常高效,比如從72個GPU擴展到144、288、576個時仍然能保持良好的擴展性,那麼就應該儘可能地縱向擴展,目前的情況正是如此。
未來某一天,我們可能會發現縱向擴展的收益遞減。一旦達到這一臨界點,我們會擴展到大約4000個或更多的GPU,之後再橫向擴展,而不必過度堆疊計算單元的密度。
問:你認為行業未來四年將如何發展?
黃仁勳:我認為首先要做的事情是將推理能力融入一切。這樣做的好處是,我們不必給AI提供過於具體的提示,而是可以更專注於任務導向。可以建構具備不同技能的agent系統,並通過設定目標讓它們自主工作。
最佳化這樣的系統相當複雜,因為它受到多種約束,需要大量推理、最佳化和數學計算。但如果能明確兩個端點,AI就可以自動解決整個過程。
我認為下一代AI將具備更強的推理能力,能夠呼叫工具、訪問資訊,並生成所需的結果。這個過程涉及多步驟巢狀式推理,我對此感到非常興奮。這項技術的發展已觸手可及,各個核心元件正在不斷完善。
問:美國、歐盟、中國都在投入大量資金到AI基礎設施,這是否意味著誰投資最多,誰就能最先實現AGI(通用人工智慧)?
黃仁勳:你們知道世界上最聰明的人是誰嗎?你們在乎嗎?我認為這就是答案。
我相信我們需要實現AGI,這樣AI才能真正發揮作用,解決我剛才描述的問題,但最聰明的AGI可能並不是最重要的。我不確定自己是否僱傭了世界上最聰明的員工,也許有,但我不完全確定,而且我也不認為這對我來說那麼重要,我需要的是卓越的智能。
但我仍然相信,將智能應用於具體目標,如何選擇任務、制定戰略,仍然是最重要的。領域專業知識依然至關重要。我認為這才是世界上99%的真正價值所在,而不是單純地去尋找世界上最聰明的人。
所以我認為問題的關鍵不在於誰能最先實現AGI,我認為最重要的事情是投資未來,建設儘可能多的資料中心和原生AI電腦。
那麼,應該投入多少?5000億美元——這是全球今年在AI計算上投入的資金,並且增長速度極快。到2030年,這個數字可能達到1兆美元,而我相信,屆時100%的計算投資都應該是AI原生的。
我認為:第一,全球的計算資本支出應該全面向AI轉移;第二,AI遠不止是資料中心,AI是製造業。
AI在製造什麼?AI在製造智能。這些智能經過重組後,可以成為文字、故事、法律檔案、分析報告,如果正確建構,它還可以轉換為機器人行動,甚至是汽車的方向盤控制。
本質上,AI就是在製造tokens。那麼,全球GDP應該有多大比例用於製造智能?我認為比例應該非常大。這是我的觀點,也是我的信念。
如果今天這個預測看起來不合理,那可以回顧300年前,看看當時能源生產在全球GDP中的佔比。當時的“能源產業”只是依靠人力,比如體力勞動。但隨著時間推移,能源產業成為世界上最大的行業之一。它的本質是將物理能量轉換為電子能量,而現在,我們正在進入一個新的階段——將電子能量轉換為智能。
那麼,每年全球在GPU和AI計算基礎設施上的資本支出會是多少?我相信這將是數兆美元等級的產業。
這就是我的信念,我希望它能發生,因為我相信,當“智能製造業”成為現實,我們所有人都會因此受益。
問:在這波物理AI浪潮中,我們應將時間和資源集中在那個方向?
黃仁勳:AI的核心挑戰仍然是資料戰略和訓練戰略,這一點沒有改變。
過去幾年中,有人曾說資料已經用盡了,大家還記得嗎?這種說法非常荒謬,也沒有考慮到強化學習的作用。實際上我們現在幾乎擁有無限的資料來源,因為強化學習能夠不斷生成新的訓練資料。
強化學習的優勢在於,它可以通過可驗證的結果和獎勵機制不斷最佳化,而數學、定理和科學發現已經幫助人類解決了許多問題。例如,在遊戲領域,國際象棋比賽可以通過計算確定贏家,AI可以一直推演直到找到獲勝策略。這意味著,我們現在可以利用可驗證的方法生成無限量的資料,以訓練模型進行推理。
物理AI也面臨類似的挑戰,我們必須明確資料戰略和訓練戰略。
我之前談到過其中的一些方法,例如,通過人類示範、生成式AI和模擬技術,我們可以生成無限數量的相關場景。這類似於給AI一個代數問題,然後生成大量不同的代數練習題,讓AI必須逐步解決所有這些問題。
物理操作同樣可以採用類似的方法,比如訓練AI進行跑步,甚至教AI如何完成需要高度協調和關節控制的體育運動。這個過程中涉及資料戰略和訓練戰略。
此外還有一個關鍵環節:使用策略,即如何最有效地提示AI以生成正確的答案。這相當於現代的軟體程式設計方式,提示詞就是新一代的軟體程式語言。同樣,在物理AI領域,我們需要思考:如何提示AI進行物理推理?這些都是極具價值的研究方向。
問:你提到每次演講最喜歡的幻燈片是輝達的加速庫,它讓眾多研究人員、科學家和工程師在各個領域的研究成為可能。隨著進入Blackwell時代,你是否期待某個新領域被加入到這張幻燈片上?或者說,你期待的下一個被加速的行業是什麼?
黃仁勳:加速計算不僅僅是頂層的軟體和底層的晶片,它依賴於中間層。這類似於AI,它不僅僅是提示框和底層電腦,中間的模型至關重要。模型本身不是AI,但它對AI系統至關重要。
庫不是應用程式,但庫使應用程式及其數學計算成為可能。它可以是Spark的資料處理,可以是計算光刻、計算生物學、地震處理、逆向物理、CT重建等。它涵蓋了流體動力學、粒子物理學,每個庫對其領域來說都是不可或缺的。
我最期待的領域之一是電腦輔助藥物發現。
我這一代人和我的行業受益於電子設計自動化(EDA)。如果沒有Cadence、Synopsys以及隨後出現的Mentor Graphics和西門子等公司,我們無法建構這些複雜的晶片,也無法在沒有模擬和模擬工具(即數字孿生)的情況下實現這一切。沒有這些工具和庫,我們無法做到今天的一切。
如果我們為生物學建立類似的工具,讓醫生和生物學家能夠以數字孿生方式表示蛋白質、細胞、器官和組織,並能模擬從奈米到米、從納秒到年的生物過程,那將徹底改變製藥行業和醫療保健的方式。
我們最近與Arc Institute合作的Evo 2項目,已實現從蛋白質到細胞的數字孿生表示,並擴展到多細胞系統。當這種建模和規模複雜性達到新的層次時,我認為生物學將被徹底改變,所以我非常期待這個方向的發展。 (甲子光年)