AI行業的“超級碗”開始了,今天的主角是黃仁勳。
為了這個穿著黑色皮衣的男人,來自全球各地的科技行業創業者、從業者、開發者、科學家、投資人,還有輝達的客戶、合作夥伴以及媒體都匯聚在聖何塞這座小城。
黃仁勳在GTC 2025的演講開始時間是當地時間3月18日上午10點,但是清晨6點,Doges AI創始人亞伯拉罕·戈麥斯(Abraham Gomez)就趕到了SAP Center,只為能“搶到一個前排的好位置”,當時他排在全場第二。而到了早上8點,場館外隊伍已經排出了一公里。
音樂生成模型公司Wondera聯合創始人兼CEO Bill坐在觀眾席第一排,他特意穿著一件黑色皮衣,“只為致敬老黃”。
雖然現場觀眾熱情高漲,但黃仁勳並沒有像去年那樣——如同一個“搖滾明星”讓人異常狂熱。
他今年更想證明自己的判斷,證明輝達路線沒有問題,他全場說得最多的詞之一就是“scale up(擴大規模)”。
去年GTC,黃仁勳認為“未來是生成的”;而今年GTC,黃仁勳認為“AI正處於拐點之中”。
這次,黃仁勳主要發佈了三個方面的內容:
第一,Blackwell GPU已全面投入生產。“產量增長令人難以置信,客戶需求也令人難以置信,”黃仁勳表示,“理由很充分,AI正處於拐點之中,由於推理人工智慧以及推理人工智慧系統和 Agentic 系統的訓練,我們在人工智慧中需要進行的計算量要大得多。”
第二,搭載AI推理加速軟體Dynamo的Blackwell NVLink 72可提供NVIDIA Hopper 40倍的AI工廠性能。黃仁勳說:“隨著我們擴展AI,推理將成為未來十年最重要的工作負載之一。”而在介紹Blackwell Ultra的強勁性能時,黃仁勳又說出了那句經典台詞:“買得越多,省得越多。甚至比這更好——買得越多,賺得越多。”
第三,輝達制定年度路線圖,希望引導全球企業、開發者圍繞其規劃AI基礎設施。輝達正在建構三個AI基礎設施,分別用於雲、企業和機器人。
此外,輝達還發佈了兩款新的GPU:一是Blackwell Ultra GB300,這是去年發佈的Blackwell的升級產品;二是全新一代的晶片架構Vera Rubin以及Rubin Ultra。
黃仁勳對Scaling Law的信仰背後的秘密,就藏在歷經十幾代架構的晶片裡。
總體而言,黃仁勳的演講一直在圍繞著“大模型推理的極限計算”。
在AI推理中,從單一使用者到大規模部署,需要在性能與收益之間找到最佳平衡。系統既要確保使用者的快速響應,又要通過提升硬體(如FLOPS、HBM頻寬)和最佳化軟體(如架構、演算法)來提高整體吞吐量(Tokens per Second),以最大化規模化推理的經濟價值。
關於Scaling Law放緩的問題,黃仁勳也提出了跟業內截然相反的觀點,他認為:“由於新興的擴展方法和技術,人工智慧的改進速度比以往任何時候都快。”
黃仁勳最近的壓力並不小,在直播畫面之外,他在現場演講間隙多次喝水,演講最後,嗓音也略顯沙啞。
AI市場正從“訓練”轉向“推理”,AMD、英特爾、Google、亞馬遜等科技巨頭推出專用推理晶片降低對輝達的依賴。同時Cerebras、Groq、Tenstorrent等初創企業加速佈局AI加速器,而DeepSeek等AI公司則希望通過最佳化模型減少對昂貴GPU的需求。
這正是黃仁勳的壓力來源。
輝達在訓練市場佔據超過90%的份額,隨著推理領域競爭越來越激烈,黃仁勳自然不想把推理市場拱手相讓,正如會場入口標語:AI的下一站是什麼?從這裡開始。
以下是黃仁勳主題演講的重點內容,由「甲子光年」在GTC現場整理。
人工智慧是輝達近十年崛起的時代機遇。對於AI的前景,黃仁勳篤信不疑。本次GTC,黃仁勳一開場就將今年1月在CES上演講時用到的兩張PPT帶觀眾溫習了一遍:
第一張是AI的發展迭代處理程序,黃仁勳將其分為Perception AI(感知AI)、Generative AI(生成AI)、Agentic AI(代理AI)、Physical AI(物理AI)四大階段。
第二張是Scaling Law的三個階段,黃仁勳將其總結為Pre-training Scaling(預訓練擴展)、Post-training Scaling(後訓練擴展)、Test-time Scaling / Long Thing(測試時間擴展/長思考)。
關於Scaling Law,黃仁勳提出了跟業內截然相反的觀點。他聲稱,幾乎“全世界都誤解了”Scaling Law放緩的問題。黃仁勳認為,事實上由於新興的擴展方法和技術,人工智慧的改進速度比以往任何時候都快。
黃仁勳是堅定的Scaling Law的“信仰者”,這種信仰建立在全世界人工智慧的發展,都牢牢繫結於輝達的GPU業務的基礎上。
黃仁勳隨後概述了能“一步步”推理的AI的發展,並提到了推理和強化學習的需求如何推動人工智慧計算的需求。隨著人工智慧正經歷一個“拐點”,四大雲服務提供商對GPU的需求正在激增。黃仁勳預計資料中心建設的價值將達到1兆美元。
黃仁勳解釋道,NVIDIA CUDA-X GPU加速庫和微服務現在服務於每個行業。未來每家公司都會擁有兩家工廠:一家生產產品,一家生產AI。
AI目前正在走向世界,涉足機器人、自動駕駛汽車、工廠和無線網路領域。黃仁勳表示,AI最早涉足的行業之一是自動駕駛汽車。他補充道:“我們開發的技術幾乎被每一家自動駕駛汽車公司使用”,無論是在資料中心還是汽車領域。
黃仁勳宣佈了自動駕駛的一項重要進展:美國最大的汽車製造商通用汽車正在採用 NVIDIA AI、模擬和加速計算來開發下一代汽車、工廠和機器人。他還宣佈推出NVIDIA Halos,這是一款綜合安全系統,將NVIDIA的汽車硬體和軟體安全解決方案系列與其在AV安全領域的尖端AI研究結合在一起。
接下來是資料中心和推理。
黃仁勳談到了資料中心,他提到NVIDIA Blackwell已全面投入生產,並分享了來自眾多行業合作夥伴的系統。
對此黃仁勳心里美滋滋的,他還介紹了Blackwell如何支援極端擴展,“我們想這樣做的原因是為瞭解決一個極端問題,這就是所謂的推理。”
他解釋道,推理就是生成token,這對企業至關重要。生成這些token的人工智慧工廠必須以極高的效率和性能建造。隨著最新一代推理模型能夠思考和解決日益複雜的問題,對token的需求只會增長。
為了進一步加速大規模推理,黃仁勳發佈了NVIDIA Dynamo,這是一款用於加速和擴展AI工廠中AI推理模型的開放原始碼軟體。“它本質上是AI工廠的作業系統。”黃仁勳說。
輝達還發佈了兩款新的GPU:一是Blackwell Ultra GB300,這是去年發佈的Blackwell的升級產品;二是全新一代的晶片架構Vera Rubin以及Rubin Ultra。
Blackwell Ultra GB300將於今年下半年出貨,Vera Rubin將於明年下半年出貨,Rubin Ultra將於2027年下半年推出。
同時黃仁勳還公佈了接下來的晶片路線圖,其下下一代晶片的架構已經被命名為Feynman,將於2028年問世。該名字可能以著名理論物理學家理查德·費曼(Richard Feynman)命名。
輝達每一代GPU架構,都會採用著名科學家的名字來命名。Blackwell是輝達在去年GTC發佈的新架構,以美國統計學家David Harold Blackwell來命名。今年發佈的最新一代架構Rubin,是以“證實暗物質存在”的女性科學先驅薇拉・魯賓(Vera Rubin)來命名。
從2004年至今的十一年時間裡,輝達已經發佈了十三代晶片架構,包括Currie(居里)、Tesla(特斯拉)、Fermi(費米)、Kepler(開普勒)、Maxwell(麥克斯韋)、Pascal(帕斯卡)、Volta(伏特)、Turing(圖靈)、Ampere(安培)、Ada Lovelace(阿達·洛芙萊斯)、Hopper(霍珀)、Blackwell(布萊克威爾),以及今天的Rubin(魯賓),平均一年發佈一代多。
黃仁勳對Scaling Law的信仰背後的秘密,就藏在這十幾代架構的晶片裡。
Blackwell Ultra是去年發佈的Blackwell的升級版,但黃仁勳並沒有直接對比兩者的性能。輝達曾向媒體透露,單個Ultra晶片將提供與Blackwell相同的20 petaflops的AI性能,但HBM3e記憶體從192GB升級到了現在的288GB。與此同時,一個Blackwell Ultra DGX GB300“超級叢集”將提供與Blackwell版本相同的288個CPU、576個GPU和11.5 exaflops的FP4計算能力,但記憶體容量為從240TB升級到300TB。
輝達一直將Blackwell Ultra與2022年發佈的H100做對比。
根據官方資料,Blackwell Ultra提供了1.5倍的FP4推理能力,可顯著加快“AI推理”,NVL72叢集能夠運行一個互動式的 DeepSeek-R1 671B模型,只需十秒就能提供答案,而H100則需要1.5分鐘。輝達表示,這是因為Blackwell Ultra每秒可以處理1000個token,是H100的十倍。
輝達還將提供一個名為GB300 NVL72的單機架,該機架提供1.1 exaflops的FP4、20TB的HBM記憶體、40TB的“快速記憶體”、130TB/秒的NVLink頻寬和14.4 TB/秒的網路。
由於Blackwell Ultra相比H100的壓倒性優勢,黃仁勳顯然也擔心客戶不再為H100買單,也擔心自己的銷售人員還賣不賣的出去H100。他調侃自己是“首席收入破壞者”,並表示在某些情況下,Hopper晶片其實也“還行”,但又補充道“情況並不多”。
接下來,黃仁勳說出了那句經典台詞:“買得越多,省得越多。它甚至比那更好。現在,買得越多,賺得越多。”
輝達的下一代架構Rubin是一個全新架構。黃仁勳說,“基本上,除了機架外,所有東西都是全新的。”
Rubin的FP4算力達到50千兆次,高於Blackwell的20千兆次浮點運算。Rubin Ultra將採用單晶片,該晶片實際上包含兩個連接在一起的Rubin GPU,其性能達到100千兆次FP4,是前者的兩倍,同時記憶體接近四倍,達到1TB。
完整的NVL576 Rubin Ultra機架可提供15 exaflops的FP4推理和5 exaflops的FP8訓練,輝達稱其性能是今年推出的Blackwell Ultra機架的14倍。
如何在晶片之上擴展到更大的系統?黃仁勳提到將光子學(一種依靠光而不是電訊號傳輸資料的網路技術)緊密整合到加速計算基礎設施中。輝達發佈的Spectrum-X和NVIDIA Quantum-X矽光子網路交換機融合了電子電路和光通訊,使AI工廠能夠跨站點連線百萬個GPU,同時降低能源消耗和營運成本。
“這真是一項瘋狂的技術。”黃仁勳說道。與傳統方法相比,輝達光子交換機整合了光學創新技術,雷射器數量減少了4倍,從而實現了3.5倍的功率效率、63倍的訊號完整性、10倍的大規模網路彈性和1.3倍的部署速度。
除了雲端晶片與資料中心外,輝達還推出了搭載NVIDIA Grace Blackwell平台的DGX個人AI超級電腦,讓AI開發人員、研究人員、資料科學家和學生能夠在桌面上對大型模型進行原型設計、微調和推理。
黃仁勳將其描述為“完美的聖誕禮物”,並同時推出了DGX Spark(前身為Project DIGITS)和DGX Station,後者是一款搭載NVIDIA Blackwell Ultra平台的全新高性能NVIDIA Grace Blackwell桌面超級電腦。使用者可以在本地運行這些模型,也可以將它們部署在NVIDIA DGX Cloud或任何其他加速雲或資料中心基礎設施上。
“這是AI時代的電腦。”黃仁勳說。
華碩、戴爾和惠普將與Boxx、Lambda和Supermicro一起銷售台式電腦版本。
面向AI agent,黃仁勳還發佈了具有推理能力的開源Llama Nemotron模型系列,為開發人員和企業提供一個業務就緒的基礎,建立獨立工作或作為連接的團隊解決複雜任務的高級AI agent。
NVIDIA Llama Nemotron推理系列基於Llama模型,提供按需人工智慧推理功能。輝達在培訓後增強了新的推理模型系列,以改進多步驟數學、編碼、推理和複雜的決策。
這一改進過程使模型的精準率較基礎模型提升高達20%,推理速度較其他領先的開放推理模型提升5倍,推理性能的提升意味著模型可以處理更複雜的推理任務,增強決策能力,降低企業的營運成本。
領先的Agentic AI平台先驅——包括埃森哲、Amdocs、Atlassian、Box、Cadence、CrowdStrike、德勤、 IQVIA、微軟、SAP和ServiceNow——正在與 NVIDIA 合作開發其新的推理模型和軟體。
黃仁勳將機器人描述為下一個價值10兆美元的產業,並表示到本世紀末,全球將至少缺少5000萬名工人。輝達提供了一套完整的技術,用於訓練、部署、模擬和測試下一代機器人技術。
黃仁勳在一段視訊中宣佈推出輝達Isaac GR00T N1,這是世界上第一個開放、完全可定製的通用人形推理和技能基礎模型。他表示:“通用機器人時代已經到來。借助輝達Isaac GR00T N1和新的資料生成和機器人學習框架,世界各地的機器人開發人員將開闢人工智慧時代的下一個前沿。”
輝達還宣佈發佈全新Cosmos世界基礎模型,為物理AI開發引入開放且完全可定製的推理模型,並賦予開發人員對世界生成前所未有的控制權。
黃仁勳表示:“使用Omniverse來調節Cosmos,並使用Cosmos來生成無限數量的環境,使我們能夠建立有根有據、由我們控制,但同時又系統地無限的資料。”
他還介紹了與GoogleDeepMind和迪士尼研究中心共同開發的用於機器人模擬的Newton開源物理引擎,然後,一個名叫“藍色”的微型機器人從地板上的一個艙口鑽出來,向黃仁勳發出嘟嘟聲。
這個小傢伙去年GTC就來過黃仁勳演講現場,今年它再次成功吸引了全場的目光,大家都紛紛拿出手機拍攝。
輝達的發展史,就是不斷為其GPU尋找應用場景的歷史。在十多年前,黃仁勳通過AlexNet找到了人工智慧。而今天,黃仁勳為輝達下一個十年尋找的場景,就是機器人與物理AI。
這一次,輝達還能得償所願嗎?
但黃仁勳顯然信心滿滿,會場內迴蕩的一首歌曲似乎就是黃仁勳的內心獨白:
I'll put my armor on show you how strong I am
我會全副武裝讓你看看我有多堅強
I'll put my armor on I'll show you that I am
我會嚴陣以待讓你看看我
I'm unstoppable
我勢不可擋 (封面圖及未標註圖片來源:輝達及「甲子光年」拍攝) (甲子光年)