【GTC】黃仁勳GTC十月主旨演講: 開啟AI新紀元, 新工業革命的藍圖

城主說|昨晚在華盛頓特區的GTC大會上,NVIDIA創始人兼CEO黃仁勳 整個行業描繪了一幅通向新工業革命的詳盡藍圖。在近兩個小時的演講中,他系統性地闡述了AI如何從根本上重塑計算範式,並行布了革命性的Blackwell平台,定義了“AI工廠”這一全新基礎設施概念。這是一次產品迭代,也是一場關於未來生產力、創新乃至國家競爭力的宣言。

昨晚做了這場演講, 輝達的市值已經馬上要突破5兆了..

核心觀點摘要
  • “人工智慧不是一個工具,人工智慧是工作。這是深刻的差異。實際上,人工智慧是可以真正使用工具的工人。”
  • “摩爾定律已經基本終結……我們稱之為極限協同設計。輝達是當今世界上唯一一家真正從一張白紙開始,可以同時考慮新架構、新晶片、新系統和新軟體的公司。”
  • “我這裡所說的電腦就是一個工廠。它運行人工智慧,其目的是為了生產儘可能有價值的代幣……這絕對是一個AI工廠。”
  • “一方面,GB200(Blackwell)是最昂貴的電腦。另一方面,它的令牌生成能力非常強大,以至於它以最低的成本生成令牌。”
  • “物理AI需要三台電腦:一台用於訓練模型,一台用於在數字孿生中模擬,一台用於操作機器人。這三台電腦都運行CUDA。”
  • “就像電力和網際網路一樣,人工智慧是必不可少的基礎設施。每家公司都會使用它。每個國家都會建構它。”
  • “從亞利桑那州和印第安納州的矽片到德克薩斯州的系統,Blackwell和未來輝達AI工廠的各個世代都將在美國製造。”

加速計算:超越摩爾定律的唯一路徑

演講的開篇,黃仁勳直指當前計算行業面臨的根本性挑戰:摩爾定律的終結。他指出,電晶體數量的增長已無法帶來同等的性能與功耗最佳化。“登納德縮放定律在大約十年前就已經停止了……那個時刻現在已經到來了。” 在這個物理定律的瓶頸期,傳統CPU的順序處理模式已難以為繼。

輝達的答案,是其耗費三十年心血建構的“加速計算”範式。黃仁勳強調,GPU本身固然重要,但其真正的護城河在於龐大而成熟的CUDA生態系統。“大多數人談論的是GPU。GPU很重要。但是如果沒有一個位於其之上的程式設計模型……開發者就不會以這個計算平台為目標。” 從用於晶片製造的計算光刻庫CuLitho,到加速SQL的CuDF,再到醫學影像的MONAI和量子計算的CuQuantum,英偉-達擁有超過350個專業庫。這構成了一個強大的軟體壁壘,使得各行各業的開發者能夠無縫利用GPU的平行計算能力,解決通用計算無法觸及的複雜問題。這不僅僅是硬體的勝利,更是生態的勝利。

“AI工廠”:新工業革命的核心基礎設施

黃仁勳此前提出的最顛覆性的概念,無疑是“AI工廠”。他徹底重塑了我們對資料中心的認知。傳統資料中心是資訊儲存和多種應用運行的通用設施,而AI工廠的目標則極為專一:生產智能。

“這絕對是一個AI工廠。它不像過去的資料中心……這個工廠只生產一種東西……那些被稱為令牌的數字。” 令牌,是AI理解和生成資訊的單位,可以是文字、圖像、化學結構,甚至是機器人的動作。黃仁勳認為,隨著AI模型從簡單的預訓練發展到需要大量計算進行“後訓練”和即時“思考推理”,對計算資源的需求正在經歷雙重指數增長:一是模型本身複雜度帶來的計算需求;二是模型越智能、應用越廣泛,使用者越多,從而產生的計算需求。

這個“良性循環”正以前所未有的壓力衝擊著全球的計算能力。“這個虛擬循環現在正在運轉。我們需要做的是大幅降低成本,這樣一來……通過降低成本來保持這個虛擬循環的運轉。” 因此,“AI工廠”的終極目標,就是以最低的成本、最快的速度,生產出最智能的令牌。

Blackwell平台:極限協同設計的革命性產物

為了實現AI工廠的極致效率,輝達推出了革命性的Blackwell平台。黃仁勳將之稱為“極限協同設計”的產物,其重要性被類比為“自IBM System 360以來最徹底的電腦重塑”。

協同設計意味著輝達不再僅僅設計晶片,而是將晶片、系統、高速互聯(NVLink)、網路(Spectrum-X)乃至整個機架作為一個單一的、完整的計算單元進行設計。“你不能僅僅設計晶片,然後寄希望於它上面的東西會變得更快……我們需要復合指數,以保持這個虛擬循環的持續。” 這種全端式的協同設計,帶來了驚人的性能飛躍。黃仁勳引用第三方基準測試資料稱,Grace Blackwell(GB200)的性能是上一代H200的10倍。

更關鍵的商業邏輯在於成本。“一方面,GB200是最昂貴的電腦。另一方面,它的令牌生成能力非常強大,以至於它以最低的成本生成令牌。” 這種極致的性價比,確保了AI“良性循環”得以持續,也讓Blackwell成為全球雲服務商和AI公司建設下一代AI工廠的核心引擎。

物理AI:當數字智能遇上現實世界

黃仁勳的視野並未侷限於數字世界。他提出了“物理AI”的概念,即讓AI理解並與物理世界互動,這標誌著人工智慧應用的下一個巨大浪潮。實現物理AI,需要一個全新的計算架構。“物理AI需要三台電腦。一台電腦來訓練它……一台能夠執行模擬的電腦……然後您就需要操作該機器人。” 這三台電腦分別是:用於訓練的Blackwell超級電腦、用於在數字孿生環境中模擬和驗證的Omniverse電腦,以及部署在機器人或自動駕駛汽車中的Jetson Thor機器人電腦。

這一戰略構想已經催生了龐大的生態系統。在工業領域,輝達通過Omniverse DSX平台,與西門子、富士康等企業合作,在數字孿生中設計、建造和營運機器人化工廠。在人形機器人領域,與Figure、Agility Robotics等前沿公司合作,為其提供從訓練、模擬到端側部署的全端支援。而在自動駕駛領域,通過發佈Drive Hyperion標準平台,並與Uber等巨頭合作,輝達正試圖建構一個全球性的“輪式機器人”網路。這標誌著AI正從雲端走向現實,成為驅動實體經濟變革的核心力量。

美國製造與展望未來:從Blackwell到Rubin

演講的一個重要主題是“美國製造”。黃仁勳詳細展示了Blackwell從亞利桑那州的晶圓製造,到德克薩斯州的系統組裝的全過程,並強調這是對美國製造業回歸和再工業化的貢獻。“川普總統要求我的第一件事就是把製造業帶回來……9個月後,我們現在在亞利桑那州全面生產Blackwell。” 這不僅是地緣政治考量下的供應鏈重塑,更彰顯了輝達掌控從設計到生產全鏈條的雄心。

而當世界還在驚嘆於Blackwell的強大性能時,黃仁勳已經揭開了下一代平台——Rubin的面紗。他展示了完全無線纜、100%液冷設計的Rubin機架,並承諾將以“每年一次”的節奏進行極限協同設計系統的迭代。“在我們拆解GB300的同時,我們正在準備Rubin,以便明年這個時候投入生產。” 這種毫不鬆懈的創新步伐,旨在確保輝達在AI計算領域的絕對領先地位,並持續降低令牌的生產成本。

從超越摩爾定律的加速計算,到定義新生產模式的“AI工廠”,再到連線字與現實的物理AI,黃仁勳為輝達乃至整個科技行業規劃了一條清晰而激進的路線圖。這不再是一個關於晶片的故事,而是一個關於建構新世界基礎設施的宏大敘事。新工業革命的引擎已經轟鳴,而輝達正手握方向盤。

天空之城全文整理版

美國創新的新篇章

美國,創新之地,在這裡,發明塑造命運,技術助力夢想騰飛。在貝爾實驗室,電晶體誕生,開啟了半導體時代,並催生了矽谷。海蒂·拉瑪重新構想了通訊,為無線連接鋪平了道路。IBM的System 360將通用電腦置於工業的核心地位。英特爾的微處理器推動了數字時代的發展。克雷的超級電腦拓展了科學的邊界。所以我們認為我們正處於這項技術的開端,我們將儘可能快地前進。

蘋果使計算個人化。“你好,我是Macintosh。”微軟打開了通往軟體新世界的窗口。早在網路出現之前,美國政府研究人員建構了阿帕網(ARPANET),連接了第一批電腦,這是網際網路的基礎。“一個iPod。一部電話。你明白了嗎?”然後又是蘋果。將一千首歌放進你的口袋,將網際網路握在你的手中。

每個時代,一次飛躍。“我們選擇在這個十年內登上月球並做其他的事情。不是因為它們容易,而是因為它們困難。”每次飛躍,美國領先。現在,下一個時代來臨了。由一項革命性的新計算模型啟動。“這很可能成為我們對電腦行業做出的最重要的貢獻。”“它很可能會被認為是一場革命。”機器學習是人工智慧的一個分支。幾乎看起來會思考的電腦。“計算資源的數量最終將推動這個領域。”

人工智慧。新的工業革命。其核心是輝達GPU。在美國發明。就像電力和網際網路一樣,人工智慧是必不可少的基礎設施。每家公司都會使用它。每個國家都會建構它。贏得這場競爭將是對我們能力的考驗,與太空時代曙光以來的一切都不同。而今天,人工智慧工廠正在崛起。在美國建造。為了科學家、工程師和夢想家。橫跨大學、初創企業和工業界。“我認為我們想要努力達到文明的新高度。”探索宇宙的本質。

現在,美國的創新者正在為富足掃清道路。拯救生命。將願景塑造成現實。伸出援手。並交付未來。我們很快將用無限的清潔能源為其提供動力。我們將把人類的足跡延伸到星辰。這是美國下一個阿波羅時刻。齊心協力,我們邁出下一個偉大飛躍。大膽地去往無人之境。一切都從這裡開始。

歡迎來到舞台,輝達創始人兼首席執行官,黃仁勳。

華盛頓特區!華盛頓特區,歡迎來到GTC。很難不對美國感到感傷和自豪,我得告訴你。剛才那個視訊很棒,對吧?謝謝。輝達的創意團隊做得非常出色。歡迎來到GTC,今天我們有很多內容要和大家分享。GTC是我們討論行業、科學、計算、當下和未來的地方。所以今天我有很多內容要和大家分享。

但在開始之前,我想感謝所有幫助贊助這次盛會的合作夥伴。你會在展會上看到他們所有人。他們來這裡是為了與你見面。而且非常棒的是,如果沒有我們所有的生態系統合作夥伴,我們就無法完成我們所做的事情。人們說,這是人工智慧的超級碗。因此,每一個超級碗都應該有一個精彩的賽前表演。你們覺得這個賽前表演怎麼樣?以及我們全明星的運動員和全明星陣容。看看這些人。不知何故,我變成了最健壯的。你們覺得怎麼樣?我不知道這是否與我有關。

加速計算:超越摩爾定律

正如你在視訊中看到的,輝達在60年來首次發明了一種新的計算模型。一種新的計算模型很少出現。這需要大量的時間和一系列的條件。我們觀察到,我們發明了這個計算模型,因為我們想要解決通用電腦,即普通電腦無法解決的問題。我們還觀察到,總有一天,電晶體的數量會繼續增長,但是電晶體的性能和功率將會下降。摩爾定律將不會繼續有效。受物理定律的限制。

那個時刻現在已經到來了。登納德縮放定律在大約十年前就已經停止了。事實上,電晶體的性能及其相關的功率已經大幅下降。然而,電晶體的數量仍在繼續增加。我們很久以前就觀察到了這一點。30年來,我們一直在推進這種我們稱之為加速計算的計算形式。我們發明了GPU,我們發明了名為CUDA的程式設計模型,並且我們觀察到,如果我們能夠加入一個處理器,該處理器可以利用越來越多的電晶體,應用平行計算,並將其加入到順序處理CPU中,那麼我們可以將計算能力擴展到遠遠超出現在的水平。

那個時刻真的到來了。我們現在已經看到了那個轉折點。加速計算的時代已經到來。然而,加速計算是一種完全不同的程式設計模型。你不能只是把CPU軟體,也就是手工編寫的、順序執行的軟體,放到GPU上,然後讓它正常運行。事實上,如果你只是那樣做,它實際上會運行得更慢。所以你必須重新發明新的演算法。你必須建立新的庫。事實上,你必須重寫應用程式,這也是為什麼它花了這麼長時間的原因。我們花了將近30年的時間才走到今天。但我們一次只處理一個領域。

這是我們公司的財富。大多數人談論的是GPU。GPU很重要。但是如果沒有一個位於其之上的程式設計模型,以及對該程式設計模型的專注,並保持其在各個世代之間的相容性。我們現在即將推出CUDA 13,CUDA 14。數億個GPU,運行在每一台電腦中,完全相容。如果我們沒有做到這一點,那麼開發者就不會以這個計算平台為目標。如果我們沒有建立這些庫,那麼開發者就不知道如何使用該演算法,以及如何最大限度地利用該架構。一個又一個的應用。我的意思是,這確實是我們公司的寶藏。

CuLitho,計算光刻。我們花了近7年時間才用CuLitho走到今天,現在台積電使用它,三星使用它,阿斯麥使用它。這是一個令人難以置信的計算光刻庫。製造晶片的第一步。用於CAE應用的稀疏求解器。CuOpt,一種打破了幾乎所有記錄的數值最佳化。旅行推銷員問題。如何在供應鏈中將數百萬種產品與數百萬客戶連接起來。Warp,用於CUDA的Python求解器,用於模擬。CuDF,一種DataFrame方法。基本上,加速SQL。DataFrame資料庫。這個庫是完全啟動AI的那個。CuDNN。其上的名為Megatron Core的庫使我們能夠模擬和訓練極其大型的語言模型。

這樣的例子還有很多。MONAI,真的,真的非常重要。世界上排名第一的醫學影像AI框架。順便說一句,我們今天不會過多地談論醫療保健,但請務必觀看金伯利的主題演講。她將會大量談論我們在醫療保健領域所做的工作。這樣的例子不勝列舉。基因組學處理。艾瑞爾,注意聽講。今天我們要在這裡做一件非常重要的事情。CuQuantum,量子計算。這只是我們公司350個不同庫的代表。這些庫中的每一個都重新設計了加速計算所需的演算法。這些庫中的每一個都使所有生態系統合作夥伴能夠利用加速計算。這些庫中的每一個都為我們開闢了新的市場。

讓我們來看看CUDA X能做什麼。是不是很棒?你所看到的一切都是模擬。沒有藝術,沒有動畫。這就是數學之美。這是深度的電腦科學,深度的數學,它令人難以置信的美妙。涵蓋了每個行業。從醫療保健和生命科學到製造業、機器人技術、自動駕駛汽車、電腦圖形,甚至是視訊遊戲。你看到的第一張照片是輝達運行的第一個應用程式。這就是我們在1993年開始的地方。我們一直堅信我們所嘗試做的事情。這花費了……很難想像你能看到第一個虛擬格鬥場景變得栩栩如生,而同一家公司相信我們今天會在這裡。這真是一段非常非常不可思議的旅程。我想感謝所有輝達的員工為你們所做的一切。這真是太不可思議了。

今天我們有很多行業要介紹。我將介紹人工智慧、6G、量子、模型、企業計算、機器人和工廠。讓我們開始吧。我們有很多內容要介紹。有很多重大消息要宣佈。很多新的合作夥伴會讓你非常驚訝。

拓展新邊界:從6G通訊到量子計算

電信是我們經濟、我們產業、我們國家安全的支柱和命脈。然而,自從無線技術誕生之初,我們定義了這項技術,我們定義了全球標準,我們將美國技術出口到世界各地,以便世界可以在美國技術和標準之上進行建設。這種情況已經很久沒有發生過了。如今,世界各地的無線技術,很大程度上是建立在外國技術之上。我們建立在外國技術之上的基本通訊結構。這種情況必須停止。我們有機會做到這一點。尤其是在這個根本性的平台轉變時期。

如你所知,電腦技術是幾乎每一個行業的基礎。它是科學最重要的工具。它是工業最重要的工具。我剛才說,我們正在經歷一個平台轉變。那個平台轉變應該是一生一次的機會,讓我們重返賽場。讓我們開始用美國技術進行創新。今天,我們宣佈我們將這樣做。我們與諾基亞建立了大型合作夥伴關係。諾基亞是世界第二大電信裝置製造商。這是一個3兆美元的產業。基礎設施價值數千億美元。世界各地有數百萬個基站。如果我們能合作,我們就能在這個令人難以置信的新技術之上進行建構,它從根本上基於加速計算和人工智慧。並且為了美國,為了讓美國成為6G下一場革命的中心。

因此今天,我們宣佈輝達推出了一條新的產品線。它被稱為輝達ARC。空中無線電網路電腦。空中無線電接入網電腦,ARC。ARC由三項根本性的新技術建構而成。Gray CPU、Blackwell GPU,以及我們專為該應用設計的ConnectX Mellanox ConnectX網路。所有這些使得我們能夠運行這個庫,我之前提到的這個名為Aerial的CUDAX庫。Aerial本質上是一個運行在CUDAX之上的無線通訊系統。我們將首次創造一台軟體定義的、可程式設計的電腦,它能夠同時進行無線通訊和人工智慧處理。這是完全革命性的。我們稱之為輝達ARC。

諾基亞將與我們合作,整合我們的技術,重寫他們的協議棧。這是一家擁有7000項基本必要5G專利的公司。很難想像在電信領域有比這更偉大的領導者了。所以我們將與諾基亞合作。他們將把輝達ARC作為他們未來的基站。輝達ARC也與AirScale相容,AirScale是諾基亞目前的基站。這意味著我們將採用這項新技術,並能夠用6G和人工智慧升級全球數百萬個基站。

現在,6G和人工智慧非常重要,因為我們將首次能夠使用人工智慧技術,用於RAM的人工智慧,以使無線通訊的頻譜效率更高。使用人工智慧、強化學習,根據周圍環境、交通、移動性、天氣等情況,即時、有針對性地調整波束成形,所有這些都可以被考慮進來,從而提高頻譜效率。頻譜效率消耗了全球約1.5%到2%的電力。因此,提高頻譜效率不僅可以提高我們通過無線網路傳輸的資料量,而無需增加必要的能量。

我們可以做的另一件事是,用於RAM的人工智慧是RAM上的人工智慧。這是一個全新的機會。記住,網際網路實現了通訊,但令人驚訝的是,像AWS這樣的智能公司在網際網路之上建構了一個雲端運算系統。我們現在將在無線電信網路之上做同樣的事情。這個新的雲將是一個邊緣工業機器人云。這是RAM上的人工智慧,第一個是用於RAM的人工智慧,以提高無線電頻譜效率,第二個是RAM上的人工智慧,本質上是用於無線電信的雲端運算。雲端運算將能夠直接延伸到邊緣,即沒有資料中心的地方,因為我們在世界各地都有基站。這個公告真是令人興奮。首席執行官賈斯汀·霍達,我想他就在房間裡的某個地方,感謝你們的合作。感謝你們幫助美國將電信技術帶回美國。這真是一次很棒的合作。非常感謝。這是慶祝諾基亞的最佳方式。

讓我們來談談量子計算。1981年,粒子物理學家、量子物理學家理查德·費曼設想了一種可以直接模擬自然的新型電腦。直接模擬自然,因為自然是量子的。他稱之為量子電腦。40年後,該行業取得了根本性的突破。40年後,就在去年,一個根本性的突破。現在製造一個邏輯量子位元是可能的。一個邏輯量子位元。一個相干、穩定且經過糾錯的邏輯量子位元。

現在,一個邏輯量子位元有時由10個,有時由數百個物理量子位元共同協作構成。正如你所知,量子位元,這些粒子非常脆弱。它們很容易變得不穩定。任何觀察,任何採樣,任何環境條件都會導致它失去相乾性。因此,它需要極佳的可控環境,並且現在還需要許多不同的物理量子位元協同工作,以便我們對這些所謂的輔助量子位元或辛德羅姆量子位元進行誤差校正,從而糾正誤差並推斷出邏輯量子位元的狀態。有各種不同類型的量子電腦。超導、光子、囚禁離子、穩定原子,各種不同的方式來建立量子電腦。

實際上,我們現在意識到,對於我們來說,將量子電腦直接連接到GPU超級電腦至關重要,這樣我們才能進行誤差校正,才能對量子電腦進行人工智慧校準和控制,才能共同進行模擬。正確的演算法在GPU上運行,正確的演算法在QPU上運行,這兩個處理器,兩台電腦並肩工作。這就是量子計算的未來。

有許多方法可以建構量子電腦。每種方法都使用量子位元(量子位)作為其核心建構塊。但無論採用何種方法,所有量子位元,無論是超導量子位元、囚禁離子、中性原子還是光子,都面臨著相同的挑戰。它們很脆弱,並且對噪聲極其敏感。今天的量子位元只能在幾百次操作中保持穩定。但解決有意義的問題需要數兆次操作。答案是量子糾錯。測量會干擾量子位元,從而破壞其中的資訊。訣竅是加入額外的糾纏量子位元,這樣測量它們就能給我們足夠的資訊來計算出錯誤發生的位置,而不會損壞我們關心的量子位元。這很棒,但需要超越當前最先進的傳統計算。這就是我們建構NVQ Link的原因,這是一種新的互連架構,可將量子處理器與NVIDIA GPU直接連接。量子糾錯需要從量子位元中讀取資訊,計算出錯誤發生的位置,並將資料發回以糾正它們。NVQ Link能夠每秒數千次地將太字節的資料傳送到量子硬體並從中接收,這是量子糾錯所必需的。其核心是CUDAQ,我們用於量子GPU計算的開放平台。利用NVQ Link和CUDAQ,研究人員將能夠做的不僅僅是糾錯。他們還將能夠協調量子裝置和人工智慧超級電腦來運行量子GPU應用程式。量子計算不會取代經典系統。它們將融合在一起,成為一個加速的量子超級計算平台。

哇,這真是一個很長的階段。你知道,首席執行官們,我們不僅僅是坐在辦公桌前打字。這是一項體力活。所以今天,我們宣佈NVQ Link。而這由兩件事促成。當然,這種互連可以進行量子電腦控制和校準、量子糾錯,以及連接兩台電腦,即QPU和我們的GPU超級電腦,以進行混合模擬。它也完全可擴展。它不僅僅為今天少量量子位元的數量進行糾錯。它為未來進行糾錯,在未來,我們將從今天擁有的數百個量子位元,擴展到未來的數萬個量子位元,數十萬個量子位元。因此,我們現在有了一個可以進行控制、協同模擬、量子糾錯並擴展到未來的架構。

在 CUDA Q 發明之後,行業支援令人難以置信。請記住,CUDA 是為 GPU、CPU、加速計算而設計的。基本上,使用兩個處理器來使用正確的工具來完成正確的工作。現在,CUDA Q 已經擴展到 CUDA 之外,以便我們可以支援 QPU,並讓兩個處理器,QPU 和 GPU,協同工作,並在幾微秒內來回移動計算。這是與量子電腦合作的必要延遲。因此,現在,CUDA Q 是一個令人難以置信的突破,被許多不同的開發者採用。我們今天宣佈有 17 家不同的量子電腦行業公司支援 NVQ 鏈路。而且,我對此感到非常興奮,有 8 個不同的美國能源部 (DOE) 實驗室。伯克利、布魯克海文、芝加哥費米實驗室、林肯實驗室、洛斯阿拉莫斯、橡樹嶺、太平洋西北、聖地亞哥國家實驗室。幾乎每一個能源部實驗室都與我們合作,與我們的量子電腦公司和這些量子控製器生態系統合作,以便我們可以將量子計算整合到科學的未來中。

好的,我還有一個額外的聲明要宣佈。今天,我們宣佈能源部正在與輝達合作,建造7台新的AI超級電腦,以推進我們國家的科學發展。我必須向克里斯·賴特部長致敬。他為能源部帶來了如此多的活力。一股能量的湧動,一股熱情的湧動,以確保美國再次引領科學。正如我所提到的,計算是科學的基本工具,我們正在經歷幾個平台轉變。一方面,我們將加速計算,這就是為什麼未來每一台超級電腦都將是基於GPU的超級電腦。我們將走向人工智慧,這樣人工智慧和基於原理的求解器、基於原理的模擬、基於原理的物理模擬不會消失,但它可以被增強、強化、擴展,使用替代模型、人工智慧模型協同工作。我們也知道,基於原理的求解器,經典計算,可以被增強,以使用量子計算來理解自然狀態。我們也知道,在未來,我們有如此多的訊號,如此多的資料需要從世界中採樣,遙感比以往任何時候都更加重要。這些實驗室不可能以我們需要的規模和速度進行實驗,除非它們是機器人工廠,機器人實驗室。所以所有這些不同的技術都在完全相同的時間進入科學領域。賴特部長理解這一點,他希望能源部抓住這個機會,增強自身能力,並確保美國保持在科學的最前沿。我想感謝你們所有人。謝謝。

人工智慧的本質:新計算堆疊與AI工廠

讓我們來談談人工智慧。什麼是人工智慧?大多數人會說人工智慧是一個聊天機器人,這是理所當然的。毫無疑問,ChatGPT 處於人們認為的人工智慧的最前沿。然而,正如你現在所看到的,這些科學超級電腦不會運行聊天機器人。它們將進行基礎科學研究。科學、人工智慧,人工智慧的世界,遠遠不止一個聊天機器人。當然,聊天機器人極其重要,而通用人工智慧從根本上來說至關重要。深入的電腦科學、強大的計算能力、偉大的突破對於通用人工智慧仍然是必不可少的。但除此之外,人工智慧還有更多。

事實上,我將用幾種不同的方式來描述人工智慧。你思考人工智慧的第一種方式是,它已經徹底改造了計算堆疊。我們過去做軟體的方式是手工編碼。手工編碼的軟體運行在CPU上。如今,人工智慧是機器學習、訓練、資料密集型程式設計(如果你願意這麼稱呼),由運行在GPU上的人工智慧訓練和學習。為了實現這一點,整個計算堆疊都發生了變化。注意到這裡沒有Windows。這裡沒有CPU。你看到的是一個完全不同的堆疊。

對於能源的需求,我們川普總統的政府在這方面功不可沒。他的親能源倡議,他認識到這個行業需要能源才能發展。它需要能源來發展,我們需要能源來取勝。他認識到這一點,並將國家的力量放在支援能源增長上,徹底改變了遊戲規則。如果沒有發生這些,我們可能已經陷入困境,我想為此感謝川普總統。

在能源之上是這些GPU,這些GPU連接到,建構到我稍後將向您展示的基礎設施中。在這個基礎設施之上,它由巨大的資料中心組成,很容易就是這個房間的許多倍大。大量的能源通過這種稱為GPU超級電腦的新機器轉換能源以生成數字。這些數字被稱為令牌。如果你願意,這就是語言,計算單元,人工智慧的詞彙。你幾乎可以對任何事物進行標記化。當然,你可以對英語單詞進行標記化。你可以對圖像進行標記化。這就是你能夠識別或生成圖像的原因。標記化視訊。標記化3D結構。你可以對化學物質、蛋白質和基因進行標記化。你可以對細胞進行標記化。對幾乎任何具有結構的事物,任何具有資訊內容的事物進行標記化。一旦你可以對其進行標記化,人工智慧就可以學習該語言及其含義。一旦它學會了那種語言的含義,它就能翻譯,就能像你與chatGPT互動一樣做出回應,並且能像chatGPT一樣生成內容。你看到chatGPT做的所有基本的事情,你所要做的就是想像如果它是一個蛋白質會怎樣?如果它是一種化學物質會怎樣?如果它是一個像工廠一樣的3D結構會怎樣?如果它是一個機器人會怎樣?如果令牌是理解行為並標記運動和動作會怎樣?所有這些概念基本上是相同的。這就是人工智慧取得如此非凡進展的原因。

在這些模型之上是應用。Transformer並非通用模型。這是一個非常有效的模型,但沒有萬能的模型。只是人工智慧具有普遍的影響。有非常多種不同類型的模型。在過去的幾年裡,我們享受了多模態的發明,並經歷了其創新突破。有非常多種不同類型的模型。有摺積神經網路(CNN)模型、組合神經網路模型、狀態空間模型、圖神經網路模型、當然還有多模態模型,以及我剛才描述的所有不同的分詞和令牌方法。你可以擁有在空間理解方面進行最佳化,從而為空間感知最佳化的模型。你可以擁有為長序列最佳化,在很長一段時間內識別微妙資訊的模型。有非常多種不同類型的模型。

在這些模型架構之上,是各種應用。過去的軟體,這是一個深刻的理解,對人工智慧的一個深刻觀察,即過去的軟體行業是關於創造工具的。Excel是一個工具。Word是一個工具。網頁瀏覽器是一個工具。我知道這些是工具的原因是因為你在使用它們。工具行業只有螺絲刀和錘子。工具行業只有這麼大。在IT工具的例子中,它們可以是資料庫工具,這些IT工具大約價值一兆美元左右。但人工智慧不是一個工具。人工智慧是工作。這就是深刻的差異。實際上,人工智慧是可以真正使用工具的工人。我真正感到興奮的事情之一是埃爾文在Perplexity所做的工作。Perplexity使用網路瀏覽器來預訂假期或進行購物,基本上就是人工智慧使用工具。Cursor是一個人工智慧,一個我們在輝達使用的巨大的人工智慧系統。輝達的每一位軟體工程師都在使用Cursor。它極大地提高了我們的生產力。它基本上是我們每一位軟體工程師生成程式碼的夥伴。而且它使用一個工具。它使用的工具叫做VS Code。所以Cursor是一個人工智慧,一個使用VS Code的巨大人工智慧系統。

那麼,所有這些不同的行業,這些不同的行業,無論是聊天機器人還是數字生物學(我們在其中有AI輔助研究人員),或者什麼是自動駕駛計程車?在自動駕駛計程車裡,當然它是不可見的,但顯然有一個人工智慧司機。那位司機正在工作。而他用來做這項工作的工具是汽車。所以我們直到現在所創造的一切,整個世界,我們直到現在所創造的一切都是工具。供我們使用的工具。有史以來第一次,技術現在能夠從事工作,並幫助我們提高生產力。機會清單還在不斷增加,這就是為什麼人工智慧涉及了資訊技術從未涉及的經濟領域。資訊技術是幾兆美元的產業,它位於一個價值一百兆美元的全球經濟體的各種工具之下。現在,人工智慧將首次參與到這個價值一百兆美元的經濟體中,並使其更具生產力。使其增長更快,規模更大。我們正面臨嚴重的勞動力短缺,擁有能夠增強勞動力的人工智慧將有助於我們的增長。

現在從科技行業的角度來看,有趣的是,除了人工智慧是解決經濟新領域的新技術之外,人工智慧本身也是一個新興產業。正如我之前解釋的那樣,這個令牌,在您對所有這些不同的資訊模態進行分詞之後,需要有一個工廠來生成這些數字。與過去的電腦行業和晶片行業不同,請注意,如果您看看過去的晶片行業,晶片行業僅佔數兆美元,或者數兆美元IT產業的百分之五到百分之十,甚至更少,大約百分之五。原因是使用Excel不需要太多的計算。使用瀏覽器不需要太多的計算。使用Word不需要太多的計算。我們進行計算。

但在這個新世界中,需要一台始終理解上下文的電腦。它無法預先計算。因為每次您使用電腦進行人工智慧時,每次您要求人工智慧做某事時,上下文都是不同的。所以它必須處理所有這些資訊。例如,在自動駕駛汽車的情況下,它必須處理汽車的上下文。上下文處理。你要求人工智慧執行的指令是什麼?然後它必須逐步分解問題,進行推理,制定計畫並執行它。每個步驟都需要生成大量的令牌,這就是我們需要新型系統的原因,我稱之為人工智慧工廠。

這絕對是一個人工智慧工廠。它不像過去的data center(資料中心)。它是一個人工智慧工廠,因為這個工廠只生產一種東西。與過去的data center(資料中心)不同,它無所不能,為我們所有人儲存檔案,運行各種不同的應用程式,你可以像使用電腦一樣使用該data center(資料中心)來處理各種應用程式。你可以用它來玩遊戲,可以用它來瀏覽網頁,可以用它來做會計。所以那是過去的電腦,一種通用的通用電腦。我這裡所說的電腦就是一個工廠。它基本上只運行一件事,它運行人工智慧,其目的是為了生產儘可能有價值的令牌,這意味著它們必須足夠智能。而且你希望以驚人的速度生產這些令牌,因為當你向人工智慧提出要求時,你希望它能做出回應。注意到在高峰時段,這些人工智慧的回應速度越來越慢,因為它需要為很多人做很多工作。所以你希望它以驚人的速度生產有價值的令牌,並且你希望它以具有成本效益的方式生產。我使用的每一個詞都與人工智慧工廠、汽車工廠或任何工廠相符。它絕對是一個工廠。這些工廠,這些工廠以前從未存在過。在這些工廠內部,堆積如山的都是晶片。

良性循環:驅動AI計算需求的指數級增長

這就引出了今天過去幾年裡發生的事情。事實上,去年發生了什麼?實際上,今年發生了一些相當深刻的事情。如果你觀察,在年初,每個人對人工智慧都有一些看法。這種看法通常是,它將會變得很重要,它將會是未來,而且不知何故,幾個月前,它進入了渦輪增壓狀態。這樣做的原因有幾個。首先,在過去的幾年裡,我們已經弄清楚如何讓人工智慧變得更聰明。而不是僅僅進行預訓練,預訓練基本上是說,讓我們把人類創造的所有資訊都拿來,讓AI從中學習。這本質上是記憶和泛化。這和我們小時候上學沒什麼不同。這是學習的第一個階段。預訓練從來不意味著,就像學前班從來不意味著是教育的終點一樣。預訓練,就像學前教育,僅僅是教你智力的基本技能,以便你理解如何學習其他一切。沒有詞彙,沒有對語言和如何溝通、如何思考的理解,就不可能學習其他一切。

下一步是後訓練。在預訓練之後的後訓練是教你技能。解決問題、分解問題、推理的技能,如何解決數學問題,如何程式設計,如何逐步思考這些問題,使用第一性原理推理。然後在那之後,計算才真正開始發揮作用。如你所知,我們中的許多人都上過學,就我而言,那是幾十年前的事了。但從那以後,我學到了更多,思考了更多,原因是,我們不斷地將自己置於新的知識中,我們不斷地進行研究,我們不斷地思考。思考確實是智力的全部。

因此,現在我們有了三種基本的技術技能。我們有這三種技術:預訓練,它仍然需要大量的計算。我們現在有後訓練,它使用甚至更多的計算。現在,思考會給基礎設施帶來難以置信的計算負載,因為它代表每個個體進行思考。因此,人工智慧思考推理所需的計算量確實非常巨大。現在,我過去常聽到人們說推理很容易。輝達應該做訓練。輝達將會做,你知道,他們真的很擅長這個,所以他們將會做訓練。推理很容易。思考怎麼會容易呢?反芻記憶的內容很容易。背誦乘法表很容易。思考很難,這也是為什麼這三個尺度,這三個新的尺度定律,所有這些都在全力推進,給計算量帶來了如此大的壓力。

現在,又發生了一件事。從這三個尺度定律,我們得到了更智能的模型。這些更智能的模型需要更多的計算。但是當你得到更智能的模型時,你獲得了更多的智能,人們會使用它……好像無論發生什麼,我都想第一個出去。開玩笑而已。我相信沒事。可能只是午飯。我的胃。剛才是我嗎?

那麼我剛才說到那兒了?你的模型越智能,使用的人就越多。現在更親民了。它能夠推理。它能夠解決以前從未學過的難題,因為它能做研究。去學習相關知識,回來,分解問題,推理如何回答你的問題,如何解決你的難題,然後去解決它。思考的量正在使模型變得更智能。它越智能,使用的人就越多。智能化程度越高,所需的計算就越多。

但事情是這樣的。去年,人工智慧行業迎來了一個轉折點。這意味著人工智慧模型現在足夠智能,它們正在創造價值,它們值得付費。輝達為每個Cursor的許可證付費,而且我們很樂意這樣做。我們很樂意這樣做,因為Cursor正在幫助一位年薪數十萬美元的員工,無論是軟體工程師還是人工智慧研究員,提高數倍的生產力。所以我們當然非常樂意這樣做。這些人工智慧模型已經變得足夠好,值得付費。Cursor、11 Labs、Synthasia、Abridge、Open Evidence,這樣的例子不勝列舉。當然,Open AI,當然還有Cloud。這些模型現在非常好,人們願意為之付費。

並且因為人們正在為它付費並更多地使用它,而且每次他們更多地使用它,你就需要更多的計算資源,我們現在有了兩個指數增長。這兩個指數增長,一個是三縮放定律帶來的指數級計算需求。第二個指數增長是,人越多,它就越智能,越多的人使用它,越多的人使用它,它就需要越多的計算資源。這兩個指數增長正在給世界的計算資源帶來壓力。正好發生在我之前告訴過你的摩爾定律已經基本終結的時候。所以問題是,我們該怎麼辦?

如果我們有這兩個指數級的需求增長,如果我們不,如果我們找不到降低成本的方法,那麼這個正反饋系統,這個循環反饋系統,本質上被稱為良性循環,這對於幾乎所有行業都是至關重要的。對於任何平台行業都至關重要。這對輝達至關重要。我們現在已經進入了CUDA的良性循環。應用程式越多,人們建立的應用程式越多,CUDA就越有價值,CUDA越有價值,購買的CUDA電腦就越多,購買的CUDA電腦越多,就越多的開發者想要為其建立應用程式。輝達在30年後終於實現了那個虛擬循環。我們也已經實現了這一點。15年後,我們為人工智慧實現了這一點。人工智慧現在已經進入了虛擬循環。

因此,你使用得越多,因為人工智慧很聰明,而且我們為此付費,產生的利潤就越多,產生的利潤越多,投入到網格計算中的計算力就越多,投入到人工智慧工廠中的計算力就越多,計算力越多,人工智慧就變得越聰明,越聰明就越多人使用它,更多應用程式使用它,我們就能解決更多問題。這個虛擬循環現在正在運轉。我們需要做的是大幅降低成本,這樣一來,當你提示人工智慧時,使用者體驗會更好,它能更快地響應你;二來,通過降低成本來保持這個虛擬循環的運轉,這樣它就能變得更聰明,這樣更多人使用它,諸如此類,等等。那個虛擬循環現在正在運轉。

Blackwell平台:極限協同設計的革命

但是當摩爾定律實際上已經達到極限時,我們該如何做到這一點呢?嗯,答案叫做協同設計。你不能僅僅設計晶片,然後寄希望於它上面的東西會變得更快。設計晶片時,你能做的最好的事情就是在幾年內增加,我不知道,50% 更多的電晶體。如果你增加了更多的電晶體,只是,你知道,我們可以增加更多的電晶體,而且台積電有很多電晶體,一家令人難以置信的公司。我們將繼續增加更多的電晶體。然而,這些都是百分比,而不是指數。我們需要復合指數,以保持這個虛擬循環的持續。

我們稱之為極端協同設計。輝達是當今世界上唯一一家真正從一張白紙開始,並且可以同時考慮新的基礎電腦架構、新的晶片、新的系統、新的軟體、新的模型架構和新的應用的公司。在這個房間裡的很多人來到這裡,是因為你是這個層級中不同的部分,與輝達合作的堆疊中不同的部分。我們從根本上自下而上地重新建構一切。然後,因為人工智慧是一個如此大的問題,我們將其規模擴大。我們創造了一台完整的電腦,一台首次擴展到整個機架的電腦。那是一台電腦,一個GPU。然後,我們通過發明一種新的AI乙太網路技術來擴展它,我們稱之為Spectrum X乙太網路。每個人都會說,乙太網路就是乙太網路。乙太網路根本就不是那麼回事。乙太網路,Spectrum X乙太網路是為AI性能而設計的,這也是它如此成功的原因。

即使那樣還不夠大。我們將用AI超級電腦和GPU填滿整個房間。這仍然不夠大,因為AI的應用數量和使用者數量正在持續呈指數級增長。我們將多個這樣的資料中心連接在一起,我們稱之為跨規模擴展。Spectrum XGS。千兆級規模。Spectrum X千兆級規模。XGS。通過這樣做,我們在如此巨大的規模、如此極端的水平上進行協同設計,其性能優勢令人震驚。不是每一代都提升50%。不是每一代提升25%。而是更多,更多得多。這是我們有史以來製造的,坦率地說,也是現代製造的最極致的協同設計電腦。自IBM System 360以來,我不認為有任何一台電腦像這樣被徹底地重新發明過。這個系統的創造極其困難。我馬上會向你展示它的好處。

但本質上我們所做的,本質上我們所做的,我們創造了……嗨,Janine,你可以出來了。你得走到我這裡,差不多一半的路程。好了,這有點像美國隊長的盾牌。因此,NVLink 72,如果我們建立一個巨大的晶片,一個巨大的GPU,它看起來會是這樣。這就是我們必須進行的晶圓級處理水平。太不可思議了。所有這些晶片現在都被放入一個巨大的機架中。是我做的還是別人做的?進入那個巨大的機架,你知道,有時我覺得我不是一個人在這裡。這個巨大的機架使所有這些晶片作為一個整體協同工作。這實際上是完全不可思議的。我會向你展示它的好處。所以,謝謝珍妮。我喜歡這個。好了,女士們先生們,珍妮·保羅。我明白了。將來,下次我就要像索爾那樣行動。就像你在家,搆不著遙控器,然後你就這樣示意一下,有人把它遞給你一樣,是的,就是這個意思。這種事從沒發生在我身上。我只是在做夢。我只是說說而已。

好的,總之,基本上,這是我們過去創造的東西。這是MVLink 8。現在,這些模型非常龐大,我們解決這個問題的方法是將這個模型,這個巨大的模型變成一大堆專家。這有點像一個團隊。所以,這些專家擅長處理某些類型的問題。我們把一大堆專家聚集在一起。所以,這個價值數兆美元的巨型人工智慧模型擁有所有這些不同的專家,我們將所有這些不同的專家都放在GPU上。現在,這是MVLink 72。我們可以把所有的晶片都放進一個巨大的結構中,每個專家都可以互相交流。所以,主專家,也就是主要的專家,可以和所有的工作以及所有必要的上下文、提示以及我們必鬚髮送給所有專家的一堆資料,一堆令牌進行交流。專家們會,無論那個專家被選中來解決答案,都會開始嘗試回應。然後它會一層又一層地進行下去。有時是8個,有時是16個,有時這些專家有時是64個,有時是256個。但關鍵是專家越來越多。

那麼,在這裡,MVLink 72,我們有72個GPU。正因為如此,我們可以在1個GPU中放入4個專家。對於每個GPU,你需要做的最重要的事情是生成令牌,這是你在HBM記憶體中擁有的頻寬量。我們有1個GPU為4位專家生成思考內容。相比之下,這裡因為每台電腦只能放置8個GPU,我們必須將32位專家放入1個GPU。因此,這個1個GPU必須為32位專家思考,而這個系統每個GPU只需要為4位專家思考。正因為如此,速度差異令人難以置信。

這才剛剛發佈。這是Semi-Analysis做的基準測試。他們做了一項非常、非常徹底的工作。他們對所有可以進行基準測試的GPU都進行了基準測試。結果發現數量並不多。如果你查看可以實際進行基準測試的GPU列表,會發現大約90%是NVIDIA。所以我們是在和自己比較,但世界上第二好的GPU是H200,它可以運行所有工作負載。Grace Blackwell每個GPU的性能是其10倍。現在,當電晶體數量只有兩倍時,你如何獲得10倍的性能?答案是極端協同設計。通過理解人工智慧模型未來的本質,我們在整個堆疊中進行思考,我們可以為未來建立架構。這是一件大事。

它表明我們現在可以更快地做出反應,但這甚至是一件更大的事。下一個。看看這個。這表明世界上成本最低的令牌是由Grace Blackwell和NVLink72生成的。最昂貴的電腦。一方面,GB200是最昂貴的電腦。另一方面,它的令牌生成能力非常強大,以至於它以最低的成本生成令牌。因為每秒token數除以Grace Blackwell的總擁有成本非常划算。這是生成token的成本最低的方式。這樣做可以提供令人難以置信的性能,是原有性能的10倍,成本降低到原來的1/10,這種良性循環得以繼續。

美國製造:重塑全球AI供應鏈

這就引出了下一個話題。我昨天才看到這個。這是CSP的資本支出(CapEx)。最近人們一直在問我關於資本支出(CapEx)的問題,這是一個很好的觀察角度。事實上,排名前6的CSP的資本支出,這6家分別是亞馬遜、CoreWeave、Google、Meta、微軟和甲骨文。這些CSP加起來將在資本支出方面投資這麼多。我認為現在的時機再好不過了。原因是現在我們已經全面量產Grace Blackwell NVLink 72,全球各地的供應鏈都在生產。因此,我們現在可以向他們所有人交付這種新架構,以便資本支出投資於能夠提供最佳TCO(總擁有成本)的儀器電腦。

在這之下,有兩件事情正在發生。所以當你看到這些時,它實際上非常非凡。無論如何,這都相當非凡。但下面發生的事情是這樣的。有兩個平台轉型同時發生。一個平台轉型是從通用計算到加速計算。記住,正如我之前向你提到的,加速計算可以進行資料處理,圖像處理,電腦圖形,它可以進行各種計算。它可以運行SQL,它可以運行Spark,你知道,你問它,你告訴我們需要運行什麼,我相當肯定我們為你準備了一個很棒的庫。你可能是一個試圖製造掩模來製造半導體的資料中心。我們為你準備了一個很棒的庫。因此,在不考慮人工智慧的情況下,世界正在從通用計算轉向加速計算。暫且不論人工智慧。

事實上,許多雲服務提供商(CSPs)早已擁有在人工智慧出現之前就已存在很久的服務。記住,它們是在機器學習時代發明的。像XGBoost這樣的經典機器學習演算法。像DataFrames這樣用於推薦系統的演算法。協同過濾,內容過濾。所有這些技術都是在通用計算的舊時代創造的。即使是這些演算法,即使是這些架構,現在通過加速計算也變得更好。因此,即使沒有人工智慧,世界各地的雲服務提供商(CSPs)也會投資於加速。輝達的GPU是唯一能夠完成所有這些以及人工智慧的GPU。而ASIC可能能夠做人工智慧,但它無法做任何其他的。輝達可以完成所有這些。這解釋了為什麼僅僅依靠輝達的架構是如此安全。

我們現在已經到達了我們的虛擬周期,我們的轉折點。這非常不尋常。我在房間裡有很多合作夥伴,你們都是我們供應鏈的一部分,我知道你們工作有多努力。我要感謝你們所有人。你們工作有多努力。非常感謝。現在我將向你們展示原因。這就是我們公司業務的現狀。由於我剛才提到的所有原因,我們看到了Grace Blackwell的非凡增長。它由兩個指數增長驅動。我們現在有了可見性。我認為我們可能是歷史上第一家能夠看到累計5000億美元的Blackwell以及到2026年Rubin早期增長的技術公司。如您所知,2025年尚未結束,2026年尚未開始。這就是帳面上的業務量。迄今為止,價值5000億美元。其中,我們已經在最初的幾個季度,我想是最初的4個季度,或者說是3個半季度的生產中,交付了600萬個Blackwell。2025年我們還有一個季度,然後我們有四個季度。接下來的五個季度,有5000億美元。5000億美元。

這是Hopper增長率的5倍。這在某種程度上說明了一些問題。這是 Hopper 的一生。這不包括中國和亞洲。這僅僅是西方。我們排除中國。Hopper,在其整個生命周期中,400萬個GPU,Blackwell,每一個Blackwell在一個大型封裝中都有兩個GPU。在 Rubin 的早期階段有 2000 萬個 Blackwell 的 GPU。驚人的增長。我要感謝我們所有的供應鏈合作夥伴,所有人。我知道你們有多努力。我製作了一個視訊來慶祝你們的工作。讓我們播放它。

人工智慧時代已經開始。Blackwell 是它的引擎。一項工程奇蹟。在亞利桑那州,它始於一塊空白的矽晶圓。數百道晶片處理和紫外光刻步驟建構起每個2000億個電晶體。在12英吋晶圓上一層又一層地堆疊。在印第安納州,HBM堆疊將被併行組裝。具有1024個I/O連接埠的HBM記憶體晶片採用先進的EUV技術製造。矽通孔用於後端,將12個HBM記憶體堆疊和基底晶片連接起來以生產HBM。同時,晶圓被劃片成單獨的Blackwell晶片,經過測試和分類。分離出好的晶片以繼續前進,晶片在晶圓上再到基板上的工藝將32個Blackwell晶片和128個HBM堆疊連接到定製的矽中介層晶圓上。金屬互連線直接蝕刻到其中,將Blackwell GPU和HBM堆疊連接到每個系統和封裝單元中,並將所有東西鎖定到位。然後,將該元件進行烘烤、模塑和固化,從而建立GB300 Blackwell Ultra超級晶片。

在德克薩斯州,機器人將全天候工作,在Grace Blackwell PCB上拾取並放置超過10,000個元件。在加利福尼亞州,用於橫向擴展通訊的ConnectX 8 SuperNIC和用於解除安裝和加速網路、儲存和安全的Bluefield 3 DPU被仔細地組裝到GB300計算托盤中。NVLink是輝達發明的突破性高速鏈路,用於連接多個GPU並擴展成一個大型虛擬GPU。NVLink交換機托盤由NVLink交換機晶片構成,提供每秒14.4太字節的全部互聯頻寬。NVLink主幹形成一個定製的盲插背板,用5,000根銅纜將所有72個Blackwell或144個GPU晶片連接成一個巨大的GPU,提供每秒130太字節的全部互聯頻寬,幾乎相當於全球網際網路的峰值流量。熟練的技術人員將每個部件組裝成一個機架級AI超級電腦。總共有120萬個元件,2英里的銅纜,130兆個電晶體,重約2噸。

從亞利那州和印第安納州的矽片到德克薩斯州的系統,Blackwell和未來輝達AI工廠的各個世代都將在美國製造。書寫美國歷史和工業的新篇章,美國回歸製造和再工業化。被人工智慧時代重新點燃。人工智慧時代已經開始。美國製造。為世界製造。

我們再次在美國進行製造。這真是不可思議。川普總統要求我的第一件事就是把製造業帶回來。把製造業帶回來,因為它對國家安全至關重要。把製造業帶回來,因為我們需要就業機會,我們需要那部分經濟。9個月後,9個月後,我們現在在亞利那州全面生產Blackwell。

展望未來:下一代平台Rubin

極限Blackwell,GB200,Grace Blackwell,NVLink 72,極限協同設計使我們獲得了10倍的代際提升。這真是太不可思議了。現在真正令人難以置信的部分是這個。這是我們製造的第一台人工智慧超級電腦。這是在2016年,當時我把它交付給舊金山的一家初創公司,後來發現那是OpenAI。這就是那台電腦。為了製造那台電腦,我們設計了一款晶片。我們設計了一款新的晶片。為了我們現在進行協同設計,看看我們要做的所有晶片。這就是所需的。你不可能只用一塊晶片就讓電腦速度提高10倍。這是不可能發生的。讓我們能夠以指數方式不斷提高性能,以指數方式不斷降低成本,從而讓電腦速度提高10倍的方法是極限協同設計,以及同時開發所有這些不同的晶片。

現在魯本回家了。這是魯本。這是維拉·魯本和魯本。女士們先生們,魯本。這是我們的第三代NVLink 72機架規模電腦。第三代。GB200是第一個。我們在世界各地的所有合作夥伴,我知道你們有多努力。這極其困難。做成這件事極其困難。第二代,順暢多了。還有這一代,看看這個。完全無線纜。完全無線纜。而現在,所有這些都回到了實驗室。這是下一代魯本。在我們拆解GB300的同時,我們正在準備魯本,以便明年這個時候投入生產,也許會稍早一些。因此,我們每年都會推出最極致的協同設計系統,以便我們能夠不斷提高性能,並不斷降低token生成成本。看看這個。這真是一台極其漂亮的電腦。

所以這太棒了。這是100千兆次浮點運算。我知道這沒什麼意義。100千兆次浮點運算。但與我10年前,9年前交付給OpenAI的DGX-1相比,它的性能是其100倍。就在這裡,相比之下是那台超級電腦的100倍。100個那種裝置的100倍,讓我想想,100個那種裝置相當於25個這樣的機架,全部被這一個東西取代了。一個維拉·魯賓。

好的,這是計算托盤,這是維拉·魯賓的超級晶片。好的,這是計算托盤,就在這裡。它非常容易安裝,只需打開這些東西,把它推進去,甚至我都能做到。這是維拉·魯賓計算托盤。如果你決定要加入一個特殊的處理器,我們已經加入了另一個處理器,它被稱為上下文處理器,因為我們給人工智慧提供的上下文量越來越大。我們希望它在回答問題之前閱讀大量的PDF。我們希望它閱讀大量的檔案論文,觀看大量的視訊,在你回答我的問題之前學習所有這些東西。所有這些上下文處理都可以加入。所以你看到底部有8個ConnectX 9新型SuperNIC,你有CPX,8個,你有Bluefield 4,這個新的資料處理器,2個維拉CPU,和4個魯賓封裝或8個魯賓GPU。所有這些都在這一個節點中,完全無電纜,100%液冷。

然後是這個新的處理器,今天我不會談太多,我沒有足夠的時間,但這是完全革命性的。這樣做的原因是,你的人工智慧需要擁有越來越多的記憶體。你會更多地與之互動,你希望記住我們上次的對話,所有你為了我學習的東西,下次我回來時請不要忘記。因此,所有這些記憶將建立一種叫做KV快取的東西,而這種KV快取,檢索它,你可能已經注意到,現在每次進入你的AI,刷新和檢索所有之前的對話需要越來越長的時間。這樣做的原因是我們需要一種革命性的新處理器,它叫做Bluefield 4。

接下來是ConnectX交換機,抱歉,是NVLink交換機,就在這裡。好的,這是NVLink交換機,它使我們能夠將所有電腦連接在一起,並且該交換機的頻寬是當今世界網際網路流量峰值的數倍。因此,這個骨幹網路將同時通訊並將所有資料傳輸到所有GPU。最重要的是,這是Spectrum X交換機,而這款乙太網路交換機的設計目的是使所有處理器可以同時相互通訊,而不會阻塞網路。阻塞網路,這非常技術性。

好的,這些是,這三個組合在一起,然後這是量子交換機。這是用於InfiniBand的,這是乙太網路,我們不在乎你想使用那種語言,無論你喜歡使用什麼標準,我們都為你提供了出色的橫向擴展結構,無論是InfiniBand,還是量子,還是Spectrum。乙太網路,這個使用了矽光子技術,並且是完全共封裝的選項。基本上,雷射直接照射到矽片上,並將其連接到我們的晶片。好的,這是Spectrum X乙太網路,現在讓我們來談談,謝謝,哦,這就是它的樣子。這是一個機架。這是2.5,這是2,這是2噸,150萬個零件,而主幹,就是這個主幹,在一秒鐘內承載著整個網際網路的流量。相同的速度,將其移動到所有這些不同的處理器上。100%液體冷卻。所有這些都是為了,你知道,世界上最快的令牌生成速率。

好的,這就是機架的樣子。現在,那是一個機架。一個千兆瓦的資料中心將擁有,你知道,就叫它,讓我想想,16個機架是1000,然後是500個這樣的。所以不管怎樣,500乘以16。所以,算它有9000個這樣的,8000個這樣的就構成一個千兆瓦的資料中心。好嗎?所以這就是未來的AI工廠。

AI工廠生態系統:Omniverse DSX藍圖

現在,正如你所注意到的,我們,輝達最初是從設計晶片開始的,然後我們開始設計系統,我們設計了AI超級電腦。現在我們正在設計整個AI工廠。每一次我們向外拓展,整合更多要解決的問題,我們就能提出更好的解決方案。我們現在建構整個AI工廠。這個,這個AI工廠就是我們為維拉·魯賓建造的,而且我們創造了一種技術,使我們所有的合作夥伴都能以數位化的方式整合到這個工廠中。讓我展示給你們看。

下一次工業革命已經到來。隨之而來的是一種新型工廠。人工智慧基礎設施是一項生態系統等級的挑戰,需要數百家公司合作。NVIDIA Omniverse DSX 是建構和營運千兆級人工智慧工廠的藍圖。這是首次將建築、電力和冷卻系統與 NVIDIA 的人工智慧基礎設施堆疊共同設計。它始於 Omniverse 數字孿生。Jacobs Engineering 最佳化計算密度和佈局,以根據功率約束最大化令牌生成。他們將來自西門子、施耐德電氣、特靈和維諦的 SIM 就緒 OpenUSD 資產整合到 PTC 的產品生命周期管理中。然後使用來自 eTap 和 Cadence 的 CUDA 加速工具模擬熱工和電氣特性。設計完成後,NVIDIA 的合作夥伴(如 Bechtel 和 Vertiv)交付預製模組,這些模組在工廠中建構、測試並準備好插入。這大大縮短了建構時間,從而更快地實現收入。當物理人工智慧工廠上線時,數字孿生充當作業系統。工程師們提示來自Phydra和Emerald AI的AI代理,這些代理之前已經在數字孿生中接受過訓練,以最佳化功耗並減少AI工廠和電網的壓力。總的來說,對於一個1吉瓦的AI工廠,DSX最佳化每年可以帶來數十億美元的額外收入。在德克薩斯州、佐治亞州和內華達州,NVIDIA的合作夥伴正在將DSX變為現實。在弗吉尼亞州,NVIDIA正在建立一個AI工廠研究中心,使用DSX來測試和產品化Vera Rubin,從基礎設施到軟體。借助DSX,NVIDIA在全球的合作夥伴可以比以往更快地建構和啟動AI基礎設施。

完全在數位領域中。早在Vera Rubin作為一台真實的電腦存在之前,我們就已經把它當作一台數字孿生電腦來使用了。現在,早在這些AI工廠存在之前,我們將使用它,我們將設計它,我們將規劃它,我們將最佳化它,我們將像數字孿生一樣營運它。因此,我們所有的合作夥伴都在與我們合作,我非常高興你們所有人都在支援我們,Geo在這裡,通用電氣Vernova在這裡,施耐德,我想奧利維爾在這裡,奧利維爾·布魯姆在這裡,西門子,令人難以置信的合作夥伴。好的,羅蘭·布什,我想他正在觀看。你好,羅蘭。總之,非常非常棒的合作夥伴與我們合作。最初,我們有CUDA,並且我們擁有所有這些不同的軟體合作夥伴生態系統。現在,我們有了Omniverse DSX,並且我們正在建構AI工廠,同樣,我們擁有這些與我們合作的令人難以置信的合作夥伴生態系統。

開放生態:開源模型與戰略合作

讓我們來談談模型。特別是開源模型。在過去的幾年裡,發生了一些事情。首先,由於推理能力,開源模型變得相當強大。它變得相當強大,因為它們是多模態的,並且由於知識蒸餾,它們非常高效。因此,所有這些不同的能力使得開源模型首次對開發者來說非常有用。它們現在是初創企業的命脈。不同行業初創企業的命脈,因為,正如我之前提到的,每個行業都有自己的用例、自己的用例、自己的資料、自己的用例資料、自己的飛輪。所有這些能力,這些領域專業知識,都需要具備嵌入模型的能力。開源使之成為可能。研究人員需要開源。開發者需要開源。全世界的公司,我們需要開源。

開源模型真的非常重要。美國也必須在開源領域發揮領導作用。我們有非常棒的專有模型。我們有非常棒的專有模型。我們同樣需要非常棒的開源模型。我們的國家依賴於此。我們的初創公司依賴於此。因此,輝達正致力於實現這一目標。我們現在是最大的,我們在開源貢獻方面處於領先地位。我們在排行榜上有23個模型。我們擁有所有這些不同的領域,從語言模型到我將要談到的物理人工智慧模型,再到機器人模型和生物學模型。這些模型中的每一個都擁有龐大的團隊,這也是我們為自己建造超級電腦的原因之一,以便能夠建立所有這些模型。我們擁有排名第一的語音模型、排名第一的推理模型和排名第一的物理人工智慧模型。下載量非常非常驚人。我們致力於此。這樣做的原因是科學需要它,研究人員需要它,初創公司需要它,公司也需要它。

我很高興人工智慧初創公司基於輝達建構。他們這樣做有幾個原因。首先,當然,我們的生態系統非常豐富。我們的工具運行良好。我們的所有工具都可以在我們所有的GPU上運行。我們的GPU無處不在。實際上它就在每一個雲端。它可以在本地部署。你可以自己建構它。你可以建構一台帶有多個GPU的發燒友級遊戲PC。你可以下載我們的軟體堆疊,它就能正常工作。我們有富有的開發者,他們正在使這個生態系統變得越來越豐富。所以我真的對我們正在合作的所有初創公司感到高興。我對此表示感謝。同樣的情況是,這些初創公司中的許多公司現在開始創造更多的方式來享受我們的GPU。CoreWeaves、Nscale、Nibius、Lambda,所有這些公司, Crusoe,這些公司正在建構這些新的GPU雲來為初創公司提供服務,我對此非常感謝。

這一切皆有可能,因為NVIDIA無處不在。我們整合了我們的庫,我跟你說過的所有CUDAx庫,我跟你說過的所有開源AI模型,我跟你說過的所有模型,例如,我們將其整合到AWS中。非常喜歡與Matt合作。例如,我們將其整合到Google雲中。非常喜歡與Thomas合作。每個雲都整合了NVIDIA GPU,以及我們的計算、我們的庫以及我們的模型。喜歡與微軟Azure的Satya合作。喜歡與Oracle的Clay合作。每個雲都整合了NVIDIA堆疊。結果是,無論你走到那裡,無論你使用那個雲,它都能出色地工作。

我們還將NVIDIA庫整合到世界的SaaS中,以便每個SaaS最終都將成為代理型SaaS。我喜歡比爾·麥克德莫特對ServiceNow的願景。是的,就這樣。我想那可能是比爾。你好,比爾。那麼ServiceNow是什麼呢?佔世界企業工作流的85%,SAP佔世界商業的80%,我和克里斯蒂安·克萊恩正在合作將NVIDIA庫、CUDAX、Nemo和Nemotron,我們所有的AI系統整合到SAP中。與Synopsys的Sasin合作,加速世界的CAE、CAD、EDA工具,以便它們能夠更快地運行和擴展。幫助他們建立AI代理。總有一天,我希望聘請AI代理ASIC設計師與我們的ASIC設計師一起工作。從本質上講,就是Synopsys的游標,如果你願意這麼說的話。我們正在與阿尼魯德合作。阿尼魯德,我今天早些時候看到他了。他是賽前表演的一部分。Cadence正在做著令人難以置信的工作,加速他們的堆疊,建立人工智慧代理,以便我們可以擁有Cadence人工智慧ASIC設計師和系統設計師與我們合作。

今天,我們將宣佈一個新的合作。人工智慧將極大地提高生產力。人工智慧將改變幾乎每個行業。但人工智慧也將極大地加劇網路安全挑戰。不良的人工智慧。因此,我們需要一個強大的防禦者。我想不出比CrowdStrike更好的防禦者了。喬治在這裡。他之前在這。我早些時候看到他了。我們正在與CrowdStrike合作,使網路安全達到光速。為了建立一個在雲端擁有網路安全人工智慧代理,同時在本地或邊緣擁有極佳人工智慧代理的系統。這樣,無論何時出現威脅,你都能在瞬間檢測到它。我們需要速度,我們需要快速的代理式人工智慧,超級智能的人工智慧。

我還有第二個公告。這是世界上速度最快的企業公司。可能是當今世界上最重要的企業堆疊。Palantir本體。這裡有Palantir的人嗎?我剛才和Alex聊過。這是Palantir本體。他們獲取資訊,獲取資料,獲取人為判斷,並將其轉化為商業洞察。我們與Palantir合作加速Palantir所做的一切,以便我們能夠以更大規模和更高速度進行資料處理。無論是過去的結構化資料,當然我們也會有結構化資料、人工記錄的資料、非結構化資料,以及為了我們的政府、為了國家安全以及為了世界各地的企業而處理這些資料,以光速處理這些資料,並從中找到洞見。這就是未來將會呈現的樣子。Palantir將整合輝達(NVIDIA),以便我們能夠以光速和非凡的規模進行處理。好的,輝達(NVIDIA)和Palantir。

物理AI:機器人與數字孿生的融合

讓我們來談談物理人工智慧。物理人工智慧需要三台電腦。正如訓練一個語言模型需要兩台電腦一樣,一台用於訓練,一台用於評估和推理。好的,這就是你看到的大型GB200。為了實現物理人工智慧,你需要三台電腦。你需要一台電腦來訓練它。這是GB,即Grace Blackwell NVLink 72。我們需要一台能夠執行我之前用 Omniverse DSX 向您展示的所有模擬的電腦。它基本上是機器人的數字孿生,用於學習如何成為一個優秀的機器人,也是工廠的數字孿生。那台電腦是第二台電腦,Omniverse 電腦。這台電腦必須在生成式人工智慧方面非常出色,並且必須擅長電腦圖形、感測器模擬、光線追蹤、訊號處理。這台電腦被稱為 Omniverse 電腦。一旦我們訓練好模型,在數字孿生中模擬人工智慧,並且該數字孿生可以是工廠的數字孿生以及一大堆機器人的數字孿生,那麼您就需要操作該機器人。這就是機器人電腦。這個可以裝入自動駕駛汽車。其中一半可以裝入機器人。或者,您實際上可以擁有,你知道的,在操作中非常靈活和快速的機器人,可能需要兩台這樣的電腦。所以這是 Thor,Jetson Thor 機器人電腦。

這三台電腦都運行 CUDA,這使我們能夠推進物理人工智慧的發展。理解物理世界的人工智慧。理解物理定律、因果關係、永恆性,你知道,物理人工智慧。我們有令人難以置信的合作夥伴與我們一起創造工廠的物理人工智慧。我們自己也在使用它來建立我們在德克薩斯州的工廠。一旦我們建立了機器人化工廠,我們就會擁有一堆在其中的機器人。這些機器人也需要物理人工智慧,應用物理人工智慧,並在數字孿生中工作。讓我們看看它。

美國正在重新工業化。各個行業都在將製造業遷回國內。在德克薩斯州休斯頓,富士康正在建造一座最先進的機器人化工廠,用於製造輝達人工智慧基礎設施系統。由於勞動力短缺和技能差距,數位化、機器人技術和物理人工智慧比以往任何時候都更加重要。這家工廠是數字原生。在Omniverse中。富士康工程師在一個基於Omniverse技術開發的西門子數位化雙胞胎解決方案中組裝他們的虛擬工廠。每個系統,機械、電氣、管道,都在建造前經過驗證。西門子工廠模擬運行設計空間探索最佳化,以識別理想的佈局。當出現瓶頸時,工程師會更新佈局,更改由西門子TeamCenter管理。在Isaac Sim中,相同的數字孿生被用於訓練和模擬機器人AI。在裝配區域,發那科機械手建構GB300托盤模組。通過來自FII的手動機械手和熟練的AI,將母線安裝到托盤中。然後,AMR將托盤運送到測試艙。之後,富士康使用Omniverse進行大規模感測器模擬,機器人AI在其中學習如何作為一個團隊工作。在Omniverse中,基於NVIDIA Metropolis和Cosmos建構的視覺AI代理從上方監視機器人和工人的隊伍,以監控營運並向富士康工程師發出異常和安全違規,甚至質量問題的警報。為了培訓新員工,這些代理為互動式AI教練提供支援,以便輕鬆地進行員工入職培訓。美國的再工業化時代已經到來。人們和機器人協同工作。這就是製造業的未來,工廠的未來。

我想感謝我們的合作夥伴富士康。首席執行官劉揚也在這裡。但所有這些生態系統合作夥伴使我們有可能創造機器人工廠的未來。工廠本質上就是一個機器人,它協調其他機器人來製造機器人產品。完成這項工作所需的軟體量非常巨大,除非你能在數字孿生中進行規劃、設計和操作,否則幾乎不可能實現。我很高興看到卡特彼勒,我的朋友喬·克里德,以及他那家百年老公司也在他們的製造方式中採用了數字孿生。

這些工廠將擁有未來的機器人系統。其中最先進的一家是Figure。佈雷特·阿德科克今天也在這裡。他在三年半前創立了一家公司。他們今天的價值幾乎是400億美元。我們一起合作訓練人工智慧、訓練機器人、模擬機器人,當然還有進入Figure的人形機器人電腦。真的很棒。我有幸親眼見證。這真的非常了不起。人類擁有的機器人很有可能,我的朋友埃隆也在研究這個,這很可能會成為最大的消費類新型電子產品市場之一,而且肯定會是最大的工業裝置市場之一。佩吉·約翰遜和Agility公司的人正在與我們合作開發用於倉庫自動化的機器人。強生公司的人再次與我們合作,訓練機器人,在數字孿生中模擬它,並操作機器人。這些強生公司的外科手術機器人甚至將以前所未有的精度進行完全無創的手術。

當然,還有有史以來最可愛的機器人。有史以來最可愛的機器人。迪士尼機器人。這件事對我們來說非常重要。我們正在與迪士尼研究院合作,開發一個全新的框架和模擬平台,該平台基於一項名為牛頓的革命性技術。而牛頓模擬器使得機器人能夠在具有物理感知、基於物理學的環境中學習如何成為一個優秀的機器人。讓我們來看一下。

藍色。女士們先生們,迪士尼藍色。告訴我它不可愛。他很可愛。我們都想要一個。我們都想要一個。現在,記住,你剛才看到的一切都不是動畫。這不是電影。這是一個模擬。這個模擬是一個全宇宙。全宇宙,數字孿生。所以這些工廠的數字孿生、倉庫的數字孿生、手術室的數字孿生,以及Blue可以在其中學習如何操縱、導航以及與世界互動的數字孿生。所有這些都是完全即時完成的。這將是世界上最大的消費電子產品線。其中一些現在確實運行得非常出色。這是人類或機器人技術的未來。當然,還有藍色。好嗎?

自動駕駛的拐點:輪式機器人與全球網路

現在,人類或機器人仍在開發中。但與此同時,有一個機器人顯然正處於拐點。它基本上就在這裡。那就是輪式機器人。這是一種無人駕駛計程車。無人駕駛計程車本質上是一個人工智慧司機。現在,我們今天要做的事情之一是,我們宣佈輝達Drive Hyperion。這是一件大事。我們建立了這個架構,以便世界上每家汽車公司都可以製造汽車、車輛,可以是商用的,可以是載客的,可以是專門用於無人駕駛計程車的,製造出為無人駕駛計程車準備的車輛。

感測器套件將圍繞攝影機、雷達和雷射雷達,使我們能夠實現最高水平的環繞繭式感測器感知和冗餘,這對於最高等級的安全性是必不可少的。超越驅動(Hyperion Drive),超越驅動現在被設計應用於Lucid、梅賽德斯-奔馳,我的朋友奧拉·凱萊紐斯(Ola Kalenius),以及Stellantis的各位,還有許多其他車型也將採用。而且,一旦你擁有一個基本的標準平台,那麼AV系統的開發者,比如那些才華橫溢的公司Wave、Wabi、Aurora、Momenta、Neuro等等,就有很多。We Ride,有很多公司可以將他們的AV系統運行在標準底盤上。基本上,這個標準底盤現在已經變成了一個輪子上的計算平台。而且,因為它是一個標準平台,並且感測器套件是全面的,他們所有人都可以將他們的AI部署到上面。

讓我們快速看一下。這是美麗的舊金山,你可以看到,無人駕駛計程車(RoboTaxi)的拐點即將到來。在未來,每年行駛一兆英里,每年生產1億輛汽車,全球大約有5000萬輛計程車,這將由一大批無人駕駛計程車來擴充。所以,這將是一個非常大的市場。為了將其連接起來並在全球部署,今天我們宣佈與Uber建立合作夥伴關係。Uber,達拉·科斯羅薩西(Dara K),我們正在合作將這些輝達(NVIDIA)Drive Hyperion汽車連接到一個全球網路中。現在,在未來,你將能夠叫到這些車,而且生態系統將變得非常豐富,我們將擁有遍佈全球的Hyperion或無人駕駛計程車。這將成為我們新的計算平台,我期望它會非常成功。

結語:引領新一輪平台轉型

好的。這就是我們今天討論的內容。我們討論了大量的事情。我們談到,請記住,其核心是從通用計算到加速計算的兩個平台轉型。輝達CUDA以及那些被稱為CUDAX的庫套件使我們能夠應對幾乎所有行業,並且我們正處於拐點。現在,它正像一個良性循環所暗示的那樣增長。第二個拐點現在正向我們逼近。第二個平台轉型,人工智慧從經典的手寫軟體到人工智慧。兩個平台轉型同時發生,這就是我們感受到如此驚人增長的原因。

量子計算,我們談到了。開放模型,我們討論過了。我們討論了 CrowdStrike 和 Palantir 加速其平台的企業級應用。我們討論了機器人技術,一個新興的、可能成為最大的消費電子和工業製造領域之一。當然,我們還討論了 6G。NVIDIA 擁有用於 6G 的新平台。我們稱之為 Arc。我們有一個用於機器人汽車的新平台。我們稱之為 Hyperion。我們甚至還有用於工廠的新平台。兩種類型的工廠。人工智慧工廠,我們稱之為 DSX。然後是具有人工智慧的工廠,我們稱之為 Mega。

所以現在,我們也在美國進行製造。女士們先生們,感謝今天加入我們,感謝你們允許我們將GTC帶到華盛頓特區。我們計畫每年都舉辦,希望如此。感謝各位為讓美國再次偉大所做的貢獻。謝謝。 (Web3天空之城)