輝達CEO黃仁勳在巴黎VivaTech 2025 上的主題演講: 從智能體到AI工廠 | 全文2萬字

【城主說】輝達CEO黃仁勳今天在巴黎的VivaTech2025發表了主題演講。如老黃所說,這是GTC演講的巴黎VivaTech版,基本可以看做是GTC演講Plus更新版:)。

這次演講核心發佈了專為推理和思考設計的 Blackwell 架構,並闡述了“AI 工廠”作為新型國家基礎設施的理念。老黃詳細介紹了輝達在智能體 AI、工業數字孿生、自動駕駛和人形機器人領域的全端式解決方案,並強調了與歐洲在建構主權 AI 生態系統方面的深度合作。

核心觀點

  • Blackwell 架構: 發佈專為大規模推理和思考設計的“思考機器”Blackwell,相較於前代實現性能巨大飛躍。
  • AI 工廠理念: 將 AI 資料中心重新定義為生產智能的“AI 工廠”,是推動經濟增長的新型國家基礎設施。
  • 智能體 AI (Agent AI): AI 進入新浪潮,能夠進行推理、規劃和使用工具的智能體將成為主流,輝達提供從模型到部署的全套開發平台。
  • 工業數字孿生: Omniverse 平台通過建構物理精確的數字孿生,賦能從工廠設計到機器人訓練的整個工業流程。
  • 具身智能與機器人: AI 的終極形態是物理機器人,輝達正通過 Thor 晶片和 Omniverse 模擬平台,加速自動駕駛和人形機器人的發展。
  • 歐洲主權 AI: 宣佈與歐洲各國及 Mistral AI 等公司深度合作,建設區域性 AI 雲和技術中心,支援歐洲 AI 生態發展。

序幕

視訊解說: 這就是智能的誕生方式。一種新型工廠。資訊基元的生成器。人工智慧的基石。資訊基元開啟了新的疆域。邁入一個超凡世界的第一步。在那裡,無限可能孕育而生。資訊基元將圖像轉化為科學資料。測繪外星大氣層。並指引未來的探索者。

他們深入探測地球深處,探尋隱藏的危險。

他們將潛力轉化為豐饒。並幫助我們收穫豐碩成果。Tokens 在疾病發作之前就能發現它們。精準治癒。

並瞭解我們的運作機制。

Tokens 關聯各項資訊。以便我們能保護我們最珍貴的生物。Tokens 解讀物理定律。以此驅動我們更快發展。讓我們的生活更高效。令牌不僅教會機器人如何移動。更能帶來喜悅。以及舒適。令牌幫助我們向前邁進。

這是個人的一小步,卻是人類的一大步。這樣我們就能大膽前行,抵達前人未至之境。而這一切都始於此。

歡迎輝達創始人兼首席執行官黃仁勳上台。

黃仁勳: 巴黎,你好!大家好!這是輝達首次在巴黎舉辦GTC大會。這真是太棒了。感謝所有蒞臨現場的合作夥伴。多年來,我們與許多人攜手合作。事實上,我們已經在歐洲深耕多年,儘管這是我首次在巴黎參加GTC大會。我有很多事情要告訴大家。

加速計算:從科學到人工智慧的基石

黃仁勳: 曾幾何時,輝達旨在打造一個全新的計算平台。做普通電腦無法做到的事情。我們加速了CPU,創造了一種新型計算,稱為加速計算。我們最早的應用之一就是分子動力學。自那時起,我們已經取得了長足的進步。湧現出如此多不同的庫。事實上,加速計算的特別之處在於,它不僅僅是一個你可以編譯軟體的新型處理器。你必須重新構想你的計算方式。你必須重新設計你的演算法。而事實證明,人們要重新設計軟體和演算法以實現高度平行化,是極其困難的。因此,我們建立了各種庫,以幫助每個市場、每個應用領域實現加速。這些庫中的每一個都為開發者開啟了新的機遇。並且它也為我們以及我們的生態系統合作夥伴開啟了新的增長機遇。

計算光刻,可能是當今半導體設計中最重要的應用,在台積電的工廠中運行。三星,大型半導體晶圓廠。在晶片製造之前,它會運行通過一種名為cuLitho的逆向物理演算法,即計算光刻。直接稀疏求解器,代數多重網格求解器。CuOpt,我們剛剛開源了它,這是一個極其令人振奮的應用庫。這個庫能夠加速決策制定,以最佳化包含數百萬變數和數百萬約束條件的問題,例如旅行商問題。Warp,一個用於表達幾何和物理求解器的Pythonic框架,非常重要。cuDF,cuML,結構化資料庫,資料幀,經典的機器學習演算法。cuDF 加速 Spark,零行程式碼更改。cuML 加速 scikit-learn,零行程式碼更改。Dynamo 和 cuDNN。cuDNN 可能是 NVIDIA 迄今為止建立過的最重要的庫。它加速了深度神經網路的原語。而 Dynamo 是我們全新的庫,它使得在整個 AI 工廠中調度、編排和分發極其複雜的推理工作負載成為可能。cuEquivariance 和 cuTensor,張量收縮演算法。等變性適用於遵守幾何定律的神經網路,例如蛋白質、分子。Arial 和 Shiona,一個非常重要的框架,旨在賦能 AI 運行 6G。IRF2,我們用於氣象和氣候模型的基礎模型的模擬環境。平方公里,極高的解析度。MONI,我們用於醫學影像的框架,廣受歡迎。Parabrix,我們用於基因組學分析的求解器,取得了巨大成功。cuQuantum,cu2q,我稍後就會談到,用於量子計算。還有cuPiNumeric,對NumPy和SciPy的加速。正如您所見,這些只是眾多庫中的幾個例子。還有400個其他的。它們每一個都加速了一個應用領域。它們每一個都開啟了新的機遇。

量子飛躍:CUDA-Q 與未來計算

黃仁勳: 那麼,其中最令人興奮的,莫過於cu2q。cu2x 是這套庫。一個基於 cu2 的庫套件,用於加速應用程式和演算法。我們現在有了 cu2qcu2q 用於量子計算,以及基於 GPU 的經典-量子混合計算。我們在 cu2q 上已經投入開發好幾年了。而今天,我可以告訴大家,量子計算領域正在迎來一個轉折點。

眾所周知,第一個物理量子位元大約在近30年前得到了演示。一個糾錯演算法在1995年被發明。而在2023年,差不多30年後,世界上第一個邏輯量子位元由Google成功演示。從那時起,幾年之後,邏輯量子位元的數量,即那些由大量帶有糾錯功能的物理量子位元所代表的邏輯量子位元的數量,正在開始增長。就像摩爾定律一樣,我完全可以預期每五年邏輯量子位元數量增加10倍,每十年增加100倍。這些邏輯量子位元將變得糾錯能力更強、更魯棒、性能更高、更具韌性,而且,當然,將繼續保持可擴展性。量子計算正處於一個轉折點。

我們一直在以多種不同方式與全球各地的量子計算公司合作。但在歐洲,存在一個大型社群。我昨晚見到了帕斯卡。我昨晚見到了巴塞隆納超級計算中心。現在很清楚,我們已近在咫尺,能夠在未來幾年內將量子計算、量子經典混合計算應用於能夠解決一些有趣問題的領域。這是一個真正令人興奮的時刻。因此我們一直在與所有的超級計算中心合作。如今非常清楚,在未來幾年內,或者至少在下一代超級電腦中,每一台都將配備一個QPU,並且QPU將連接到GPU。QPU當然將用於量子計算,而GPU將用於預處理、控制、糾錯(這將是高度計算密集型的)、後處理等。在這兩種架構之間,正如我們加速了CPU一樣,現在QPU與GPU協同工作,以實現下一代計算。

那麼,今天我們宣佈,我們的整個量子演算法堆疊現已在Grace Blackwell 200上得到加速。並且加速效果簡直令人難以置信。我們通過多種不同方式與量子計算行業合作。一種方式是使用QuQuantum來模擬量子位元或模擬運行在這些量子電腦上的演算法。本質上,就是使用經典電腦來模擬或模擬量子電腦。另一方面,極其重要的是CUDA-Q。基本上,就是發明了一種新的CUDA,將CUDA擴展到量子經典領域,這樣,在CUDA-Q上開發的應用可以在量子電腦問世之前以模擬方式運行,或者在量子電腦問世之後以協作方式運行。量子經典加速計算方法。因此,今天我們宣佈 CUDA-Q 可用於 Grace Blackwell。

這裡的生態系統極其豐富。當然,歐洲在科學、超級計算專業知識以及該領域的傳承方面底蘊深厚。在這裡看到量子計算取得進展不足為奇。在未來幾年,我們將看到一個真正非凡的拐點。那麼,對於所有為此努力了三十年的量子電腦行業,我祝賀你們今天取得的這些令人難以置信的成就和里程碑。謝謝。

人工智慧的新浪潮:從生成式到智能體

黃仁勳: 讓我們來談談人工智慧。你們可能會驚訝於我會和你們談論人工智慧。同一塊運行並支援我所提及的所有應用的GPU,正是同一塊GPU使得人工智慧得以問世。我們於2012年首次接觸人工智慧,就在那之前,我們已與開發者合作,共同開發一種名為深度學習的新型演算法。它促成了2012年AlexNet引發的人工智慧大爆發。在過去的約15年裡,人工智慧取得了驚人的迅猛發展。

人工智慧的第一波浪潮是感知能力,旨在使電腦能夠識別並理解資訊。第二波浪潮,即我們在過去大約五年間普遍談論的,是生成式人工智慧。它具備多模態特性,這意味著人工智慧能夠同時學習圖像和語言。因此,你可以通過語言對其進行提示,而它則能夠生成圖像。人工智慧所具備的多模態能力,以及翻譯和生成內容的能力,共同促成了生成式人工智慧的革命。生成式人工智慧,即生成內容的能力,對於我們提高生產力具有根本性的重要意義。

嗯,我們正在開啟新一波的人工智慧浪潮。在過去的幾年裡,我們看到人工智慧的能力取得了巨大的進步。從根本上說,智能關乎理解、感知、推理、規劃任務、解決問題,然後執行任務。感知、推理、規劃。智能的核心循環。它使我們能夠應用一些預先學到的規則來解決我們從未見過的問題。這就是為什麼聰明的人之所以聰明。能夠處理一個複雜的問題,並將其一步步分解,推理如何解決,或許進行研究,或許學習新知識,尋求幫助,使用工具,然後一步步地解決問題。嗯,我剛才描述的這些能力,通過所謂的智能體人工智慧,在今天已經從根本上成為可能。我馬上就會向您展示更多。

在其實際的物理實現中,即那種具身化的人工智慧的體現,以及在動作方面,現在其生成能力正在生成運動。這種人工智慧不再是生成視訊、圖像或文字,而是生成移動能力,例如走路,或者伸手抓取物體、使用工具的能力。人工智慧能夠以物理形式具身化的能力,基本上就是機器人技術。這些能力,即實現智能體(它們本質上是資訊機器人)和具身化人工智慧(即物理機器人)的基礎技術,這兩項核心能力如今已然擺在我們面前。對人工智慧而言,這真是激動人心的時代。

Blackwell:為思考而生的工程奇蹟

黃仁勳: 但這一切都始於GeForce。GeForce帶來了電腦圖形技術。這是我們所開發過的第一個加速計算應用。電腦圖形技術發展到如今的程度,真是令人難以置信。GeForce將CUDA帶給了世界,這使得機器學習研究人員和人工智慧研究人員能夠推進深度學習的發展。然後,深度學習徹底改變了電腦圖形學,使我們能夠將其提升到一個全新的高度。今天我將向大家展示的一切,今天我將向大家展示的一切,我將先給大家一個預告,但今天我將向大家展示的所有內容都是電腦模擬,而非動畫。它是光子模擬、物理模擬、粒子模擬,一切從根本上說都是模擬,而非動畫,並非藝術。它看起來美得令人難以置信,因為結果發現世界是美麗的,結果發現數學是美麗的。那麼,我們來看看吧。你們覺得怎麼樣?運作中的數字。運作中的數字。這本質上就是模擬的意義,而且看起來簡直美不勝收。

但是,鑑於我們現在模擬幾乎所有事物的規模和速度,我們可以將一切都轉化為數字孿生。既然一切皆可成為數字孿生,我們就能將一切都轉化為數字孿生。在我們將其投入物理世界之前,它可以被完全以數字方式進行設計、規劃、最佳化和營運。將一切都建構在軟體中的理念,如今已然來臨。所有的物理實體都將以數字方式建構。所有精妙建構的事物都將以數字方式建構。所有在龐大規模下營運的事物都將首先以數字方式建構,並將有數字孿生來營運它們。因此,今天我們將大量討論數字孿生。

那麼,最初作為一塊GeForce顯示卡出現的事物……這裡有人知道GeForce是什麼嗎?好的。好的。好的,最初的GeForce如今已是這般模樣。這就是新的GeForce。它重達兩噸,甚至兩噸半,由120萬個零件組成。價值約300萬美元。120千瓦。由150家工廠生產。200家技術合作夥伴與我們攜手完成這項工作。為打造GB200(並已向GB300演進),研發預算可能高達400億美元。它已全面投入生產。

而這台機器,其設計初衷就是一台思考機器。思考機器,就其能夠推理、規劃,並花費大量時間進行自我對話而言。就像你一樣。在我們實際輸出之前,我們大部分時間都在為自己的思維生成詞語,為自己的思維生成圖像。因此,從架構上講,這種思考機器正是 Grace Blackwell 的設計初衷。它被設計成一個巨型 GPU。我將它與 GeForce 相比是有充分理由的。GeForce 是一個 GPU。GB200 也是如此。它是一個巨大的虛擬 GPU。現在,我們必須將其拆分為眾多元件,建立大量新的網路技術和 SerDes 技術,以及極低功耗、高能效的互連技術,以便將所有這些晶片和系統連接成一個虛擬 GPU。

這是Hopper版本。這是世界聞名的Hopper系統。八個GPU通過NVLink互聯。這裡未展示的是一個CPU托盤。一個配備雙CPU和系統記憶體的CPU托盤,位於頂部。這共同構成了一台AI超級電腦的一個節點。約50萬美元。這就是Hopper系統。正是這個系統,真正使我們在AI版圖上佔據了一席之地。而且由於市場需求激增,它長期處於配給狀態。但是,這就是著名的Hopper系統。整個系統,包括中央處理器,都被這個卓越的Blackwell節點所取代。這是一個計算托盤。僅此一塊就能取代那個完整的系統。它採用全液體冷卻,並且中央處理器(CPU)與圖形處理器(GPU)直接整合連接。所以你可以在這裡看到,兩顆中央處理器,四顆圖形處理器。它的性能優於那個完整的系統。但令人驚奇的是這一點。我們想將一大批這樣的系統連接起來。如何將所有這些連接起來,對我們來說確實很難想像。於是我們將其拆解。我們所做的,就是將整個主機板拆解成這和這。這是革命性的NVLink系統。

計算的橫向擴展並非那麼困難。只需用乙太網路連接更多CPU,橫向擴展並不困難。縱向擴展則極其困難。你所能建構的電腦規模,受限於你實際能夠實現的程度。要將如此大量的技術和電子元件整合進一個記憶體模型中,是極其難以實現的。所以我們決定建立一個名為NVLink的新型互連技術。NVLink是一種記憶體語義互連技術。這是一個計算互聯結構,而非網路。它直接連接到所有這些不同NVLink系統(即計算節點)的中央處理器。這是交換機。九個這樣的,這九個矗立在頂部。其中九個位於底部。中間是NVLink交換機。將它們連接在一起的是這個奇蹟。這是NVLink主幹。這是百分之百的銅。銅同軸電纜。它將所有NVLink晶片直接連接到所有GPU,通過整個骨幹網路直接互聯。這樣,每一顆144個Blackwell裸晶片(或72個不同封裝中的晶片)都能同時互相通訊,且不會產生阻塞。遍佈於整個NVLink骨幹網路。它的頻寬大約是每秒130太字節。130... 我知道。不,等等,等著瞧。等著瞧。每秒130太字節。如果以位元為單位... 每秒130太字節。這個背板上的資料速率,超過了全球整個網際網路峰值流量的總和。這就是我們如何將網際網路濃縮到 60 磅的秘訣。NVLink。

於是我們完成了所有這些。我們之所以做這些,是因為未來人們對電腦的理解和思考方式將發生根本性改變,對此我將花更多時間探討,但它旨在讓 Blackwell 在 Hopper 基礎上實現一次巨大的飛躍。請記住,摩爾定律和半導體物理學,每三到五年才能帶來大約兩倍的性能提升。我們又如何才能在僅僅一代之內實現 30 到 40 倍的性能提升呢?我們需要 30 到 40 倍的性能提升,因為推理模型正在進行內部對話。它不再是像 ChatGPT 那樣的單次(輸出),現在它是一個推理模型,當你進行內部思考時,它會生成大量更多的 token。你正在一步步地分解問題,進行推理,嘗試各種不同的路徑,也許是思維鏈(chain of thoughts),也許是思維樹(tree of thoughts),或者是 n 選一最佳(best of n)。它正在反思自己的答案。你可能見過這些研究模型在反思答案時會說:“這是一個好答案嗎?”“你能做得更好嗎?”而它們會說:“哦,是的,我能做得更好”,然後回去再思考一下。因此,這些思考模型、推理模型取得了令人難以置信的性能,但這需要更多的計算能力。

最終結果是,MV Link 72、Blackwell 架構帶來了性能的巨大飛躍。這種解讀方式是:x軸代表它的思考速度。y軸代表工廠能輸出多少,同時支援大量使用者。因此,你希望工廠的吞吐量儘可能高,這樣你就能支援儘可能多的人,從而使你的工廠收入儘可能高。你希望這個軸儘可能大,因為人工智慧很智能,它在這裡比在那裡更智能。思考得越多,速度越快,就能在提供答覆前進行更充分的思考。因此,這與Token的平均銷售價格(ASP)有關,也與工廠的吞吐量有關。這兩者的結合就是工廠的收入。這家基於 Blackwell 的工廠,得益於其架構,能夠產生巨額收入。我們所建造的成果真是令人難以置信。我們為您製作了一段視訊,只是為了讓您感受一下建構 Grace Blackwell 所投入的工程量的浩瀚。請看。

Blackwell 是一項工程奇蹟。它始於一塊空白的矽晶圓。數百道晶片處理和紫外線光刻工序,在一塊 12 英吋的晶圓上,逐層建構起 2000 億個電晶體。晶圓被劃分為單個的 Blackwell 裸晶,經過測試和分揀,分離出合格的裸晶以進入下一階段。通過基板上晶片的晶圓級工藝,32 個 Blackwell 裸晶和 128 個 HBM 堆疊被連接固定到定製的矽中介層晶圓上。金屬互連線直接刻蝕其上,將 Blackwell GPU 和 HBM 堆疊連接起來,形成每個系統和封裝單元,並將所有元件固定就位。隨後,整個元件經過烘烤、塑封和固化,從而製成 Blackwell B200 超級晶片。每個 Blackwell 晶片都在 125 攝氏度的烤箱中進行壓力測試,並被推向其性能極限,持續數小時。機器人晝夜不停地工作,將超過 10,000 個元件拾取並放置到 Grace Blackwell PCB 上。與此同時,定製的液冷銅塊也已準備就緒,以保持晶片處於最佳溫度。在另一個工廠,ConnectX 7 SuperNICs 正在製造,以實現橫向擴展通訊,同時 BlueField 3 DPU 也在製造,以解除安裝並加速網路、儲存和安全任務。所有這些部件匯聚在一起,被精心整合到 GB200 計算托盤中。NVLink 是 NVIDIA 發明的一種突破性高速互連技術,用於連接多個 GPU 並擴展成為一個巨大的虛擬 GPU。NVLink 交換托盤由 NVLink 交換晶片構成,提供每秒 14.4 太字節的全互聯頻寬。NVLink 主幹形成定製的盲插式背板,通過 5,000 根銅纜將全部 72 個 Blackwell,即 144 個 GPU 裸片,連接成一個巨大的 GPU,提供每秒 130 太字節的全互聯頻寬,這超過了全球網際網路的峰值流量。零部件從世界各地運抵,由熟練的技術人員組裝成機架規模的 AI 超級電腦。總計 120 萬個元件、兩英里長的銅纜、130 兆個電晶體,總重量近兩噸。Blackwell 不僅僅是技術奇蹟。它是全球協作與創新力量的明證,正在推動將塑造我們未來方方面面的發現和解決方案。我們致力於賦能我們這個時代的天才們,讓他們完成畢生事業。我們迫不及待地期待著您們帶來的突破。

Grace Blackwell 系統,全部投入生產。這真是一個奇蹟。從技術角度來看,這是一個奇蹟,但集結起來建構這些 GB200 系統(每套重兩噸)的供應鏈更是奇蹟,我們現在每周能生產一千套系統。之前從未有人以如此規模批次生產過超級電腦。這些機架中的每一個,本質上都是一台完整的超級電腦。僅在2018年,最大的Volta系統——Sierra超級電腦,其性能甚至不如這些機架中的一個。而那個系統功耗為10兆瓦。而這僅為100千瓦。2018年至今,代際更迭帶來的巨大差異在於,我們已真正將超級計算,特別是AI超級計算,提升到了一個全新的水平。而我們現在正以巨大規模生產這些機器裝置。

而這僅僅是個開始。事實上,你所看到的僅僅是一個系統,即Grace Blackwell。全世界都在談論這一個系統,爭相要求將其部署到全球資料中心,用於訓練、推理和生成式AI。然而,並非所有人以及並非所有資料中心都能處理這些液冷系統。某些資料中心需要企業級堆疊,需要運行 Linux Red Hat、Nutanix 或 VMware 的能力,以及來自 Dell EMC、Hitachi、NetApp、Vast、Weka 等諸多不同的儲存系統,如此之多不同的 IT 系統。而這些系統的管理必須以與傳統 IT 系統一致的方式進行。我們有如此多的新電腦正準備投入量產。我非常高興地告訴大家,其中的每一個都已投入量產。你們還沒有看到它們。它們正從生產線上加速出貨,供不應求,而這一切都始於此地。

DGX Spark 讓您能夠基本上在您的桌面電腦上擁有 Grace Blackwell 系統。就 Spark 而言,是桌面電腦。就 DGX Station 而言,是辦公桌旁。這樣,在開發軟體和AI時,您就不必一直佔用超級電腦了。但您希望架構完全相同。從架構角度來看,這些系統是完全一致的。從軟體開發人員的角度來看,它看上去是完全一樣的。唯一的區別是規模和速度。而在這一側,是所有的x86系統。全球IT組織仍然青睞x86並認可x86。只要能充分利用最先進的AI原生系統,他們就會去利用;當他們無法這樣做,又希望將其整合到企業IT系統時,我們現在為他們提供了這樣做的能力。

最重要的系統之一,也是我們耗時最久才建構完成的系統,因為它軟體和架構都極其複雜,那就是如何將AI原生架構引入並融入到傳統的企業IT系統中。這就是我們全新的RTX Pro伺服器。這是一個非凡的系統。主機板經過了完全重新設計。女士們,先生們,珍妮·保羅。這塊主機板看起來如此簡潔。然而,在這塊主機板上,有八個 SuperNIC 交換機,通過一個每秒200吉位元的尖端網路晶片連接八個 GPU,該晶片隨後連接這八個 GPU 以及這些 Blackwell RTX Pro 6000 GPU。全新產品,剛剛投入生產。其中八個安裝到一台伺服器中。那麼,它有何特別之處?這台伺服器是世界上唯一一台能夠運行世界上所有已編寫內容以及輝達開發過的所有內容的伺服器。它運行人工智慧、Omniverse、用於視訊遊戲的 RTX,它運行 Windows、它運行 Linux,運行 Kubernetes,它運行 Kubernetes 和 VMware。它基本上運行一切。如果您想將Windows桌面從一台電腦流式傳輸到您的遠端裝置,毫無問題。如果您想流式傳輸Omniverse,毫無問題。如果您想運行您的機器人技術堆疊,毫無問題。僅是這台特定機器的質量保證就令人難以置信。它所運行的應用程式,基本上是普遍適用的。迄今為止世界上開發的所有一切都應該能在這裡運行。其中,如果您是一名視訊遊戲玩家,也包括《孤島危機》。因此,如果您能運行《孤島危機》,您就能運行任何程序。好的,這就是RTX Pro伺服器,一個全新的企業級系統。

AI 工廠:新工業革命的核心

黃仁勳: 那麼,某種變化正在發生。我們知道人工智慧是一項極其重要的技術。我們現在確切地知道,人工智慧是一種能夠徹底改變並顛覆每一個行業的軟體。它能夠實現這些令人驚嘆的成就。這一點我們是清楚的。我們也知道,處理人工智慧的方式與我們過去處理人工編寫軟體的方式有著根本性的不同。機器學習軟體的開發方式不同,其運行方式也不同。系統的架構、軟體的架構,完全不同。網路運行的方式,完全不同。其作為儲存的方式,完全不同。

那麼,我們知道這項技術能夠做各種各樣的事情,令人難以置信的事情。它具有智能。我們也知道它的發展方式與以往截然不同。它需要新型電腦。真正有趣的問題是,這一切對國家、對公司、對社會而言意味著什麼?而這是一個我們早在近十年前就做出的觀察,如今每個人都已醒悟過來。

事實上,這些人工智慧資料中心根本不是資料中心。它們並非傳統意義上的資料中心。儲存您所檢索的檔案的。這些資料中心並未儲存我們的檔案。它只有一個職責,而且僅此一個。生產智能標記。人工智慧的生成。這些人工智慧工廠從其內部有大量電腦這一點來看,看起來像資料中心,但這就是所有不同之處。它的設計方式,它被製造、擴展、設計和建造的規模,它的使用方式,它的編排、配置和營運方式,以及人們如何看待它——例如,沒有人真正把他們的資料中心看作一個創收設施。我說了一件事,每個人都會說:“嗯,我想你是對的。”從來沒有人把資料中心看作一個創收設施。但他們會把他們的工廠,他們的汽車工廠,看作創收設施。他們迫不及待地想再建一個工廠。因為每當你建造一個工廠,收入很快就會隨之增長。你可以為更多人建造更多事物。那些想法與這些人工智慧工廠中的想法完全相同。它們是創收設施。它們旨在生產令牌。

這些令牌可以被重構為眾多行業的生產性智能,以至於人工智慧工廠現已成為一個國家基礎設施的一部分,這就是為什麼你看到我在世界各地奔波與各國元首對話的原因,因為他們都想擁有人工智慧工廠。他們都希望人工智慧成為他們基礎設施的一部分。他們希望人工智慧對他們而言是一個增長型的製造業。這確實意義深遠。我認為,由於所有這一切,我們正在談論一場新的工業革命,因為每一個行業都受到影響,以及一個新興產業的誕生,正如電力成為一個新興產業一樣。起初,當它被描述為一項技術並作為一項技術被展示時,它被理解為一項技術,但後來我們明白它也是一個龐大的產業。接著是資訊產業,我們現在稱之為網際網路,二者都因其影響了如此多的行業,而成為了基礎設施的一部分。我們現在擁有一個新興產業,即人工智慧產業,它現在是被稱為“智能基礎設施”的新型基礎設施的一部分。每個國家、每個社會、每個公司都將依賴它。

你可以看到它已經實現了規模化。這是一個備受關注的案例。這是 Stargate。這看起來不像一個資料中心。它看起來像一個工廠。這是一吉瓦(的設施)。它將容納大約五十萬個 GPU 核心。並產生可供所有人使用的海量智能。

歐洲的 AI 雄心:建構主權基礎設施

黃仁勳: 歐洲現在已經意識到這些人工智慧工廠的重要性,以及人工智慧基礎設施的重要性,我很高興看到這裡有如此多的活動。這是歐洲電信公司正在與輝達合作建設人工智慧基礎設施。這是歐洲雲服務提供商正在與輝達合作建設人工智慧基礎設施。這是歐洲超級計算中心正在與輝達合作建設下一代人工智慧超級電腦和基礎設施。而這僅僅是個開始。這還不包括公有雲中即將出現的內容。這還不包括公有雲。因此,這是由歐洲公司為歐洲市場在歐洲本地建構的人工智慧基礎設施。還有20個正在規劃中。20個新增的人工智慧工廠,其中有幾個是超級工廠。總計,僅在兩年內,我們將把歐洲的人工智慧算力增加10倍。因此,研究人員、初創公司,以及你們的AI短缺、GPU短缺問題都將很快得到解決。它即將到來。

現在我們正在與各個國家合作,以發展各自的生態系統。因此,我們正在七個不同的國家建設人工智慧技術中心。這些人工智慧技術中心的目標是,一是進行合作研究,二是與初創公司合作,並建設生態系統。讓我向你們展示一個生態系統是什麼樣子。在英國,我昨天剛去過那裡,這些生態系統是建立在輝達技術堆疊之上的。舉例來說,每一個輝達,眾所周知,輝達是唯一可在所有雲平台使用的AI架構。它是除了x86之外,唯一一種普遍可用的計算架構。我們與每一家雲服務提供商都有合作。我們加速來自世界上最重要的軟體開發商的應用程式,例如歐洲的西門子、Cadence、Red Hat、ServiceNow。我們已經徹底改造了計算堆疊。眾所周知,計算不僅僅是一台電腦,它還包括計算、網路和儲存。每一層,每一個堆疊都已被徹底改造。我們與思科有著良好的合作關係,他們昨天在會議上發佈了一款基於輝達的全新模型。戴爾,也有著良好的合作關係。NetApp、Nutanix,以及一大批良好的合作關係。

正如我之前提到的,軟體的開發方式已經發生了根本性變化。不再僅僅是編寫 C 程序、編譯 C 程序、交付 C 程序。現在是 DevOps、ML Ops、AI Ops。所以,整個生態系統正在被重塑,我們的生態系統合作夥伴遍佈各地。當然,還有解決方案整合商和提供商,他們可以幫助每家公司整合這些能力。嗯,在英國,我們有合作的特殊公司。確實有非常棒的公司,從研究人員到開發人員再到合作夥伴,幫助我們提升當地經濟和當地人才的技能水平。那些使用技術的企業,當然還有雲服務提供商。我們在英國有很棒的合作夥伴。我們在德國有很棒的合作夥伴。在德國,我們有著難以置信的、非常棒的夥伴關係。我們在義大利擁有良好的合作關係。當然,我們在法國也擁有卓越的合作關係。沒錯,法國加油!馬克宏總統稍後會來到這裡。我們將談及一些新的公告。所以,我們必須對人工智慧表現出一些熱情,好嗎?這樣就對了。向他展示一些熱情。所以,我們在法國擁有卓越的合作關係。

我想特別強調一個:我們與施耐德的合作關係。甚至建造這些AI工廠,我們現在也以數字方式建造它們。我們以數字方式設計它們,以數字方式建造它們,以數字方式營運或最佳化它們,並且最終我們甚至會在數字孿生中以完全數位化的方式最佳化和營運它們。這些AI工廠非常昂貴,有時高達500億美元,未來甚至會達到1000億美元。如果這些工廠的利用率未能達到最高,那麼工廠所有者將承擔難以置信的成本。因此,我們需要在所有可能的地方進行數位化並使用AI,將一切都放入Omniverse中,以便我們擁有直接和持續的遙測資料。

我們在這裡有一個重要的合作夥伴關係,今天將對外公佈。這是一家年輕的公司,有一位我非常欣賞的CEO,他正在努力建立一家歐洲AI公司。這家公司的名字是Mistral。今天我們正在宣佈我們將在歐洲共同建設一個AI雲平台,以交付他們的模型,以及為其他AI初創公司的生態系統提供AI應用,這樣他們就可以使用Mistral模型或他們喜歡的任何模型。因此,Mistral 和我們,將合作在這裡建設一個非常大規模的人工智慧雲,今天晚些時候我們將與馬克宏總統討論更多細節。

Nemotron 與智能體:讓人工智慧無處不在

黃仁勳: 人工智慧技術正以光速發展。我在這裡向大家展示的是,左側的專有模型正以光速發展。然而,開源模型也正以光速發展。僅僅落後幾個月。無論是 Mistral、Llama、DeepSeek R1、即將推出的 R2,還是 Qwen,這些模型都非常出色。它們每一個都非常出色。因此,在過去幾年中,我們一直致力於動用一些世界上最頂尖的人工智慧研究人員,來使這些人工智慧模型變得更好。我們稱之為 Nemotron。

基本上,我們所做的是,我們獲取那些開放原始碼的模型——當然,它們無論如何都是基於 NVIDIA 建構的——因此我們獲取這些開源模型,然後進行後訓練。我們可能會進行神經網路架構搜尋。我們可能會進行神經網路架構搜尋,為其提供更優質的資料,使用強化學習技術,增強這些模型,賦予它推理能力,並擴展上下文,以便它在與您互動之前能學習和閱讀更多內容。這些模型大多數的上下文都相對較短,而我們希望它們擁有巨大的上下文處理能力,因為我們想將其用於企業應用中,而我們希望與之進行的對話在網際網路上是不可獲取的。它存在於我們公司內部。因此我們必須為其載入海量的上下文資訊。所有這些能力隨後都被打包成一個可下載的NIM。您可以訪問輝達的網站,直接下載一個API,一個最先進的AI模型,將其部署到任何您喜歡的地方,我們會對其進行大幅改進。

這是Nemotron 相對於 LLAMA 的改進示例。所以LLAMA 8B、70B、405B,通過我們的後期訓練能力、推理能力的擴展以及我們提供的所有資料,得到了大幅增強。我們將不斷地進行迭代。因此,所有將使用此 Nemotron 的使用者都將知道,未來還有大量其他模型,而且它們無論如何都是開放的。因此,如果您想從開放模型開始,那太棒了。如果您喜歡從 Nemotron 模型開始,那太棒了。而 Nemotron 模型的性能非常出色。在一次又一次的基準測試中,Nemotron 的性能在各項榜單上都名列前茅。因此現在您知道,您可以使用一個增強的、仍然開放且在排行榜上名列前茅的模型。您也知道輝達致力於此,因此只要我還活著,我就會一直這樣做,好嗎?這項策略太棒了。

這項策略如此出色,以至於歐洲各地的區域模型製造商和開發者現在已經認識到這項策略有多麼出色,我們正在合作,為區域語言調整併增強這些模型。您的資料歸您所有。你的資料屬於你。它是你民族的歷史、你民族的知識、你民族的文化。它屬於你。對於許多公司,以輝達為例,我們的資料大部分是內部資料。33年的資料。我今天早上查了一下,西門子,180年的資料。其中一些寫在紙莎草紙上。羅蘭·布什就在這裡。我想拿我的好朋友羅蘭·布什開開玩笑。所以,在人工智慧能夠學習之前,你們必須將這些資料數位化。因此,資料歸您所有。您應該使用這些資料,使用像Lemotron這樣的開放模型以及我們提供的所有工具套件,以便您能夠根據自己的用途對其進行增強。

我們還宣佈,我們與Perplexity建立了良好的合作關係。Perplexity是一個推理搜尋引擎。沒錯。我使用的三個模型是ChatGPT、Gemini Pro和Perplexity。這三個模型我交替使用。Perplexity非常出色。我們今天宣佈,Perplexity將整合這些區域模型並將其直接連接到Perplexity中,這樣您現在就可以以您國家的語言、文化和符合當地文化習慣的方式提問並獲取答案。好的,所以是Perplexity和區域模型。

智能體AI。智能體意義重大。正如您所知,最初,對於預訓練模型,人們會說,但它會產生幻覺。它會胡編亂造。您說的完全正確。它無法獲取最新的新聞和資料資訊。完全正確。它在沒有對問題進行充分推理的情況下就放棄了。彷彿每一個答案都必須從過往資料中記憶而來。完全正確。所有這些事情,你知道的,它為什麼試圖弄清楚如何計數並加數?它為什麼不用計算器呢?你說得一點沒錯。因此,所有這些與智能相關的能力,儘管每個人都能提出批評,但他們說得完全正確,因為大家大體上都明白智能是如何運作的。但這些技術正在世界各地被建構,並正在融合匯聚,從資訊檢索、增強生成,到網路搜尋,再到多模態理解,以便你能夠閱讀PDF、存取網站、查看圖像和文字、收聽視訊、觀看視訊,然後將所有這些理解融入到你的語境中。當然,你現在也能理解來自幾乎任何事物的提示。你甚至可以說:“我要問你一個問題,但請從這張圖片開始。”我可以說,請在你回答問題或執行我要求你做的事情之前,先從這段文字開始。它隨後就會進行推理、規劃並自我評估。所有這些能力現已整合,你也可以看到它們正在各地湧入市場。

智能體AI是真實存在的。智能體AI相較於一次性AI,是巨大的階躍式發展。一次性AI是奠定基礎所必需的,以便我們能夠教導這些智能體如何成為智能體。你需要對知識和推理有基本的理解,才能具備可教性。因此,預訓練關乎AI的可教性。後訓練、強化學習、監督學習、人類演示、上下文提供、生成式AI,所有這些正匯聚一堂,共同構成了現在的智能體AI。

讓我們來看一個例子。讓我向你展示一些東西。它基於Perplexity建構,而且非常酷。AI智能體是數字助手。基於提示,它們進行推理並將問題分解為多步驟計畫。它們使用適當的工具,與其他代理協作,並利用記憶中的上下文在NVIDIA加速系統上正確執行任務。它始於一個簡單的提示。讓我們請Perplexity協助在巴黎啟動一家餐車業務。首先,Perplexity代理對提示進行推理並制定計畫,然後呼叫其他代理,使用多種工具協助處理每個步驟。市場研究員閱讀評論和報告,以發現趨勢並分析競爭市場。基於這項研究,一位概念設計師探索當地食材並提出菜單,包括準備時間估算,並研究口味偏好並生成品牌標識。接著,財務規劃師使用蒙特卡洛模擬來預測盈利能力和增長軌跡。營運規劃師建立啟動時間表,包含所有細節,從購買裝置到獲取所需許可證。行銷專員制定啟動計畫,包含社交媒體行銷活動,甚至編寫一個互動網站,包括地圖、菜單和線上訂購功能。每個代理的工作匯聚成一份最終的打包提案,而這一切都始於一個單一的提示。

一個提示,像原始聊天機器人中的那種一個提示,會生成幾百個令牌。但是現在,僅僅一個提示輸入到一個代理來解決問題,它一定生成了10,000倍多的令牌。這就是為什麼Grace Blackwell是必要的。這就是為什麼我們需要性能,並且系統在代際上要表現出如此高得多的性能。

嗯,這就是Perplexity建構他們代理的方式。每家公司都將不得不建構自己的代理。這太棒了。你將要僱傭來自OpenAI、Gemini、Microsoft Copilot、Perplexity和Mistral的代理,並且會有為你建構的代理。它們可能會幫助你規劃一次假期,或者,你知道,去做一些研究,等等。然而,如果你想建立一家公司,你將需要使用專業工具並具備專業技能的專業代理。那麼問題是,你如何建構這些代理?因此,我們為你建立了一個平台。我們建立了一個框架、一套你可以使用的工具,以及一大批合作夥伴來幫助你實現它。它始於最底層,即具備我之前談到的推理模型的能力。輝達的Nemo、Nemotron推理大語言模型都是世界一流的。我們擁有Nemo Retriever,它是一個多模態、語義搜尋引擎。表現卓越。我們建構了一個可操作的演示藍圖,它本質上是一個通用代理。我們稱之為IQ、AI、AIQ。此外,我們擁有一套工具,可讓您引入一個通用代理,精心整理資料來訓練它、評估它、設定安全保障、監督、訓練它、使用強化學習,直至部署,並確保其安全無虞。這套工具包,以及這些庫,都已整合到AIOps生態系統中。您也可以自行從我們的網站下載,但它主要還是整合在AIOps生態系統中。基於此,您可以建立自己的特殊代理。許多公司正在這樣做。這是思科。他們昨天宣佈了此事。我們正在共同建構用於安全的人工智慧平台。

現在,請看這個。AI代理並非一個模型就能包攬所有這些了不起的事情。這是一個模型集合,一個模型系統。這是一個人工智慧大型語言模型系統。其中一些針對特定類型的任務進行了最佳化。正如我提到的,例如檢索、執行技能,以及使用電腦。你不會想把所有這些東西都打包成一個龐大無比的單一人工智慧,而是會把它分解成小的部分,然後你可以隨著時間的推移對其進行持續整合/持續部署。這是思科的一個例子。

那麼現在的問題是,你該如何部署它呢?因為正如我之前提到的,輝達的計算資源位於公有雲中。還有區域雲。我們稱它們為NCP。例如,這裡有 Mistral。您可能擁有私有雲解決方案,因為這符合您的安全和資料隱私要求。您甚至可能決定在本地(您的桌面上)運行某些系統。那麼,問題是,您如何運行所有這些呢?而有時它們在不同的地方運行,因為這些都是微服務。這些是能夠相互通訊的人工智慧。它們顯然可以通過網路相互通訊。那麼,您如何部署所有這些微服務呢?

那麼,我們現在有一個出色的系統。我非常高興能向大家宣佈這一點。這就是我們稱之為DGX Lepton的產品。您在此處看到的DGX Lepton,實際上是眾多不同的雲。這裡有Lambda雲、AWS雲,等等。這裡還有您自己的開發人員機器,您自己的系統。它可以是DGX工作站、Nibias、Yoda、Nscale。它可以是AWS。它可以是GCP。NVIDIA的架構無處不在。因此,您可以決定在何處運行您的模型。您可以使用一個超級雲來部署它。所以,它是一個雲之雲。一旦你讓它運行起來,一旦你將這個NIMS部署到Lepton中,它就會在你所選擇的各種雲端進行託管和運行。一種模型架構,一次部署,你就可以在任何地方運行它。你甚至可以在這台小巧的機器上運行它。你們看,這台DGX Spark,它...這是一個咖啡時間嗎?看看這個。它擁有2000馬力。這是我最喜歡的小機器,DGX Spark。

首款人工智慧超級電腦,我們在2016年建造了一台人工智慧超級電腦。它被稱為DGX-1。它是我一直以來所談論的一切的第一個版本。八塊 Volta GPU 通過 NVLink 連接。我們投入了數十億美元來建造它。而在我們宣佈 DGX-1 的那一天,沒有客戶,沒有興趣,沒有掌聲,只有百分之百的困惑。為什麼會有人建造一台那樣的電腦?它能運行 Windows 嗎?不能。所以我們還是建造了它。幸好,舊金山的一家年輕的公司,一家初創公司,一家非營利性初創公司,看到這台電腦時非常高興,他們說:“我們能得到一台嗎?”我心想,天那,我們賣出了一台。但後來我發現它是一家非營利組織。但我把一台電腦,把一台DGX-1放進我的車裡,然後我把它開到了舊金山。而那家公司的名字是OpenAI。我不知道那裡面有什麼人生教訓。有很多非營利組織。你知道,所以下次,但也許教訓是這樣的。如果有開發者聯絡你,需要GPU,答案是肯定的。沒錯,就是這樣。

所以想像一下你擁有Lepton。它在你的瀏覽器裡。而你擁有這個Helm Chart,一個你開發的人工智慧代理。您想讓它在這裡運行。其中一部分您想在AWS中運行。另外一部分您想在某個區域雲中運行。您使用Lepton,部署您的Helm Chart,它便會神奇地顯示在這裡。明白嗎?因此,如果您想先在這裡運行它,直到完成並準備好部署,然後再將其部署到雲端,那真是太棒了。但美妙之處在於,這種架構是基於Grace Blackwell的。GB10、GB200、GB300,以及所有這些不同的版本,但這種架構正是Grace Blackwell。這真是太棒了。

所以我們正在為Lepton做這件事,但接下來,輝達(NVIDIA)已將 Lepton 與 Hugging Face 連接起來了。因此,無論何時你在 Hugging Face 上訓練模型,如果你想將其部署到 Lepton 並直接接入 Spark,都沒問題。只需點選一下即可。因此,無論你是進行訓練還是推理,我們現在已連接到 Hugging Face,Lepton 將幫助你決定部署位置。讓我們來看看。

開發者需要便捷可靠的計算資源,以滿足他們的工作需求,無論他們身在何處,無論他們在建構什麼。DGX Cloud Lepton 提供對全球 GPU 網路的按需訪問,這些網路分佈在不同的雲、區域以及 Yoda 和 Nebius 等合作夥伴之間。多雲 GPU 叢集通過單一統一的介面進行管理。資源調配速度快。開發者可以快速擴展節點數量,無需複雜的設定,即可立即開始訓練,這得益於預整合的工具和訓練就緒的基礎設施。進度可即時監控。GPU性能、收斂性及吞吐量盡在您的掌握之中。您可以直接在控制台內測試您的微調模型。DGX Cloud Lepton 可以在多個雲或區域中部署 NIM 端點或您的模型,以實現快速分佈式推理。正如共享出行應用將乘客與司機連接起來一樣,DGX Cloud Lepton 將開發者與 GPU 計算連接起來,驅動著一個虛擬的全球 AI 工廠。DGX Cloud Lepton。

好的,那麼那是思科。這就是 SAP 在輝達建構 AI 平台的方式。Sana 正在基於輝達建構 AI 商業應用自動化。DeepL 正在基於輝達 AI 建構他們的語言框架和平台。Photoroom,一個視訊編輯和 AI 編輯平台,正在基於輝達建構他們的平台。這是 Codo,以前我認為是 Codium,一個基於輝達建構的卓越編碼智能體。這是 Iola,一個基於輝達建構的語音平台。而這個是臨床試驗平台,是全球最大的、基於輝達建構的臨床試驗自動化平台。

因此,所有這些基本上都建立在相同的理念之上。NIMS,它將 Nemotron 大語言模型或其他大語言模型(如 Mistral 等)封裝並打包在一個虛擬容器中,可以部署到任何地方。然後,我們整合了一些庫,這些庫基本上涵蓋了一個人工智慧、一個人工智慧智能體的整個生命周期。你對待人工智慧智能體的方式,有點像對待數字員工。所以你的 IT 部門需要讓它們入職、精細調整、訓練、評估、確保它們遵守規定、保持安全,並持續改進它們。而整個框架平台就叫做 Nemo。所有這些目前正在全球各地被整合到一個個應用程式框架中。這只是其中少數幾個例子。接下來,我們讓您可以在任何地方部署它們。如果您想在雲端部署,雲端有 DGX,也有 GB200。如果您想在本地部署,因為您擁有 VMware、Red Hat Linux 或 Nutanix,並且想在本地虛擬機器中部署,您也可以實現。如果您想將其部署為私有雲,您也可以做到。您甚至可以直接部署在您的 DGX Spark 或 DGX Station 上,毫無問題。因此,Lepton 將幫助您實現這一切。

工業 AI:數字孿生重塑製造業

黃仁勳: 讓我們來談談工業人工智慧。這是我最喜歡的時刻之一。這是羅蘭·布什。這是一個令人開心的時刻。他想提醒我,神經電腦,也就是神經網路電腦,是在歐洲發明的。這就是這整個幻燈片(要表達的)。那真是個美妙的時刻。這就是 Synapse 1。各位,這簡直不可思議。Synapse 1。這是 Synapse 1,1992年。它運行神經網路的速度比當時的中央處理器快8000倍。這難道不令人難以置信嗎?那麼這就是世界的AI電腦。羅蘭只是想……永遠不要忘記那一點,黃仁勳。永遠,永遠不要忘記那一點。我說,好的,好吧。我會告訴……甚至我會告訴大家。西門子,1992年。西門子,1992年。

我們與西門子有著出色的合作關係。西門子和首席執行官羅蘭·佈施正在為公司注入強大動力,使其能夠跨越、徹底跨越上一次IT工業革命,並將歐洲的工業能力、西門子的工業能力和雄厚實力與人工智慧融合,從而開創所謂的工業AI革命。我們正在與西門子在諸多不同領域展開合作。從設計到模擬,到工廠的數字孿生,再到工廠中人工智慧的營運,所有環節都端到端地涵蓋其中。這也讓我們/我再次意識到歐洲工業實力的非凡之處。這對你們而言是多麼非凡的機遇。這是一個非凡的機遇,因為人工智慧不同於普通軟體,它是一種真正、真正智能的軟體。而這種智能軟體最終能夠做一些事情,徹底變革你們所服務的產業。所以,我們製作了一段“情書”視訊,不妨這麼說。讓我們播放這段視訊。

它始於此。第一次工業革命。瓦特蒸汽機和機械織布機帶來了自動化,並促成了工廠的興起。工業由此誕生。電氣時代。安培闡明了電磁學。法拉第發明了第一台發電機。而麥克斯韋則為現代電氣工程奠定了基礎。西門子和惠特斯通的發電機。電力之源。讓機器、火車、工廠和城市煥發生機。使地球電氣化。點燃現代製造業。而今,誕生於計算與資訊時代,第四次工業革命。人工智慧時代。重塑工業的每一個環節。遍佈大陸,工業人工智慧正日益普及。從設計到工程,你們正在開創新的路徑,邁向更深刻的理解與革新。你們將物理世界帶入虛擬世界。用於規劃和最佳化全球的現代化工廠。你們正在建構新的前沿。在這裡,所有移動的事物都已實現機器人化。每一輛汽車。一個智能自主體。以及一支新型協作型勞動力隊伍,以幫助我們向前發展。幫助彌合全球勞動力缺口。遍佈整個大陸的開發者們正在建構各種類型的機器人。教會它們新技能。在數字孿生世界和機器人訓練場中。準備讓它們與我們並肩工作。在我們的工廠裡。倉庫裡。手術室。甚至在家中。第四次工業革命已經到來。就在第一次工業革命開始的地方。

你覺得呢?我很喜歡那個視訊。你做的。真棒。你做的。嗯,我們正在與一家又一家公司就工業人工智慧開展合作。這是寶馬。正在Omniverse中建造他們的下一代工廠。這是……我不知道該怎麼說。有人能教教我嗎?聽起來不錯。沒錯。完全正確。幹得好。幹得好。這完全正確。他們當然正在建造他們的工廠。Omniverse 中的數字孿生。這是 Keyon。他們用於倉儲物流的數字孿生。這是梅賽德斯-奔馳及其在 Omniverse 中建構的工廠數字孿生。這是舍弗勒及其在 Omniverse 中建構的倉庫數字孿生。這是您在法國的火車站。在 Omniverse 中建構其火車站的數字孿生。這是豐田在 Omniverse 中建構其倉庫的數字孿生。

當你在Omniverse中建造這些倉庫和工廠時,你就可以設計它、規劃它、改變它。在新建項目中,這是非常棒的。在改造項目中,它也是非常棒的。你可以在實際進行物理搬運和移動物品之前,模擬其有效性,從而避免在事後才發現其並非最優。因此,在數字孿生中以數字方式完成一切的能力是令人驚嘆的。但問題是,為什麼數字孿生必須達到照片級逼真?為什麼它必須遵守物理定律?其原因是,我們最終希望它是一個數字孿生,讓機器人可以在其中學習如何像機器人一樣進行操作。機器人依賴光子來建構它們的感知系統。而這些光子是通過Omniverse生成的。機器人需要與物理世界進行互動。這樣它就能知道自己是否做得對,並學會如何正確地去做。因此,這些數字孿生必須看起來真實,並且行為舉止也符合現實。好的,這就是Omniverse被建立的原因。

這真是太棒了。這是一個核聚變反應堆的數字孿生。如您所知,這是一個極其複雜的儀器。而沒有人工智慧,下一代核聚變反應堆將不可能實現。好的,我們今天宣佈,我們將在歐洲建立世界上第一個工業人工智慧雲。這些工業人工智慧雲,是的,就是雲中大量的電腦。然而,它的要求、它的性能、它的安全要求根本上是不同的。所以,我會在周五告訴你更多關於它的資訊。我今天只是向你透露故事的一部分。但是,這個工業雲將被用於設計和模擬。您只需步入其中的虛擬風洞。您只需將車輛移入其中,便可觀察其運行表現的虛擬風洞。打開車門,打開車窗,改變設計。所有這些都完全即時進行。即時設計。在一個數字工廠的生產車間中建造它。即時數字孿生。所有這一切都是為了讓機器人學習如何成為卓越的機器人。並建造我們未來的機器人。自動駕駛汽車等等。

我們在這裡已經擁有龐大的生態系統。如您所知,我們在這裡已經很久了。輝達已經成立33年了。我們首次來到歐洲是在工作站、產品數位化以及CAD(電腦輔助設計)革命剛剛興起之時。我們曾身處CAE革命之中,而現在又經歷了數字孿生革命。歐洲這裡有一個價值約2兆美元的生態系統,我們與之合作,並有幸為其提供支援。

具身智能:自動駕駛與人形機器人的未來

黃仁勳: 由此誕生的是一場正在發生的新革命。眾所周知,所有會移動的事物都將由機器人技術驅動。所有會移動的事物都將由人工智慧驅動。汽車就是下一個最顯而易見的例子。輝達建構人工智慧超級電腦來訓練模型。用於Omniverse數字孿生的人工智慧超級電腦。我們也建構用於機器人本身的人工智慧超級電腦。無論是在雲端、用於Omniverse,還是在汽車領域,我們都提供完整的堆疊解決方案。電腦本身,以及運行在這台電腦之上的作業系統——每個實例都不同,這台電腦必須是高速的、感測器豐富的、功能完善的、安全的,在任何情況下都絕不能完全失效。因此,其安全要求極高。

而現在,我們擁有一個運行在其之上的、令人驚嘆的模型。這個運行在其之上的模型是一個Transformer模型。它是一個推理模型。它接收感測器輸入,你告訴它你想要它做什麼,它就會把你送到那裡。它接收像素輸入,並生成路徑規劃輸出。所以它是一個基於Transformer的生成式AI模型。令人驚嘆的技術。輝達的AI團隊,自動駕駛(AV)團隊,令人驚嘆。這是我所知的唯一一支連續兩年贏得CVPR端到端自動駕駛挑戰賽的團隊。因此,他們今年再次獲勝。讓我們看看這段視訊。好的,謝謝。

就像任何司機一樣,自動駕駛汽車在一個充滿不可預測且可能存在安全關鍵風險的場景中運行。輝達Drive,基於Halo安全系統建構,使開發者能夠利用多樣化的軟體棧、感測器和冗餘電腦來建構安全的自動駕駛汽車。這始於訓練。安全的自動駕駛汽車需要海量的多樣化資料,才能應對各種極端情況。但真實世界的資料是有限的。開發者使用輝達 Omniverse 和 Cosmos 來重建真實世界,並生成逼真的合成訓練資料,從而為自動駕駛模型帶來多樣性。該模型能夠感知並推理其環境,預測未來結果,並生成運動規劃。為了決策多樣性,一個獨立的經典堆疊平行運行。安全防護機制監測安全性能,並在出現異常情況時,呼叫仲裁器執行緊急停車。感測器和計算架構中也內建了進一步的多樣性和冗餘。每個感測器都連接到冗餘電腦。因此,即使某個感測器或電腦發生故障,車輛仍能保持安全運行。在發生嚴重故障時,系統可以執行最小風險操作,例如靠邊停車。安全是自動駕駛的基石。NVIDIA Drive 讓全球開發者能夠將 Halos 整合到他們的產品中,以打造下一代安全的自動駕駛汽車。

道路上行駛著十億輛汽車,平均每年行駛 10,000 英里,總計 10 兆英里。自動駕駛的未來顯然是極其廣闊的。而它將由人工智慧驅動,並獲得人工智慧的賦能。這是下一個巨大的機遇。我們正與全球各地的大型企業和卓越公司合作,以實現這一目標。在我們自動駕駛(AV)領域所做一切的核心,是安全。我們對我們的Halo系統感到非常、非常自豪。它始於晶片的架構,繼而是晶片設計、系統設計、作業系統、人工智慧模型、軟體開發方法以及我們的測試方式。從我們訓練模型的方式,為模型提供的資料,一直到我們評估模型的方式,涵蓋一切。輝達的Halo系統以及我們的自動駕駛(AV)安全團隊和能力,都絕對享譽全球。這台電腦是首個實現軟體定義的。世界上第一個軟體定義的、完全100%軟體定義的、AI驅動的軟體,以及用於自動駕駛汽車的AI驅動堆疊。我們從事這項工作已經接近10年了。因此,這項能力舉世聞名,我為此感到非常自豪。

汽車行業正在發生的事情,也正在一個新的行業中發生。正如我之前提到的,如果能夠根據提示生成視訊,如果AI能夠感知、推理,並且能夠生成視訊、文字和圖像。就像現在對於汽車而言,它可以生成路徑,方向盤的路徑,為什麼它就不能生成運動能力和關節活動能力呢?因此,AI徹底改變最困難的機器人學問題之一的這種基本能力,即將到來。類人機器人將成為現實。我們現在知道如何建構、訓練和操作這些東西了。類人機器人技術有可能成為有史以來最大的產業之一。這需要懂得製造、並能製造出具備非凡能力物品的公司。這指的是歐洲國家。世界上如此多的產業都設在這裡。我認為這將是一個巨大的機遇。

嗯,假設全世界有十億個機器人。全球有十億個機器人的設想是非常合理的。那麼,為什麼它還沒有實現呢?嗯,原因很簡單。現今的機器人程式設計過於困難。只有最大的公司才能負擔得起安裝機器人,對其進行示教,程式設計讓它做完全正確的事情,並確保其周邊環境安全。這就是為什麼全球最大的汽車公司都擁有機器人的原因。它們的規模足夠大,工作也足夠重複。行業規模足夠大,足以讓你能夠將機器人部署到那些工廠中。對於幾乎所有的中型企業、中小型公司,或者夫妻店、餐廳、商店或倉庫而言,都不可能擁有那樣的程式設計能力。直到現在。我們將提供給你一種本質上可以由你進行教導的機器人。它們會向你學習。正如我們之前談到的具身智能,我們現在擁有了人形AI,它們可以使用與我之前談到的Nemo工具包高度一致的工具包,從你的教導中進行學習。

輝達在這裡也建構了三層堆疊。我們建構了這台電腦,即雷神電腦。開髮套件看起來有點像這樣。這是一台機器人電腦,完全獨立。開髮套件就放在你的桌上。這些都是感測器。裡面是一個小型的超級電腦Thor晶片。確實非常非常不可思議。還有這些,嗯,我能想像其中一個像那樣被植入。好的,謝謝你,Janine。所以那就是Thor處理器。上面是一個專為機器人設計的作業系統。除此之外,Transformer模型接收感測器資料和指令,將其轉換並生成飛行或路徑,以及用於臂部、手指和腿部關節的運動控制。

然而,人形機器人技術面臨的一大挑戰是,訓練它所需的資料量非常非常難以獲取。那麼問題是,你如何做到這一點?解決這個問題的辦法是,利用Omniverse——一個遵循物理定律的數字孿生世界。這是我們正在進行的一項了不起的工作。別這麼做。哦,我的錯。好的,這些是機器人。我們開發用於模擬和訓練它們的電腦,以及安裝在它們內部的電腦。世界上正在建立許多人形機器人公司。它們都看到了徹底改變這種新裝置的巨大機會。進展速度快得驚人。它們學習的方式都是在一個虛擬世界中進行。而這個虛擬世界必須遵守物理定律。最近,我們宣佈與迪士尼研究院和DeepMind建立一項重大的合作關係。我們將合作創造世界上最精密的物理模擬。此時此刻,我只是想弄明白如何切換到那張幻燈片。教教我。誰能幫幫我?這就是只排練一次會發生的情況。好的,所以這個,這個不可思議的系統,就是人工智慧學習如何成為人工智慧的地方。讓我展示給你看。

我們有一位特邀嘉賓。你的名字叫格雷克。你是小男孩還是小女孩?好的,他,格雷克是個小女孩。現在,請看。格雷克在Omniverse中學會了走路,同時遵守了物理定律。然而,在Omniverse內部,我們建立了數十萬個場景。最終,當Grek學會了如何在那些環境中進行操作、行走和操控時,比如在沙地、礫石地、濕滑的地面、水泥地和地毯上。那麼當Grek進入物理世界時,物理世界僅僅是這個世界的第100,001個版本。因此,你學會在虛擬世界中行走,看看你現在。你能,你能跳嗎?哇。你能跳舞嗎?嗯,我想,我想,我只是想讓你知道,我是主旨演講者。所以我需要你,我需要你表現得規矩些。我需要你規矩幾秒鐘。我需要你乖幾秒鐘。你能坐下嗎?坐下。嘿,你知道我們該做什麼嗎?讓我們給所有人拍張照吧。對。咔嚓,咔嚓。你願意跟我回家嗎?你願意跟我回家嗎?我明白了,是的,我知道。嗯,我有寵物。它們會想把你當成寵物。不是嗎?不。你真聰明。你真聰明。嗯,真是不可思議,對吧?你是世界上最好的機器人。總有一天,我們都會擁有一個像你一樣的,它們會跟隨我們左右。但是,如果我需要,如果我需要一杯威士忌,你就得去讓別人給我拿一杯威士忌,因為你沒有手臂。是啊,你真可愛。好的,小女孩,你在這裡等一下。

終章:一個新時代的開啟

黃仁勳: 讓我們做個總結吧。好的。非常清楚,非常清楚一場工業革命已經開始了。下一波,下一波人工智慧浪潮已經開始了。格雷格是如今機器人技術所能實現的完美範例。教會機器人進行操作、模擬所需的技術。當然,一個不可思議的機器人現在就呈現在我們眼前。我們有實體機器人,也有資訊機器人。我們稱之為智能體。因此,新一輪人工智慧浪潮已經開啟。這將導致推理工作負載呈爆炸式增長。這基本上將呈指數級增長。使用推理技術的人數已從800萬人增至8億人,短短幾年內增長了一百倍。正如我之前提到的,提示所包含的令牌數量已從數百個令牌增至數千個令牌。當然,如今我們比以往任何時候都更廣泛地使用人工智慧。因此,我們需要一種專為思考和推理而設計的專用電腦。這就是Blackwell,一台思考機器。這些Blackwell系統將部署到新型資料中心中,它們本質上是人工智慧工廠,專為單一目的而設計。而這些人工智慧工廠將生成Token。而這些Toekn將成為你的食物,小格雷格。是的,我知道。我知道。

真正、真正令人難以置信的是,我非常高興看到歐洲正在全力投入人工智慧。在接下來的幾年裡,這裡正在建設的人工智慧基礎設施數量將增加一個數量級。我想感謝各位的合作。祝Viva Tech大會圓滿成功。謝謝。 (Web3天空之城)