【COMPUTEX 2026】NVIDIA GTC Taipei 2026 主題演講完整中文演講稿

本文為您精心整理的 NVIDIA GTC Taipei 2026 主題演講完整中文演講稿,已按照黃仁勳先生的現場演講邏輯劃分為十一個核心主題段落。講稿在保持100%細節完整的前提下進行了 scannability(易讀性)排版最佳化,並在每段末尾附上了精簡總結。

一、 開場致詞與台灣 AI 生態系統

這就是智能的製造方式。一種新型的工廠,AI 核心基石——Token(標記)的生成器。Token 開闢了新的前沿,將資料轉化為知識、理性與行動。它們揭示了我們從未見過的複雜模式,對應我們的城市以確保安全,並將我們提升到城市之上的高空。Token 幫助機器人向我們學習,與我們並肩工作。它們前往我們無法到達的地方,伸出援助之手,縮小希望與治癒之間的差距,讓我們呼吸更順暢,讓最微弱的心臟跳動得更有力。Token 正幫助我們在從未嘗試過的規模上開闢新天地,以便我們能夠到達“星雲一號”。確認分離,邁向無限及更遠。我們將共同向全人類的美好新未來邁出偉大的下一步。

而在台北,正是這一切開始的地方。歡迎 NVIDIA 創始人兼 CEO 黃仁勳(Jensen Huang)登台。

歡迎來到 GTC 台灣!非常高興見到你們所有人。回到家的感覺真好,我還把我的父母帶回家了,我的父母在那裡? 大家給我的爸爸媽媽來點掌聲吧!也給我們的開場秀巨星們來點掌聲,女士們先生們,看他們多可愛,台灣的超級巨星們。今天這裡來了這麼多人,我們現在正向全台灣其他70 個觀影點進行即時直播。70 個不同的會議在同時進行,所有人都在觀看這場主題演講。我們有太多的事情要告訴你們,我也有太多的合作夥伴要感謝。我們在台灣的生態系統已經龐大到令人難以置信的程度。大多數時候人們想到生態系統,他們想到的只是我們的軟體棧,想到 NVIDIA 所建構的計算系統之上的開發者生態。但NVIDIA 的生態系統實際上一直延伸到上游——我們在台灣的所有供應鏈(這一切開始的地方),並一路延伸到下游的資料中心,最終觸達終端使用者。今天我們要談論幾乎整個生態系統,有太多的人需要感謝,我愛這裡的生態系統,這裡有如此多的公司,以及我最喜愛的一些生態合作夥伴。台灣擁有豐富且堪稱世界最佳的供應鏈生態系統,這簡直令人難以置信。謝謝你們來到現場。今年,我們共同的業務正在實現令人難以置信的增長。事實上,昨晚有人告訴我,台灣的年度 GDP 將增長近 10%。不可思議!我們有很多要聊的,讓我們開始吧。

段落總結

黃仁勳以“Token 是現代 AI 製造工廠的基石”引出主題,並對家鄉台灣致以熱烈問候。他特別強調,NVIDIA 的生態系統遠不止軟體,而是包含了從台灣上游硬體供應鏈到下游資料中心的完整閉環,並指出 AI 產業的爆發正推動台灣實現近 10% 的驚人 GDP 增長。

二、 代理式 AI(Agentic AI)時代的全面降臨

兩年前我來到這裡時,我開始向你們談論 AI 如何從生成式 AI 邁向即將到來的其他 AI 浪潮。下一波浪潮就是代理式 AI(Agentic AI)。今天我們可以宣告:代理式 AI 已經到來,實用型 AI 已經到來。這究竟意味著什麼?以 GitHub 為例,代理式 AI 最早落地的價值應用之一就是軟體程式碼編寫。這是一個極具價值的職業,擁有極其龐大的生態,全球約有 3000萬 到 4000萬 名專業軟體開發人員以寫程式碼為生,如果算上學生和愛好者可能還要再加幾億人。而 GitHub 代表了他們中的大多數。在 GitHub 中,“拉取請求(Pull Request)”是指他們下載軟體並進行修改,“提交(Commit)”則是他們將修改後的程式碼推回倉庫。

如果我們回顧一下資料:

2023 年:程式碼提交量為3 億次

2024 年:程式碼提交量為4 億次

2025 年:僅在前幾個月程式碼提交量就達到了5 億次

2026 年(今年):在最初的幾個月裡,這一數字幾乎翻了三倍

這意味著什麼? 3000萬 軟體開發人員創造了約 3 兆美元的 GDP——也就是他們每年獲得的薪水總額,這部分投入正在為其他行業催生經濟增長。可以說是 3 兆美元的薪水催生並影響了全球各類行業高達 100 兆美元的產值。而現在,這 3 兆美元的薪水投入,正在產生接近以往三倍的產出。通過 3 兆美元的薪水支出,實際上獲得了相當於9 兆美元的生產力。這種差距是絕對驚人的,這就是 AI 的潛力和承諾。

很多人在討論 AI 會減少工作崗位,這完全是胡說八道。事實是,軟體工程師的招聘數量實際上在增加。原因非常簡單:如果你僱用一名軟體工程師就能產生價值 9 兆美元的高效工作產出,你為什麼不想僱用更多的工程師呢? 如果那條生產力曲線是平的,人們顯然會減少招聘。但正因為產出如此不可思議,人們才渴望僱用更多人。這很快就會在我們的經濟中顯現出來。因此,首要觀念是:實用的 AI 已經到來。從產業的角度來看,這意味著Token 現在面臨著極為龐大的需求。因為一旦你能實現這樣的生產力,你就會想要生產更多的 Token。由於 Token 現在成了能直接盈利的營收單位,AI 公司都希望建立更多的 AI 工廠來生成海量 Token。這就是為什麼台灣的計算需求迎來了火箭般的飆升,也正是你們所有人如此忙碌、業務如此興旺的根本原因。事實上,這看起來就像你們當中某些公司的股價走勢。計算模式變了,一切都變了。

段落總結

黃仁勳宣佈“代理式 AI 時代”正式到來,並用 GitHub 提交量在 2026 年初翻了三倍的具體資料進行論證。他指出,AI 讓 3 兆美元的研發薪水撬動了 9 兆美元的生產力,不僅不會搶走工作,反而會促使企業僱用更多工程師。這一變革使得 Token 成為最具盈利能力的商品,進而直接引爆了台灣 IT 供應鏈的算力需求。

三、 全新計算模式與工具呼叫突破

AI 現在是利潤生成器,是 GDP 生成器。在它背後的,是一種全新的計算模式。它不僅僅是一個大語言模型(LLM),而是一個Agent(代理)。今天我們要談論的幾乎所有內容都將基於此。讓我花點時間展示一下它的內部構造:這是一個 Agent 應用程式。在過去,這包含應用程式、程式碼和作業系統。而今天,Agent 是由一個或多個大語言模型(LLM)巢狀在一個軟體外殼(Harness)中組成的,這個外殼負責編排它去執行高效的工作

當輸入(Prompt)到來時,它必須去理解、觀察、推理、行動並使用工具。它能使用的工具可以是電子表格、網頁瀏覽器、資料處理引擎或資料庫引擎。這個 Harness 軟體負責編排資訊的路由:每次涉及處理上下文、理解正在發生的事情、推理下一步該做什麼、以及制定行動計畫時,整個編排路徑都由該軟體控制。它從根本上就是一個 Agent。它像人類一樣,擁有被稱為工作記憶體(Working Memory)的短期記憶以及長期記憶。因此,其記憶體管理系統變得極為重要。大語言模型負責“思考”,而 Harness 則像作業系統一樣將一切連接在一起。這就是全新的計算模型。大語言模型現在能夠極其出色地進行思考、推理、規劃和使用工具,同時配合管理記憶的 Harness,這種同步收斂讓我們能夠實現驚人的應用。

讓我給你們看幾個例子:

示例一:輸入一段提示詞(Prompt),程式碼隨即自動生成並直接輸出運行。我們在這裡使用的是雲端程式碼,但效果極其出色。

示例二:輸入提示詞:“建立一個 GIF 動畫,讓 NVIDIA 標誌性的綠色粒子在黑底上散開,形成台灣 101 大樓的形態。隨後變形為 GTC Taipei 2026,再變形為 NVIDIA 的眼睛 logo,最後散開並循環重複。” 你們剛才看到了,它完美呈現了這一效果。

示例三:輸入提示詞:“我弄丟了遙控器的電池蓋夾扣,它長這樣。請建立一個現成的 CAD 檔案,以便我能直接進行 3D 列印來製作一個新夾扣。”

大家覺得如何?很神奇對吧? 這就是如今全新的計算模式。過去我們是通過啟動應用程式、點選並打字來進行互動;現在,我們將其取代為向 AI 闡明我們的意圖,由 AI 自動生成程式碼或呼叫工具來產出所需的輸出結果。這就是未來電腦的工作方式,這就是代理式 AI。我們為此默默建構了兩年,而現在它已瓜熟蒂落。

段落總結

演講解構了 Agent 的計算模型:由大模型充當“大腦”進行推理規劃,由軟體外殼(Harness)充當“身體和作業系統”來管理長短期記憶並路由資訊。未來的電腦互動將由“點選與打字”徹底變為“向 AI 表達意圖”。黃仁勳強調,這種對工具的頻繁呼叫意味著軟體公司不會倒閉,反而會迎來比以往更大的發展機遇。

四、 CUDA X 庫:賦予 AI 代理的超級工具

工具的使用是一項重大突破。很多人曾對我說:“Jensen,AI 和代理式 AI 來了,所有的軟體公司是不是都要破產了?” 我說恰恰相反,因為世界上將會出現不可計數的 AI 代理。世界將不再受限於人類員工的數量,因此,這些代理對工具的使用頻率將超越以往任何人。對於軟體公司來說,這實際上是一個不可思議的黃金時代。但關鍵在於,軟體必須以一種利於 Agent 理解和呼叫的方式呈現出來。這是一個巨大的突破。而我們所做的,就是將 NVIDIA 最寶貴的財富——所有的CUDA 庫(我稱之為CUDA X 庫)貢獻出來。今天,我們能夠將這些 CUDA X 庫直接提供給 AI 代理,它們呼叫這些庫的效率甚至比人類還要高。因此,這是屬於 CUDA X 庫的美好時代。讓我們來看看:

20 年前,我們建構了 CUDA——一個用於加速計算的單一架構,我們重新發明了計算。上千個 CUDA X 庫正幫助開發人員在科學和工程的每個領域取得突破。現在,CUDA X 庫成為了專供 AI 代理使用的工具

  • 用於計算光刻的 CUlitho
  • 用於決策最佳化的 Coup
  • 用於直接稀疏求解器的 CDSS
  • 用於跨結構化與非結構化文件進行深度研究的 AIQ
  • 用於 AI 無線接入網的 Aerial
  • 用於可微物理的 warp
  • 用於基因組學的 parabrics

它們的基石是演算法,而演算法是美麗的。熱量。熱量。請為數學鼓掌,數學是美麗的。

軟體的計算模式正在發生深刻的改變。

段落總結

隨著 AI 代理數量的爆發,它們對專業工具的需求將遠超人類。黃仁勳自豪地展示了 NVIDIA 過去 20 年積累的最高機密與財富——CUDA X 庫(涵蓋光刻、物理、基因組學等)。現在,這些底層庫已配齊“說明書”,化身為 AI 代理能夠直接自學並高效呼叫的超級工具。

五、 Vera Rubin 架構:全面量產的智能中樞

讓我們回到這裡,Agent 是終極的解耦與分散式運算模型。為了處理一個 Agent 的請求,資料中心內會有許多不同的電腦同時被啟動。Agent 包含模型、外殼、工具/技能以及執行階段(Runtime)。這一切都運行在資料中心的不同位置。你可以把模型看作大腦,外殼看作身體,它所使用的工具在執行階段中工作——就像一個工人在車間裡使用工具一樣。當然,這是在極宏大的規模上進行的,每個步驟都運行在電腦的不同部分。

你可以看到,大語言模型在進行思考、上下文處理、觀察並理解環境、推理、制定計畫並執行。每當這個過程發生時,整整一機架的 Grace Blackwell MVLink72 就會被啟動,配合大語言模型進行思考。而每當它需要使用工具時(這個工具可以是 C 編譯器、Python、JavaScript 或是加速計算),就會用到 CPU。今天的 Agent 還是相對簡單的工具使用者,但明天它們將變得極度成熟,這也是為什麼我剛剛展示的 CUDA X 庫會在 Agent 之間變得無比風靡的原因。我們將為所有的 CUDA X 庫配備技能說明書,AI 讀取它後就能恍然大悟:“啊哈,原來這個工具是這麼用的!” 這種代理呼叫庫的能力將是不可思議的。

在硬體分工上:

工具運行在 CPU、GPU 和大模型上。

安全外殼運行在 CPU 和名為 DPU(NVIDIA BlueField)的安全處理器上。

整個系統的編排工作由 CPU 完成。

其中最難的部分之一是記憶體管理,也就是所謂 KV 快取(KV Caching)的工作記憶體。該記住什麼?如何進行壓實(Compaction)而非僅僅是壓縮?如何檢索結構化與非結構化資料?這些資料本身的管理和相互關係極其複雜。AI 代理的記憶體系統將徹底顛覆並重構現有的儲存系統。這種異構、解耦、分佈式的計算挑戰,恰恰是我們建構下一代計算平台的根本原因。

Vera Rubin不是單枚晶片,也不僅僅是一個 GPU。雖然它以 GPU 為核心,但整個全端系統都是 Vera Rubin。它包含 Vera Rubin MVLink72 GPU、負責編排的Vera CPU、革命性的Vera 儲存系統、配合CX9的網路,以及我們的軟體棧DOA。其內部包含安全處理器,確保資料在靜態、傳輸中以及使用中均被加密。由於 AI 模型資產極其珍貴,整個系統都嚴格遵循機機密計算(Confidential Computing)。

Vera Rubin 是我們公司歷史上最雄心勃勃的壯舉,我們全部 40,000 名工程師都在為其傾注心血。更不用說在座的各位台灣供應鏈夥伴,你們都參與了這一龐大系統的創造。Vera Rubin 堪稱一個奇蹟。多年來,NVIDIA 已經從一家 GPU 晶片公司進化為一家系統公司。你們眼前的,是人類有史以來從頭設計的、最複雜的系統。

告訴大家一個好消息,Vera Rubin 目前已經進入全面量產(Full Production)階段!我們為 Vera Rubin 打造的供應鏈規模是 Grace Blackwell 的兩倍。得益於極端協同設計(Extreme Co-design),過去組裝一個 Grace Blackwell 機架需要 2 個小時,而現在組裝全新的機架僅需 5 分鐘!產能和吞吐速度實現了質的飛躍。

讓我們看看它的硬核製造細節:

核心製造:在 TSMC(台積電)通過數百道工序打造出構成 Vera Rubin 的 7 顆全新晶片。採用3 奈米工藝CoWoS-R 與 CoWoS-L 封裝,並整合了來自美光(Micron)、SK海力士(SK Hynix)和三星(Samsung)的HBM4 記憶體。單張 Vera Rubin 計算板上擁有高達6 兆個電晶體和超過 18,000 個元件。

架構設計:採用第三代 MGX 機架設計,包含 18 個計算托盤、9 個可熱插拔的 NVLink 開關托盤、全新高效率歧管,以及承載超過5000 安培電流(相當於 20 輛全加速狀態下的電動汽車)的液冷母線。整個機架擁有 130 萬個元件,實現了無電纜、無軟管、無風扇的極致彈性和高可靠性設計。

合作夥伴:恭喜微軟(Microsoft)、戴爾(Dell)和 Coreweave成功建立並運行了他們的 Vera Rubin MVL72 工程機架。在富士康和廣達的工廠裡,整合了 256 顆 Gro 3 LPU、具備每秒 40 PB 超高 SRAM 頻寬的 Gro 3 LPX 也在成型,它將以極低延遲生成 Token。同時,Vera Bluefield 4 STX 負責上下文記憶與安全儲存,Spectrum X 乙太網路開關則首次帶來了200G 共封裝光學器件(CPO)。這就是我們與台灣 150 家供應鏈夥伴共同實現的極限協同設計。謝謝你,台灣!

段落總結

黃仁勳宣佈專為代理時代打造的超級電腦平台——Vera Rubin 已進入全面量產。該架構依靠極限協同設計(如背板中介層設計徹底取消了錯綜複雜的內部線纜和軟管),將整機組裝時間由 2 小時縮短至驚人的 5 分鐘。它整合了台積電 3nm 工藝、首發 HBM4 封裝以及 200G CPO 光電共封裝技術,是 4 萬名 NVIDIA 工程師與台灣 150 家硬體供應鏈夥伴共同造就的計算奇蹟。

六、 AI 工廠藍圖與 DSX 基礎設施生態

最終,我們的客戶和夥伴需要的不是零散的電腦,他們想要建造的是AI 工廠。這就是為什麼 NVIDIA 再次開始自我轉型。現在的 AI 基礎設施極其複雜,包含發電、冷卻系統、電網供應商等,諸多工業巨頭都加入了我們的生態。當單個吉瓦(GW)等級的 AI 工廠資本投入從 200億 到 300 億美元攀升至 500億、600 億甚至即將達到800億 到 1000 億美元時,它必須在首次通電時就完美無誤地立刻運轉,其資本成本和複雜度高得驚人。

為此,我們推出了NVIDIA DSX 藍圖——一個用於以最高效率和盈利能力建構並營運 AI 工廠的參考設計。

DSX SIM:借助基於 Omniverse 的 DSX SIM 藍圖,合作夥伴可以在單個機架落地前,就在數字孿生(Digital Twin)中規劃佈局、模擬電力與冷卻、設計網路並驗證每一次變更。

DSX OS:工廠通電後,DSX OS 接管基礎設施,進行配置、營運、監控和故障修復。

DSX LPS / Flex:傳統工廠會超額配電高達 40%。DSX LPS 允許在相同的電力預算內安全部署更多 GPU,收回閒置瓦特,帶來數十億美元的額外收入。突破性的45°C 高溫液冷技術大幅減少了水和能源消耗。DSX Flex 還能讀取即時電網訊號,在電網需要緩解壓力時動態調整工廠功率。

過去我們的生態系統是把 NVIDIA 的計算層嵌入到別人的平台或軟體庫中;而現在,這是一個龐大的AI 工廠生態系統。正因為我們把軟硬體、網路、基礎設施全部連通,並親自投入數十億美元進行真實測試,我們的客戶才能以最快的速度產出第一個 Token、完成第一次推理並開啟模型訓練。

在工廠電力受限的當下,每瓦吞吐的 Token 數量(Tokens per watt)就是你的營業額和利潤。僅僅因為某款晶片便宜就選擇錯誤的架構是毫無意義的,你必須確保你的每瓦收益能讓你“買得越多,賺得越多”。正是由於這種全端基礎設施交付能力,我們得以賦能眾多年輕的新興公司成長為世界級的 AI 雲巨頭,例如估值已達 500億-700 億美元並瘋狂增長的Coreweave,以及 Nebius、Nscale、Naver Cloud、Yotta、Indosat、台灣本土的 GMI 等。目前,全球對算力的極度渴望成為了唯一的制約因素,讓我們一起努力在世界各地建立起 AI 工廠。

段落總結

當單座 AI 工廠的造價逼近 1000 億美元時,NVIDIA 推出了 DSX 全端基礎設施藍圖。它利用 Omniverse 數字孿生在開工前百分百模擬工廠的電力與液冷,並通過 DSX OS 和 45°C 高溫液冷技術壓榨每一瓦電力的價值。黃仁勳強調,在當今時代,“每瓦產出的 Token 數量就是純利潤”,這套一站式工廠藍圖已成功助力包括 Coreweave 在內的多家新型 AI 雲服務商實現飛躍。

七、 專為 AI 代理量產的 Vera CPU

下面我們來談談 CPU:Vera CPU,一款專門為 AI 代理時代打造的 CPU。

直到今天,世界上所有的 CPU 都是為“人類”創造的。我們是使用者,我們在雲端按核租用它們。人類習慣的生活和思考節奏是以“秒”來計算的。但 AI 代理(Agents)完全不同,Agent 極度缺乏耐心,它們活在一個以“納秒”計算的世界裡。當一個 Agent 呼叫某種工具或訪問資料庫時,它要求響應速度必須快如閃電。Agent 處於等待狀態的每一刻,都會阻礙它邁向思考的下一步。因為與它們並存的 GPU 資產太昂貴、太寶貴了,我們絕不能讓 CPU 成為拖累 GPU 利用率的瓶頸,從而直接影響 Token 的吞吐量和使用者體驗。

在我們的全新量產系統中,Vera CPU 承擔了三大核心使命:

在 Vera Rubin 機架內,兩顆 Vera CPU 負責調度和管理 GPU、管理龐大的 KV 快取,並運行系統軟體。

配合 Bluefield,用於實現安全與運行環境的隔離。

用於 Agent 的Harness(軟體外殼),編排 AI 模型、呼叫工具以及進行極其頻繁的資料庫檢索。這使得由 Vera CPU 與 Vera Bluefield 構成的超高速儲存伺服器,直接成為了當今資料中心最關鍵的路徑。

為此,我們徹底推翻了舊的設計,從零開始打造了一款世界上從未見過的專屬 CPU 架構——Vera

關於 Vera CPU,有四個核心的技術飛躍:

世界第一的單線程性能(IPC):它不單純追求多核堆砌,而是死磕單線程延遲。具備業界最高的時鐘指令數,每個時鐘周期可提取、解碼並執行10 條指令

恐怖的核心與全域頻寬:由於代理系統在本質上是高度解耦和分佈式的,網路和傳輸很容易變成瓶頸。Vera 在單一晶片上達到了光刻極限,採用 3.6 TB/s 的全單片網格骨幹網路(Monolithic Mesh Fabric)連接所有 88 個自訂 Olympus 核心,完全消除了傳統 CPU 的 Chiplet(小晶片)拆分懲罰和邊界跨越延遲

業界首發的技術標準:全球首款原生支援PCI Express Gen 6的資料中心 CPU;同時也是首款採用 LPDDR5X 的伺服器晶片,內部吞吐頻寬高達1.2 TB/s,是傳統高性能 CPU 的 2 到 3 倍,同時讓峰值記憶體延遲降低了 40%。

極致的能效比:未來世界上將會有數以百億計的 AI 代理在不知疲倦地運作。Vera 具備無與倫比的能效,可以在不搶佔資料中心寶貴的“Token 生成電費”的前提下,在工廠裡塞進海量的 CPU 算力。

在實際的軟體工作負載中,它的表現令人瞠目結舌:在運行最基礎的資料庫SQL 查詢時,速度直接飆升至傳統架構的 3 倍;而在為紐約證券交易所(NYSE)運行即時流資料處理(Stream Processing)時,速度更是達到了驚人的 6 倍!通常在 CPU 領域,能實現 5% 或 10% 的提升就已謝天謝地,而這種數倍的跨越是聞所未聞的。這是一片由 AI 代理催生的、龐大的全新 CPU 藍海市場,台灣的所有 OEM/ODM 巨頭也已全部加入我們的行列。

段落總結

黃仁勳發佈了 NVIDIA 徹底顛覆舊秩序、專為 AI 代理設計的核心處理器——Vera CPU(擁有 88 個 Olympus 自研核心)。傳統 CPU 是為活在“秒”維度的人類設計的,而 AI 代理活在“納秒”級且極度缺乏耐心,傳統晶片的延遲會導致昂貴的 GPU 處於飢餓狀態。Vera CPU 原生採用 10 IPC 單線程設計、3.6 TB/s 環形匯流排(徹底消除 Chiplet 封裝延遲懲罰)以及 PCIe 6.0 標準,使 SQL 查詢速度飆升 3 倍,紐交所流處理速度飆升 6 倍。

八、 企業級 AI 代理工具包與 Neotron 3 Ultra 模型

這是整場演講中最核心的一張幻燈片。未來十年,“Agent(模型大模型大腦 + Harness 軟體外殼 + 工具呼叫)”將成為絕對主流的計算與應用範式。全球每一家企業都將轉型為 Agent 公司,所有的業務內部都會有 Agent 在日夜運轉,企業也急需一套屬於代理的“安全作業系統”。

為此,我們推出了NVIDIA 企業級 AI 代理工具包(NVIDIA Agent Toolkit for Enterprise AI)。為了這一刻,我們已經在公開場合默默佈局並建構了多年。該工具包完整覆蓋了企業運行代理所需的四大基石:前沿模型(Models)編排外殼(Harness)工具技能(Tools & Skills)以及安全執行階段(Runtime)。其中,我們推出的NVIDIA Open Shell是一套完全開放原始碼的安全沙盒執行階段,它能像硬殼一樣包裹住 Agent,嚴格執行企業的安全隱私政策、保護特權與身份標識,目前已被微軟、Red Hat、Canonical 等巨頭在雲端、本地和裝置端廣泛採用。

很多人曾預言 Agent 會顛覆甚至消滅現有的企業軟體巨頭,我說完全相反。Agent 將為我們的夥伴創造有史以來最龐大的商業機遇。以 NVIDIA 內部最核心的生命線——晶片設計為例,我們與Cadence深度聯手,利用該工具包打造了專屬的晶片設計超級代理(Chip Design Super Agent)

晶片設計要在微觀尺度上協調數兆個電晶體和三維電路,那怕漏掉一個極其微小的 bug,都會導致晶片上市推遲數月、損失慘重。以往,NVIDIA 幾千名工程師每年要消耗數個十億等級的計算時數去跑幾百萬個測試,改一個 bug 的周期往往長達數周。現在,通過讓數十萬個 Cadence 超級代理在沙盒中自主驅動設計、運行 Excel 模擬和 Jasper 形式驗證,原本需要耗時數周的硬體驗證周期,現在僅僅幾個小時就能搞定,效率整整提升了 40 倍以上

為了讓全世界所有的企業都能像 Cadence 一樣輕鬆定製專有的超級代理,我們今天正式發佈新一代頂級開源模型——Neotron 3 Ultra!我們不僅毫無保留地開源模型本身,甚至連訓練該模型所使用的全部龐巨量資料集和訓練指令碼也全部向大眾公開,這是開源政策的最高境界。

Neotron 3 Ultra 是全球首個基於SSM(狀態空間模型)與 MoE(混合專家模型)相結合的混合架構模型。由於架構極為精巧,它的運行速度達到了驚人的 5 倍提升,而在總算力和推理時間上的綜合成本則直接削減了 30%。通過快速的思考,企業能以極低的造價讓代理進行長鏈條的複雜推理。目前,SAP、ServiceNow、Palantir、CrowdStrike 等企業軟體巨頭都在基於我們的工具包全力狂奔。

段落總結

針對全面到來的企業級代理需求,黃仁勳推出了包含模型、開源安全沙盒執行階段 Open Shell 在內的 NVIDIA 企業級 AI 代理工具包。現場以 NVIDIA 最核心的晶片驗證業務為例,展示了與 Cadence 聯手打造的晶片設計代理如何將研發驗證周期縮短 40 倍(從數周縮短至幾小時)。為此,NVIDIA 宣佈開源最新的 Neotron 3 Ultra 模型,這是全球首個融合了 SSM+MoE 混合架構的頂級大模型,速度提升 5 倍,成本降低 30%,並徹底公開了全部訓練資料集。

九、 重構個人電腦:RTX Spark 革命

NVIDIA 與你們的交情始於 PC 產業。40 年前,當 Windows 95 將電腦從企業帶入千家萬戶時,個人電腦(PC)誕生了。那一代平台非常聰明地做對瞭解耦、BIOS 抽象、執行階段驅動以及 DirectX 多媒體 API,從而開創了繁榮的時代。

40 年後的今天,微軟(Microsoft)與 NVIDIA 決定共同徹底重構個人電腦。我和薩提亞(Satya Nadella)為此秘密籌備並精細最佳化了整整三年。在代理時代,你的 PC 絕不再僅僅是一個你點選並打字來啟動 App 的死板工具,它將擁有常駐本地的、完全由你掌控的自主 AI 代理。在全新的架構中,大語言模型(LLM)將直接扮演現代版“DirectX”的角色,原生接管視覺、聲音、文字提示的輸入與生成,成為 PC 智能化延伸的底層 API。

為此,我們隆重推出RTX Spark移動處理器,這是我們將 33 年來的全部積累濃縮排單枚晶片的結晶:

整合了擁有 6,144 個 CUDA 核心、能榨出1 Petaflop(千兆次)頂級 AI 算力的 Blackwell 架構 RTX GPU。

聯手聯發科(MediaTek),基於台積電 3 奈米工藝,共同在單片上熔接了定製的20 核 Grace CPU(晶片代號N1X)。

配備了 128 GB 統一記憶體,電晶體數量高達 700 億顆。

這枚晶片實力恐怖,由於它完美相容 100% 的 NVIDIA 軟體棧,不論是數字生物學、地震資料處理、天體物理學,還是 Windows 平台過去運行過的任何一款經典遊戲或專業圖形軟體,它全都能毫無障礙地本地跑通,並且能夠流暢運行本地的 Neotron 3 代理。

在現場演示中,當使用者提出設計一棟房子的構想時:

常駐在 RTX Spark 筆記本本地的 AI 代理通過 Open Shell 沙盒安全啟動,呼叫雲端的 Claude 大模型,隨後像人類專家一樣自主打開本地的設計軟體 Rhino 開始調整地形和建築外殼。它能夠自己規劃室內牆壁和動線,在發現自己犯錯後還能自己默默修改程式碼進行修復。在得到使用者允許後,它還會自動將模型匯出至 Blender,並呼叫本地的 Flux 2 圖像大模型直接渲染出照片級的多角度光影渲染圖。複雜的專業工作流在一瞬間變成了“想像力的延伸”。

目前,Adobe 已經針對 RTX Spark 架構徹底重構了 Photoshop 和 Premiere 的底層核心,使其運行速度直接翻倍,並通過 MCP 伺服器實現了與 AI 代理的原生無縫互動。全球所有的 PC 巨頭(華碩、微星等)都已加入這場 RTX Spark 筆記本的宏大陣營。

但這還不是全部,我們今天同步推出了整套重構的 Windows 機器產品線(涵蓋筆記本、桌上型電腦和工作站)。例如微星(MSI)打造的這台極具藝術感的桌上型電腦,你的個人 AI 代理可以在裡面 24 小時全天候無休、無流量計費、無隱私洩漏焦慮地連續運行,全權管理你家裡的安防、多媒體、甚至熱水器和乾衣機。而這台擺在桌面上的DGX Station for Windows 個人工作站,擁有高達768 GB 的海量記憶體和 8 TB/s 的記憶體頻寬,允許大模型開發者直接在書桌旁本地跑通一個兆參數(Trillion-parameter)的頂級大模型。

回顧歷史,15年前手機被稱為“Phone(電話)”,而今天你用智慧型手機做任何事情,唯獨很少用它來打電話。我堅信,10 年後的 PC 概念也會發生根本性的顛覆。未來,你的家裡除了有電視、洗衣機,必然還會安放一台二十 Petaflops 的本地 AI 超算。它在家裡不停地幫你調遣代理處理瑣事,它給你的感覺將不再是一台冷冰冰的程式碼機器,而是像《星球大戰》裡的 R2-D2 或 C3PO 機器人一樣的家庭智能夥伴。這是個人計算史上又一次驚天動地的重新發明。

段落總結

微軟與 NVIDIA 歷時三年緊密協作,發佈了 40 年來對個人電腦(PC)最徹底的重新發明。核心產品 RTX Spark 移動處理器由 NVIDIA 與聯發科聯合研發(晶片代號 N1X),在台積電 3nm 工藝下整合了 Blackwell 架構 GPU 與 20 核定製 Grace CPU,能在本地爆發 1 Petaflop 的頂級 AI 算力。通過將大模型轉化為全新的本地“DirectX”等級智能 API,PC 上的經典應用(如 Adobe、Rhino)將能直接被 AI 代理自主操控。黃仁勳預言,未來的 PC 將從單純的打字工具演變為像 R2-D2 一樣常駐家中的私人超算助手。

十、 物理世界 AI、Cosmos 3 與 Isaac Groot 機器人

從本質上講,所謂的代理式 AI(Agentic AI)就是一個數字機器人。它負責理解、推理、規劃並付諸行動。這種代理計算模式未來會源源不斷地克隆到衛星、農業裝置、重工業製造廠、以及5G基站中。基站自己就會通過代理去思考、協調流量和頻譜,從而降本增效。未來,全球將會有數百億台物理代理系統在奔跑。

然而,發展具身智能和機器人面臨著一個極度致命的瓶頸:資料缺失

在語言模型時代,網際網路上所有的文字都是人類寫、人類看,屬於第一人稱視角。但機器人的感知完全不同,目前網際網路上幾乎所有的視訊資料都是第三人稱視角的旁觀記錄,根本不具備機器人行動所需的“第一人稱具身感知”

為了攻克這一物理 AI 資料的終極難題,我們今天正式推出全球最前沿的物理 AI 開放大模型——Cosmos 3!在語言模型前沿有很多同行在競爭,但在物理 AI 領域,NVIDIA 絕對是毫無爭議的世界第一。

Cosmos 3 採用了全新設計的MoT(Mixture of Transformers,混合變壓器)架構。它能將像素、動作、聲音和語言混合輸入到自回歸 Transformer 中進行規劃推理,進而指導擴散 Transformer 精確預測並生成物理世界未來“一幀一幀”精準的物理畫面。

作為視覺語言模型(VLM),它能精準看懂物理世界並標出關鍵危險隱患。

作為世界模型(World Model),它可以憑藉單張照片或文字,自主生成完全符合現實世界物理定律的合成視訊。

作為模擬器(Simulator),它能在虛擬世界裡形成完美的閉環,自主充當機器人的物理老師,讓算力直接轉化為源源不斷的高品質具身訓練資料。我們一如既往地將 Cosmos 3 的模型、資料和訓練方法完全向世界開源,供大家自由定製。

基於這套頂級的物理 AI 技術堆疊:

自動駕駛革命:我們發佈了Alpamo 2開源自動駕駛大模型。目前採用 NVIDIA Hyperion 智能車芯架構的車企已經統治了全球 80% 的汽車產量,同時全球 97% 的出行服務網路也與我們完成了對接。在現場演示中,Alpamo 2 展現出了驚人的“一邊開車一邊碎碎念”的思考能力(如“前方有靜止障礙車,微調向左;注意有行人借道,剎車避讓;左側有車輛加塞,保持安全距離……”)。這種將推理和思考完全具現化的自動駕駛系統,才是真正的安全保障。

人形機器人飛躍:由於人形機器人包含海量的電機、感測器且極其嬌貴,從頭搭建環境不僅極為繁瑣,且各個大學和實驗室往往需要耗費數月去調通硬體。為此,我們正式發佈了NVIDIA Isaac Groot 人形機器人開源參考開發平台!該平台由著名機器人廠商Sharpa負責精細製造,身高 6 英呎(約1.83米),體重 150 磅(約68公斤)——身材跟我差不多,不過前一個數字它比我高,後一個數字它比我重。它運行全新的 Thor 晶片,雙手各自擁有極其靈活的 25 個自由度,全身共有 31 個自由度。這套參考設計機器人做到了全管道打通、完全模組化,包含了從 Isaac Lab 模擬、到 Cosmos 資料合成、再到 Jetson Thor 運行的全部軟硬體,讓科研團隊在數小時內就能直接展開前沿的具身智能研究。具身智能時代正式大幕拉開。

段落總結

物理世界 AI(如自動駕駛、人形機器人)面臨的最大瓶頸在於缺乏“第一人稱視角”的動作訓練資料。NVIDIA 發佈了顛覆性的物理 AI 世界模型 Cosmos 3,採用創新的 MoT 架構,能夠通過算力自主模擬生成完全符合現實物理定律的合成視訊資料。依託該技術,NVIDIA 同步推出了具備即時“思考推理口述”能力的 Alpamo 2 自動駕駛系統,以及聯手 Sharpa 製造的 Isaac Groot 人形機器人開源參考設計硬體平台(雙手各 25 自由度,全身 31 自由度),為全球高校及實驗室提供了數小時內即可上手的整套具身智能開發解法。

十一、 總結與極具創意的“說唱”謝幕

讓我為你們梳理一下今天所有的重磅發佈。在過去的短短六個月裡,整個電腦工業的底層邏輯已經被徹底改寫了。核心驅動力就在於大模型的跨越式進化與 Agent(代理系統範式)的完美融合,讓 AI 真正能夠獨立幫人類執行極其複雜的工具呼叫和日常工作。

這一套包含模型、編排 Harness、工具技能與執行階段的“代理計算範式”,將會在雲端、企業、個人電腦以及機器人身上一遍又一遍地瘋狂複製。

我們的Vera Rubin 架構已全面量產,它不是單一 GPU,而是專為在大規模 Pod 等級壓榨代理性能而生的、解耦且分佈式的超級超算叢集。

我們的Vera CPU徹底顛覆了為人類設計的舊 CPU 歷史,以 10 IPC 單線程神級表現和 3.6 TB/s 單片匯流排,成為了代理時代最熾手可熱的算力核心,其訂單量正在締造我們公司歷史上最成功的發佈奇蹟。

我們的RTX Spark與微軟全方位重構了歷經 40 年沉澱的 Windows PC 生態,將其推向了私人超算夥伴的新紀元。

我們的Cosmos 3 與 Isaac Groot 平台則為全面爆發的機器人與自動駕駛世界鋪平了道路。 NVIDIA 已經成長為一家全端基礎設施巨頭,我們要做的就是幫在座的每一位以最快的速度、最低的每瓦 token 成本,去賺取最豐厚的利潤。

謝謝台灣所有夥伴長久以來的無間信任與深厚友誼,沒有你們,NVIDIA 絕不可能走到今天,我深深地為我們過去一年的巨大成功感到驕傲!在 Computex(台北電腦展)開幕之際,我為大家準備了最後一個特別彩蛋,請看大螢幕!

(大螢幕播放 NVIDIA 硬核覆盤說唱 MV)

🎵 Hey!Computex 的演講剛剛結束,Jensen 帶你看清未來的面目!

實用 AI 已經大步降臨,AI 代理正在你我身邊並肩同行。

過去提起 Agent,大家以為只有好萊塢大牌明星才能配齊;

如今我們人人都能在客廳,用代理團隊把創業夢想變成真跡!

但這幫傢伙對算力的胃口大得像個無底洞,NVIDIA 聽到呼喚立刻放出大招重拳出擊——

Vera Rubin 已經全面量產,把最便宜的 Token 灑滿大地!

推理性能直接翻了十倍,裡面的專屬超級代理比 007 特工還要神氣!

Bluefield 穩穩守護著代理的記憶,下面快來看看全新的 Vera CPU 的絕殺技:

速度直接提滿 50% 簡直無法無天,因為它的血管裡流淌的就是代理的基因!

NVLink 完美融合把 A100 到 Blackwell 智能串聯,這場屬於加速計算的派對歡迎所有人出席!

Neotron 3 Ultra 離線起飛,提速 5 倍讓工作以最快速度搞定!

Nemo Guardrails 牢牢把守著底線,Open Shell 把安全沙盒築得密不透風!

你的老舊程式碼被它自主遷移和精心審查,全在這一首熱辣的說唱完結之前輕鬆搞定!

別搞錯了,這是一塊精緻完美的五層計算大蛋糕!

全球 AI 工廠正亮起吉瓦級的超強霓虹,DSX 藍圖在電網和機架間把光芒連通。

每一瓦電力的價值都被壓榨最佳化到了極致,讓你吃下這塊生產力蛋糕的同時還能穩賺一筆!

RTX Spark 閃耀登場,這是 40 年來 PC 歷史最震撼的巔峰黎明!

智能代理正在全面接管我們的工作流,只要 Windows 能到的地方它就能本地通行!

Harness 外殼在 CPU 上穩健指揮,AI 模型在 GPU 上風馳電掣!

Cosmos 架構賦予了機器人最渴望看懂的世界,把龐大的算力直接變現為物理的資料。

Alpamo 像人類老司機一樣看清每條道路,這就是它們在物理世界學會行走的秘密。

瘋狂學習新技能,瘋狂找尋新增長,未來的地平線已經被人形機器人徹底攻佔!

噢天那,未來的前景一片光明燦爛,快來和 NVIDIA 一起看看明天的奇蹟!

謝謝你們,台灣!祝大家在台北電腦展(Computex)收穫滿滿、玩得開心!感謝這一年來的陪伴、支援與深厚友誼,大家多保重!

段落總結

黃仁勳在演講尾聲進行了全場宏觀大復盤,重申代理式 AI(Agentic AI)作為未來十年核心計算範式,將徹底席捲雲端、企業軟體、個人 PC 及機器人行業,而 NVIDIA 已成功卡位並轉型為提供全套就緒基礎設施的唯一巨頭。最後,黃仁勳以一首幽默歡快、押韻工整的硬核技術說唱 MV 作為驚豔彩蛋,趣味復盤了全場發佈的硬核乾貨,並深情致謝台灣供應鏈,正式開啟了 2026 台北電腦展的大幕。 (The AI Frontier)