"未來的PC,不再是點選運行軟體的機器。它是一個私人專屬的數字機器人。"
2026年6月1日,台北GTC大會,黃仁勳穿著標誌性的皮衣,說了兩句話定調全場:
"Agentic AI has arrived. That useful AI has arrived."
"代理式AI已經到來。實用型AI已經到來。"
Token經濟學:買GPU不是花錢,是賺錢
黃仁勳在GTC台北大會上花了很多時間講一件事:Token經濟學。
他說:
"Token現在是盈利的單位。每個Token都是收入。AI公司想建更多Token,建更多AI工廠。"
一個1吉瓦的AI工廠項目,起步價200到300億美元。很快會到600億,800億。每吉瓦一百億美元。
這不是在描述一個趨勢。這是在描述一個已經發生的現實。
傳統IT時代,伺服器是成本,計算是消耗。你買伺服器,花的是錢,省的是人力。
AI時代,GPU是投資,計算是收入。你買GPU,花的每一分錢都會變成Token,Token就是錢。
黃仁勳在現場對著產業鏈說了一句話:"你們都如此忙碌,(台灣)企業們做得很好。"
這句話背後,是整個半導體供應鏈的狂歡。
他們說AI會讓程式設計師失業。黃仁勳:純屬無稽之談。
這是全場最直接的一次反駁。
"有人說AI會讓程式設計師失業。純屬無稽之談。工程師數量在增加。因為每個工程師能創造三倍產出,企業當然想招更多。"
GitHub提交次數,從2023年的3億次飆升至2026年的5億次。兩年翻將近兩倍。
黃仁勳的邏輯很清楚:
AI的價值不在於替代,在於放大。當每個軟體工程師能創造三倍價值時,企業沒有理由減少招聘,反而會擴招。
這不是安慰。這是數字。
過去四十年電腦沒變過。今天變了。
過去四十年,PC的工作方式從未改變:
啟動應用程式,點選滑鼠,輸入文字,等待結果。
Agent時代完全不同。使用者只需要描述意圖,AI自動生成程式碼或使用工具,產生必要輸出。
黃仁勳花了很長時間拆解Agent的五大核心元件:
模型(Model)—— 充當"大腦",負責理解、觀察、推理、規劃。
線束(Harness)—— 連接一切的"作業系統",協調各元件協同工作。
工具(Tools)—— 瀏覽器、資料庫、C編譯器、Python直譯器……Agent呼叫它們,CPU處理請求。
技能(Skills)—— 工具的使用手冊。AI讀取後說"這就是它的用法"。輝達所有CUDA X庫現在都配備AI可學習的技能,Agent使用這些庫的能力將遠超人類程式設計師。
執行階段(Runtime)—— 協調所有元件的執行環境。安全控制在這裡運行,記憶管理在這裡處理。
過去應用程式的約束來自作業系統。Agent的約束來自架構本身——分散式運算的特性決定了它必須在異構環境中高效運行。
正是這個異構計算問題,促使輝達開發了Vera Rubin。
Vera Rubin:上次裝機需要兩小時,現在五分鐘
這是黃仁勳在整場演講裡最得意的時刻之一。
他先播了一段視訊:上一代Grace Blackwell機架裝配,需要整整兩個小時。電纜、風扇、各種亂七八糟的連接線,佈滿整個機櫃。
然後切到Vera Rubin的裝配實拍——
五分鐘。
沒有電纜,沒有風扇,沒有軟管,中間只有一塊PCB連接兩側。
黃仁勳說:"Rubin的可靠性和韌性,將會高得離譜。"
因為他知道:沒有線纜,就沒有線纜會壞。
Vera Rubin是輝達史上最複雜的端到端機架級叢集系統——五個專用機架組成一個AI超級電腦。與上一代Grace Blackwell相比,大規模Agent吞吐量提高了10倍。
OpenAI、Anthropic、SpaceX,已經簽約率先部署。
Vera CPU:世界上第一款為"沒有耐心"的機器設計的處理器
黃仁勳提出了一個深刻的問題:
過去所有CPU都是為誰設計的?
為人類。
人類使用CPU的方式,是在一個以秒計數的世界裡生活。你等一個頁面載入,可以接受。你關掉彈窗,可以容忍。你適應各種不便,可以妥協。
但Agent不一樣。
"Agent缺乏耐心。它們並非生活在分秒必爭的世界裡,它們生活在一個以納秒為單位的世界裡。"
Agent等待的每一刻,都會讓它無法進入下一步。
這就是為什麼需要全新的CPU架構。
Vera CPU是輝達第一款專為AI Agent打造的處理器。與x86 CPU相比,任務完成速度提高了1.8倍。
關鍵資料:
- 晶片內頻寬:3.6TB/s
- 無三重態損耗,無晶片邊界穿越
- 首款支援PCIe 6.0
- 88個Olympus核心
黃仁勳說了一句讓全場沉默的話:
"過去我們為人類製造了CPU。這是一個新市場的開端——智能體的CPU。這個市場肯定會比上一個更大。因為Agent的數量,將遠遠超過人口數量。"
四十年了,PC第一次被重新定義
黃仁勳把這句話放在了最重磅的位置:
"三十年來我們所學的一切精華,都凝聚在這一塊晶片中。"
這就是RTX Spark。
它是輝達第一款面向消費級市場的"PC超級晶片":
- 6144個CUDA核心
- 1 petaflop AI性能
- 128GB統一記憶體
- 台積電3nm工藝
- 700億電晶體
厚度:14毫米。重量:3磅。
黃仁勳說:"四十年後,微軟和輝達將重塑PC。"
這不是誇張。Windows加上RTX Spark,PC不再是運行軟體的機器,而是一個能理解你、為你工作、與你對話的Agent。
華碩、戴爾、惠普、聯想、微軟Surface、微星——全球100%的PC行業,在今年秋季,全部加入。
黃仁勳說這句話的時候,語氣非常確定:
"這是四十年來PC產品系列的首次全面革新。"
他造了一個AI工程師,比人類工程師更快
Cadence和輝達聯合發佈了一個產品:ChipStack。
這是一個完全自主的AI工程師,能夠執行晶片設計和驗證。
黃仁勳說了一個具體的例子:
"在輝達,數千名工程師每年數十億計算小時、數百萬次測試。傳統方式,一個周期需要團隊數周時間來壓縮其節奏。現在這個流程正在被Agent顛覆。"
企業將原本需要數周才能完成的工程周期,壓縮到數小時。
晶片設計進入Agent時代。
這場GTC,黃仁勳實際上只講了一件事:
算力即收入。不是成本,是收入。
你買GPU不是在花錢。你是在買一個Token生產工廠,Token就是錢,每瓦性能就是利潤率。
這個邏輯重構了整條產業鏈:
- 買伺服器是成本 → 買GPU是投資
- 計算是消耗 → 計算是收入
- 晶片便宜不代表你賺了 → 晶片貴不代表你虧了
- 選錯架構的代價從未如此高昂
他還講了一件更根本的事:
Agent的數量,將遠遠超過人口數量。
這是商業規劃。
黃仁勳在台北,給出了他關於AI時代最完整的一張地圖。 (西風吾號)
