【Computex 2026】今天,黃仁勳“重新發明”晶片,捅了英特爾AMD老巢

馬斯克先用上了。

輝達憋了許久的晶片大招,終於來了。

芯東西6月1日報導,今日,在GTC台北大會上,輝達創始人兼CEO黃仁勳穿著閃亮的黑色皮衣發表主題演講,發佈輝達首款Arm架構PC晶片RTX Spark超級晶片,以及輝達豪賭2000億美元市場的大招——專為智能體設計的Vera CPU

兩款全新晶片“王牌”,直搗英特爾、AMD的腹地。

黃仁勳宣佈與微軟推出全新PC產品線,並稱“這是40年來PC產品線首次全面革新”,同樣的智能體處理模式還將延展到各種裝置上。

他說,電腦的這次革命,重要程度不亞於普通手機演變為智慧型手機,輝達已為此制定產品路線圖,每一代架構(Grace Blackwell、Vera Rubin、Rosa Feynman)都將配備桌上型電腦、筆記本和工作站。

在Q1財報期間,輝達曾透露全新Vera CPU將開啟一個價值2000億美元的市場,預計Vera晶片收入將在本財年末達到200億美元,成為“第二大銷售貢獻者”。

今日,黃仁勳稱Vera CPU具有革命性意義,其產能爬坡令他非常滿意,“目前的訂單量已註定它將成為我們公司歷史上最快速、最成功的產品發佈。

Anthropic、OpenAI、馬斯克旗下SpaceX三家AI巨頭均率先部署Vera CPU。

“NVIDIA Vera是英特爾和AMD x86_64處理器有史以來最強大的競爭對手。”Phoronix CPU Benchmark Suite作者Michael Larabel評價說。

Vera CPU與輝達今日發佈的全球最強大Windows平台桌面AI超級電腦DGX Station,正是輝達為智能體運行開拓的兩大全新市場。

DGX Station for Windows由微軟合作開發,基於輝達DGX Station系統設計,搭載輝達GB300 Grace Blackwell Ultra桌面級超級晶片,提供最高748GB統一記憶體、20PetaFLOPS FP4算力、800Gbps ConnectX-8 SuperNIC網路,與所有Windows軟體相容,可運行兆參數級AI模型,並可同時運行數百個智能體。該超算預計將於今年第四季度上市。

輝達還與宇樹科技聯合發佈了整合宇樹H2 Plus機器人、Sharpa Wave五指靈巧手、輝達Jetson Thor處理器的全新NVIDIA Isaac GR00T人形機器人參考設計

01.

輝達自研PC晶片登場:3nm製程,

最高1P算力,能跑1200億參數大模型

“時隔40年,微軟與輝達將重新發明PC(個人電腦)。”黃仁勳宣佈,輝達與微軟面向個人智能體時代重新構想PC,推出為遊戲和智能體而生的RTX Spark超級晶片

RTX Spark超級晶片採用台積電3nm工藝,內建700億顆電晶體,提供128GB LPDDR5X統一記憶體和1PetaFLOPS FP4 AI算力,號稱是“史上能效最高的RTX晶片”。

其中,Blackwell RTX GPU有6144個CUDA核心和第五代Tensor Core,並通過NVLink C2C晶片間互連技術連接到與聯發科合作開發的定製20核Grace CPU。

黃仁勳將RTX Spark稱作“世界上製造過的最神奇的晶片”,“輝達100%的軟體棧都在其上運行”。

RTX Spark融合了輝達33年的創新成果,為全球首款專為個人智能體打造的Windows PC提供動力。輝達CUDA可在RTX Spark上原生運行。

搭載RTX Spark的PC,可以使用OptiX和DLSS渲染90GB超大型3D場景,使用輝達Blackwell解碼器編輯12K 4:2:2視訊,運行具有100萬個token上下文的1200億參數大語言模型,以及使用光線追蹤、DLSS和Reflex以1440p解析度每秒100幀以上的速度玩3A遊戲。

以前使用PC,使用者要啟動應用程式,點選滑鼠,輸入文字。現在使用RTX Spark和微軟Windows,使用者只需提出請求,電腦就能完成工作。

此外,Adobe為RTX Spark重新設計了Adobe Photoshop和Premiere的架構,新版本在創意工作流程中,可將AI、編輯、調色和特效的處理速度最高提升至2倍

微軟與輝達正在對整個PC進行全面重塑,發佈了面向智能體的全新三大Windows產品線,涵蓋筆記型電腦、桌上型電腦、桌面超算

搭載RTX Spark的筆記型電腦和緊湊型桌上型電腦將於今年秋季推出。

筆記型電腦厚度僅為14mm,重量僅3磅,有14至16英吋多種尺寸選擇,可以24小時不間斷本地“養龍蝦”。

02.

Vera CPU:88核、

1.2TB/s記憶體頻寬,專為智能體設計

傳統CPU追求每顆插槽的核心數,切片、虛擬化、按小時出租。在智能體時代,CPU已成為GPU利用率的瓶頸,直接影響token吞吐量、時延與使用者體驗。

對此,輝達推出其最先進的CPU——專為智能體而生的Vera CPU

Vera CPU採用LPDDR5X記憶體(頻寬1.2TB/s)、支援PCIe Gen6,內外頻寬均達同類最高性能CPU的2至3倍,也是首款在糾正多位錯誤的同時不損失頻寬的CPU

它基於輝達第二代可擴展一致性架構,將88個輝達定製Arm核心Olympus統一在一個單片Mesh網路上,在智能體工作負載上實現了最高的單線程性能與最佳能效比。

其核心並未分散在多個Chiplet上,核心之間的通訊速度比傳統CPU快50%。Vera支援記憶體一致性,NVLink-C2C晶片間互聯可將GPU直連到架構,還可以將Vera擴展到多個插槽,在CPU之間實現巨大頻寬。

與Grace CPU相比,Vera的每個核心每時鐘周期可多執行50%的指令。

與配備DDR5的x86 CPU相比,Vera每個核心的頻寬多達3倍;與x86 CPU相比,峰值記憶體延遲降低了40%,在檢索分析與沙箱執行中保持核心供給及時。

在Python程式碼分析、程式碼編譯等常見智能體工具的行業標準基準測試中,Vera的智能體沙箱性能是與x86 CPU競品性能的1.8倍

該處理器有四大核心設計原則:領先的每時鐘指令數(IPC)/ 單線程性能、每核心頻寬、總頻寬以及能效。

Vera每時鐘可取指、解碼並執行10條指令,IPC全球最高。

輝達Olympus核心專為現代資料中心工作負載、分支密集型Python執行階段、工具呼叫和沙箱程式碼執行而最佳化。

每顆核心均為吞吐量調優:神經分支預測器可在每個周期評估兩個選定分支,10-Wide解碼引擎可在每個周期代入更多工作負載,大型亂序執行引擎維持著指令的運作,新型圖引擎的高階預取器可預測下一個資料路徑。

Vera片上高速互聯匯流排頻寬達3.4TB/s,無芯粒稅(chiplet tax),無跨片邊界損耗,所有核心可與其他任何核心及快取無延遲通訊,不存在調度衝突。

該CPU已進入全面量產,並將於今年秋季通過系統合作夥伴正式上市。

Anthropic、OpenAI、SpaceX均是Vera CPU的早期採用者。

在SQL 1TB基準測試中,Vera CPU的SQL運行速度達到競品的3倍

Vera CPU正在為紐約證券交易所(NYSE)運行即時流處理,實現了6倍的性能提升。

Grace與Vera CPU是AI領域認證程度最高的CPU、每家企業只要與輝達合作AI,都將認證Grace和Vera。

03.

Vera Rubin已全面投產

今年年初發佈的Vera Rubin,現已全面投產

黃仁勳說,Vera Rubin是輝達史上最具雄心的項目,全公司40000名工程師都參與其中。

Vera Rubin專為運行智能體而生,是一套完整的分解式分佈式智能體處理系統,包含Vera Rubin NVL72系統、液冷Vera CPU機架、Vera BlueField-4 STX儲存和安全系統、Groq 3 LPX低延遲推理托架和Spectrum-X Ethernet Photonics網路。

該平台由台灣超過150家供應鏈生態合作夥伴參與,遍佈數百個工廠。所有元件均通過極致協同設計(extreme co-design)打造。

輝達為Vera Rubin打造的供應鏈,規模是Grace Blackwell的2倍

以前組裝一個 Grace Blackwell機架需要2小時,現在只需5分鐘。產能更高,出貨速度也大幅提升。

單個液冷Vera CPU機架容納256顆CPU,負責模型編排、記憶體調度與工具呼叫。

在富士康與廣達,Groq LPX逐步成形。256顆Groq LPU分佈於16個托盤,片上靜態隨機儲存器(SRAM)頻寬高達40PB/s,實現超低時延。

Spectrum-X Ethernet Photonics是全球首款採用共封裝光器件的200Gb/s SerDes乙太網路交換機,現已投入生產。

Vera BlueField-4 STX由BlueField-4加速,在晶片層面處理安全問題:DOCA Argus可將威脅檢測時間從分鐘縮短至毫秒DOCA Vault可在機架規模上保護AI資料。

04.

結語:一切為了幫客戶實現最高利潤

2026年正成為AI發展史上極為重要的一年。智能體的拐點正在推動生產力大幅提升,創造巨大的商業機遇。

黃仁勳總結了輝達建構AI基礎設施的優勢:

1、首個Token時延、首次推理啟動時延、訓練啟動時延都更短。

2、每瓦吞吐量、每瓦Token數是世界頂級。僅僅因為晶片更便宜就選擇錯誤的架構,這不划算。每瓦Token數才是關鍵,買得越多,賺得越多。

3、可靠性。輝達已經在超大規模下營運很久,這些經驗非常寶貴。

4、系統使用壽命。每隔幾個月,軟體行業就會湧現出新技術。輝達的系統遍佈全球,軟體開發者從輝達CUDA起步,因此生態系統和資產的有效使用壽命自然會更長。如果資產壽命長,則總擁有成本(TCO)低。

正如黃仁勳強調的,輝達已經不僅僅是一家GPU公司和系統公司,而是一家基礎設施公司,一切都是為了幫客戶實現最大營收、最高利潤,並盡快實現目標。 (芯東西)