馬斯克先用上了。
輝達憋了許久的晶片大招,終於來了。
芯東西6月1日報導,今日,在GTC台北大會上,輝達創始人兼CEO黃仁勳穿著閃亮的黑色皮衣發表主題演講,發佈輝達首款Arm架構PC晶片RTX Spark超級晶片,以及輝達豪賭2000億美元市場的大招——專為智能體設計的Vera CPU。
兩款全新晶片“王牌”,直搗英特爾、AMD的腹地。
黃仁勳宣佈與微軟推出全新PC產品線,並稱“這是40年來PC產品線首次全面革新”,同樣的智能體處理模式還將延展到各種裝置上。
他說,電腦的這次革命,重要程度不亞於普通手機演變為智慧型手機,輝達已為此制定產品路線圖,每一代架構(Grace Blackwell、Vera Rubin、Rosa Feynman)都將配備桌上型電腦、筆記本和工作站。
在Q1財報期間,輝達曾透露全新Vera CPU將開啟一個價值2000億美元的市場,預計Vera晶片收入將在本財年末達到200億美元,成為“第二大銷售貢獻者”。
今日,黃仁勳稱Vera CPU具有革命性意義,其產能爬坡令他非常滿意,“目前的訂單量已註定它將成為我們公司歷史上最快速、最成功的產品發佈。”
Anthropic、OpenAI、馬斯克旗下SpaceX三家AI巨頭均率先部署Vera CPU。
“NVIDIA Vera是英特爾和AMD x86_64處理器有史以來最強大的競爭對手。”Phoronix CPU Benchmark Suite作者Michael Larabel評價說。
Vera CPU與輝達今日發佈的全球最強大Windows平台桌面AI超級電腦DGX Station,正是輝達為智能體運行開拓的兩大全新市場。
DGX Station for Windows由微軟合作開發,基於輝達DGX Station系統設計,搭載輝達GB300 Grace Blackwell Ultra桌面級超級晶片,提供最高748GB統一記憶體、20PetaFLOPS FP4算力、800Gbps ConnectX-8 SuperNIC網路,與所有Windows軟體相容,可運行兆參數級AI模型,並可同時運行數百個智能體。該超算預計將於今年第四季度上市。
輝達還與宇樹科技聯合發佈了整合宇樹H2 Plus機器人、Sharpa Wave五指靈巧手、輝達Jetson Thor處理器的全新NVIDIA Isaac GR00T人形機器人參考設計。
01.
輝達自研PC晶片登場:3nm製程,
最高1P算力,能跑1200億參數大模型
“時隔40年,微軟與輝達將重新發明PC(個人電腦)。”黃仁勳宣佈,輝達與微軟面向個人智能體時代重新構想PC,推出為遊戲和智能體而生的RTX Spark超級晶片。
RTX Spark超級晶片採用台積電3nm工藝,內建700億顆電晶體,提供128GB LPDDR5X統一記憶體和1PetaFLOPS FP4 AI算力,號稱是“史上能效最高的RTX晶片”。
其中,Blackwell RTX GPU有6144個CUDA核心和第五代Tensor Core,並通過NVLink C2C晶片間互連技術連接到與聯發科合作開發的定製20核Grace CPU。
黃仁勳將RTX Spark稱作“世界上製造過的最神奇的晶片”,“輝達100%的軟體棧都在其上運行”。
RTX Spark融合了輝達33年的創新成果,為全球首款專為個人智能體打造的Windows PC提供動力。輝達CUDA可在RTX Spark上原生運行。
搭載RTX Spark的PC,可以使用OptiX和DLSS渲染90GB超大型3D場景,使用輝達Blackwell解碼器編輯12K 4:2:2視訊,運行具有100萬個token上下文的1200億參數大語言模型,以及使用光線追蹤、DLSS和Reflex以1440p解析度和每秒100幀以上的速度玩3A遊戲。
以前使用PC,使用者要啟動應用程式,點選滑鼠,輸入文字。現在使用RTX Spark和微軟Windows,使用者只需提出請求,電腦就能完成工作。
此外,Adobe為RTX Spark重新設計了Adobe Photoshop和Premiere的架構,新版本在創意工作流程中,可將AI、編輯、調色和特效的處理速度最高提升至2倍。
微軟與輝達正在對整個PC進行全面重塑,發佈了面向智能體的全新三大Windows產品線,涵蓋筆記型電腦、桌上型電腦、桌面超算。
搭載RTX Spark的筆記型電腦和緊湊型桌上型電腦將於今年秋季推出。
筆記型電腦厚度僅為14mm,重量僅3磅,有14至16英吋多種尺寸選擇,可以24小時不間斷本地“養龍蝦”。
02.
Vera CPU:88核、
1.2TB/s記憶體頻寬,專為智能體設計
傳統CPU追求每顆插槽的核心數,切片、虛擬化、按小時出租。在智能體時代,CPU已成為GPU利用率的瓶頸,直接影響token吞吐量、時延與使用者體驗。
對此,輝達推出其最先進的CPU——專為智能體而生的Vera CPU。
Vera CPU採用LPDDR5X記憶體(頻寬1.2TB/s)、支援PCIe Gen6,內外頻寬均達同類最高性能CPU的2至3倍,也是首款在糾正多位錯誤的同時不損失頻寬的CPU。
它基於輝達第二代可擴展一致性架構,將88個輝達定製Arm核心Olympus統一在一個單片Mesh網路上,在智能體工作負載上實現了最高的單線程性能與最佳能效比。
其核心並未分散在多個Chiplet上,核心之間的通訊速度比傳統CPU快50%。Vera支援記憶體一致性,NVLink-C2C晶片間互聯可將GPU直連到架構,還可以將Vera擴展到多個插槽,在CPU之間實現巨大頻寬。
與Grace CPU相比,Vera的每個核心每時鐘周期可多執行50%的指令。
與配備DDR5的x86 CPU相比,Vera每個核心的頻寬多達3倍;與x86 CPU相比,峰值記憶體延遲降低了40%,在檢索分析與沙箱執行中保持核心供給及時。
在Python程式碼分析、程式碼編譯等常見智能體工具的行業標準基準測試中,Vera的智能體沙箱性能是與x86 CPU競品性能的1.8倍。
該處理器有四大核心設計原則:領先的每時鐘指令數(IPC)/ 單線程性能、每核心頻寬、總頻寬以及能效。
Vera每時鐘可取指、解碼並執行10條指令,IPC全球最高。
輝達Olympus核心專為現代資料中心工作負載、分支密集型Python執行階段、工具呼叫和沙箱程式碼執行而最佳化。
每顆核心均為吞吐量調優:神經分支預測器可在每個周期評估兩個選定分支,10-Wide解碼引擎可在每個周期代入更多工作負載,大型亂序執行引擎維持著指令的運作,新型圖引擎的高階預取器可預測下一個資料路徑。
Vera片上高速互聯匯流排頻寬達3.4TB/s,無芯粒稅(chiplet tax),無跨片邊界損耗,所有核心可與其他任何核心及快取無延遲通訊,不存在調度衝突。
該CPU已進入全面量產,並將於今年秋季通過系統合作夥伴正式上市。
Anthropic、OpenAI、SpaceX均是Vera CPU的早期採用者。
在SQL 1TB基準測試中,Vera CPU的SQL運行速度達到競品的3倍。
Vera CPU正在為紐約證券交易所(NYSE)運行即時流處理,實現了6倍的性能提升。
Grace與Vera CPU是AI領域認證程度最高的CPU、每家企業只要與輝達合作AI,都將認證Grace和Vera。
03.
Vera Rubin已全面投產
今年年初發佈的Vera Rubin,現已全面投產。
黃仁勳說,Vera Rubin是輝達史上最具雄心的項目,全公司40000名工程師都參與其中。
Vera Rubin專為運行智能體而生,是一套完整的分解式分佈式智能體處理系統,包含Vera Rubin NVL72系統、液冷Vera CPU機架、Vera BlueField-4 STX儲存和安全系統、Groq 3 LPX低延遲推理托架和Spectrum-X Ethernet Photonics網路。
該平台由台灣超過150家供應鏈生態合作夥伴參與,遍佈數百個工廠。所有元件均通過極致協同設計(extreme co-design)打造。
輝達為Vera Rubin打造的供應鏈,規模是Grace Blackwell的2倍。
以前組裝一個 Grace Blackwell機架需要2小時,現在只需5分鐘。產能更高,出貨速度也大幅提升。
單個液冷Vera CPU機架容納256顆CPU,負責模型編排、記憶體調度與工具呼叫。
在富士康與廣達,Groq LPX逐步成形。256顆Groq LPU分佈於16個托盤,片上靜態隨機儲存器(SRAM)頻寬高達40PB/s,實現超低時延。
Spectrum-X Ethernet Photonics是全球首款採用共封裝光器件的200Gb/s SerDes乙太網路交換機,現已投入生產。
Vera BlueField-4 STX由BlueField-4加速,在晶片層面處理安全問題:DOCA Argus可將威脅檢測時間從分鐘縮短至毫秒;DOCA Vault可在機架規模上保護AI資料。
04.
結語:一切為了幫客戶實現最高利潤
2026年正成為AI發展史上極為重要的一年。智能體的拐點正在推動生產力大幅提升,創造巨大的商業機遇。
黃仁勳總結了輝達建構AI基礎設施的優勢:
1、首個Token時延、首次推理啟動時延、訓練啟動時延都更短。
2、每瓦吞吐量、每瓦Token數是世界頂級。僅僅因為晶片更便宜就選擇錯誤的架構,這不划算。每瓦Token數才是關鍵,買得越多,賺得越多。
3、可靠性。輝達已經在超大規模下營運很久,這些經驗非常寶貴。
4、系統使用壽命。每隔幾個月,軟體行業就會湧現出新技術。輝達的系統遍佈全球,軟體開發者從輝達CUDA起步,因此生態系統和資產的有效使用壽命自然會更長。如果資產壽命長,則總擁有成本(TCO)低。
正如黃仁勳強調的,輝達已經不僅僅是一家GPU公司和系統公司,而是一家基礎設施公司,一切都是為了幫客戶實現最大營收、最高利潤,並盡快實現目標。 (芯東西)
