【GTC】黃仁勳台上最強GPU炸場,台下感嘆“中國晶片爆發”,瞄準6G投資諾基亞

“中國晶片要爆發了。”

官宣完“地表最強”的輝達新GPU後,黃仁勳面對全球媒體的鏡頭如是說。

他還大誇中國模型,直言Qwen、DeepSeek都是“世界級、革命性”的成果。

近一個小時的接連提問,有一半的問題都關於中國,彷彿讓人忘了輝達的新成果才是這場發佈會的主角。

發佈會上,老黃介紹了輝達新核彈Vera Rubin,算力100PFLOPs,是輝達首款專用AI電腦DGX-1性能的100倍。

該款晶片也正是OpenAI輝達千億大單第一階段要部署的晶片,現在老黃手裡已經有了樣品,預計明年實現量產。

此外,老黃還官宣了輝達在量子計算、6G通訊、自動駕駛等其他領域的戰略佈局。

下一代晶片和超算

Vera Rubin平台是繼GB200(Grace Blackwell NVLink 72)之後的第三代NVLink 72機架規模的電腦,從晶片、系統、軟體到模型架構都進行了全新設計。

而最核心的Vera Rubin超級晶片則是搭載了一顆Vera CPU和兩顆大型的Rubin GPU。

輝達已經收到了首批由台積電生產的Rubin GPU,每個GPU晶片都採用了HBM4高頻寬記憶體,主機板其他區域配備了32個LPDDR記憶體插槽,和HBM4記憶體協同工作。

在FP4精度下,浮點計算性能可達50PFLOPs,相較於現有的GB300,性能有數倍躍遷。

而Vera則採用Arm架構,搭載了88個核心以及176執行緒,NVLINK-C2C互聯頻寬可達1.8TB/s。

黃仁勳展示的Vera Rubin計算托盤則採用高度整合設計,是一個完全無線並且100%液冷的節點。

這個計算托盤的核心處理器內建了兩個Vera CPU和四個Rubin封裝,形成了強大的算力核心。

而為了應對AI日益增長的對於上下文處理的需求,輝達還在托盤中新增了Bluefield 4資料處理器,配備了8個全新的ConnectX-9超級網路卡。

不過,老黃表示Vera Rubin計算托盤的安裝過程極其簡單,甚至調侃道:

連我都能做到。

首代基於Vera Rubin的Vera Rubin NVL144平台計畫於2026年下半年推出,可實現3.6Exaflops的FP4推理算力和1.2Exaflops的FP8訓練算力,相較於GB300的NVL72提升約3.3倍。

而升級版的Rubin Ultra NVL576將在2027年下半年推出,將NVL系統規模從144擴展到576,FP4推理算力可以達到15Exaflops,FP8訓練算力達5Exaflops,相較GB300 NVL72提升14倍。

輝達科學家范麟熙(Jim Fan)評價:科幻場景與“真實的《駭客帝國》”相比黯然失色。

輝達還規劃和美國能源部合作新建7座超算叢集。

其中,Mission和Vision兩台基於Vera Rubin平台的新超級電腦是與HPE合作,為洛斯阿拉莫斯國家實驗室建造的,預計2027年投入使用。

下一代超級晶片蓄勢待發時,當前的Blackwell架構也實現了量產,正在大規模生產和部署。

黃仁勳透露,涵蓋至2026年的出貨量,Blackwell和Rubin的訂單總銷售額將達到5000億美元。

現場老黃又搬出了GPU未來三年計畫——到2028年推出Feynman。

就像從Blackwell到Rubin的節奏一樣,承諾每年一次重大更新。

除了官宣超級晶片,老黃也透露了輝達在其他領域的計畫。

AI超算與量子處理器的無縫連接

量子計算,一個獲得諾貝爾物理學獎的熱門課題,輝達在這方面也有所佈局。

這次演講中,NVIDIA發佈了NVQLink,這是一種新的互連架構,可以直接連接量子處理器(QPUs)和NVIDIA GPU,首次實現了AI超算與量子處理器的無縫連接。

它能夠以每秒數千次的速度,在量子硬體之間傳輸高達TB級的資料,這是量子錯誤校正所需的關鍵速度。

功能上,NVQLink負責量子電腦的控制和校準、量子錯誤校正,以及連接QPU和GPU超級電腦以進行混合模擬。

並且該架構具有完全可擴展性,可以處理從當前的數百個量子位元擴展到未來數萬甚至數十萬個量子位元的糾錯需求。

為了實現這種融合,NVIDIA推出CUDA-Q,這是一個用於量子GPU計算的開放平台, 將CUDA擴展到支援QPU,使之能夠與GPU協同工作。

之前的GTC巴黎站上,輝達宣佈已經在Blackwell整合了CUDA-Q,通過GPU為量子計算加速,其功能主要有兩大方面:

  • 如果沒有真·量子計算單元,CUDA-Q可以在經典電腦上模擬量子運算
  • 如果有了量子計算單元,CUDA-Q可以實現量子與經典加速計算的協同,也就是QPU協作。

除了資料中心和量子計算,輝達這一次也宣佈將踏足新的領域——6G通訊。

投資諾基亞,入局6G通訊

輝達認為,加速計算和AI給通訊行業也帶來了一場新計算模型所驅動的平台轉型。

為此,輝達宣佈推出新的產品線,名為NVIDIA Arc (Aerial Radio Network Computer),專門用於6G。

Arc由三項基礎新技術建構而成——Grace CPU、Blackwell GPU以及ConnectX Melanox網路技術。

Arc運行在CUDA X庫中的無線通訊系統Aerial上,目標是建立首個能夠同時進行無線通訊和AI處理的、軟體定義的可程式設計電腦。

具體來說,輝達與諾基亞達成合作推出了支援AI原生6G的加速計算平台——Aerial RAN Computer Pro(ARC-Pro)。

這是一款AI基站主機,搭載了6G-ready加速計算平台,並實現了無線+AI共生,把AI推理傳統RAN處理跑在了同一套基礎設施上。

技術合作的同時,輝達還對諾基亞進行了投資,總金額為10億美元,這一舉措讓諾基亞股價大幅度上漲,創下了6年多以來的新高。

One More Thing

無論是輝達的“現金奶牛”資料中心,還是新佈局的量子計算和6G,輝達都不無對手、都有潛在挑戰者。

隔壁AMD剛剛拿下了兩台超算訂單,金額為10億美元。

這兩台超級電腦的主要硬體部分將全部由AMD打造其中的首台名為Lux,搭載AMD Instinct MI355X加速器 ,每台板載功率高達1400瓦,預計將在六個月內投入使用。

Lux的人工智慧性能將是現有超級電腦的三倍,AMD CEO蘇姿丰表示,這是同規模超級電腦中部署速度最快的一次。

除了AMD,不滿足於在端側發展的高通也想要分一杯羹,宣佈推出兩款全新的AI晶片——AI200AI250,正式進軍資料中心市場。

這兩款晶片聚焦AI模型的推理階段,主打行業最低的總擁有成本(TCO)、更高的能效與更強的記憶體處理能力,分別預計於2026和2027年實現商用。

AMD、高通,還有老黃口中正在爆發的中國晶片,都有可能是輝達面臨的潛在競爭對手。

還有老黃看好的量子計算領域,甚至出現了不同路線的競爭——

輝達認為GPU和QPU的組合是量子計算的未來,但IBM成功用AMD晶片實現了無GPU的量子計算。

IBM的演算法解決了量子計算中最核心的挑戰之一——量子位元的脆弱性與高錯誤率。

這套方案的運行速度比實際需求快10倍,而且不需要昂貴的GPU,只需要FPGA晶片與量子電腦配合。

與諾基亞合作的6G同樣存在激烈競爭。

去年7月,北郵張平院士團隊成功搭建了國際上首個通訊與智能融合的6G試驗網。

今年8月,北京大學和香港城市大學合作的全球首款全頻段6G晶片問世,利用光子技術實現了100Gbps的傳輸速率。

該晶片只有11×1.7mm的尺寸,但融合了毫米波、太赫茲通訊以及低頻微波波段,覆蓋了0.5-115GHz。

這一成果被視為6G的關鍵突破,論文已經登上Nature。

儘管在各個領域都面臨競爭,但市場投資者還是選擇看好輝達——收盤時,輝達股價上漲4.98%,達到201.03美元每股,盤後價格更是達到每股204.43美元,創下了歷史新高。

若以盤後價格計算,輝達的市值增長了3154億美元,折合人民幣近3兆,僅增長部分就相當於1.59個英特爾。

這場基礎設施的全面競爭,究竟會鹿死誰手? (量子位)