【GTC 2026】黃仁勳祭出終極AI推理神器!

黃仁勳介紹稱,LPX與Vera Rubin平台結合後,推理吞吐量/功耗比將能提升35倍。

在GTC 2026主題演講上,一款名為輝達Groq 3 LPU的全新晶片正式亮相。

台北時間周二凌晨,輝達正式推出Vera Rubin平台,包括Groq 3 LPU(簡稱LPU)在內,共計搭載了七款晶片,分別為Vera CPU、Rubin GPU、NVLink 6交換機、ConnectX-9超級網路卡、BlueField-4 DPU和Spectrum-6乙太網路交換機。

據悉,輝達將建構包含256個LPU的Groq 3 LPX機架,提供128GB(每個LPU整合500MB的SRAM)的SRAM和40 PB/s的推理加速頻寬,並通過每個機架640 TB/s的專用擴展介面將這些晶片連接起來。這款機架將與Vera Rubin NVL72、Vera CPU等另外四款機架一同構成完整的AI超級電腦平台Vera Rubin。

輝達表示,Groq 3 LPX 是Vera Rubin的推理加速器,旨在滿足智能體系統對低延遲和大上下文的需求。Vera Rubin和LPX通過協同設計的架構,將Rubin GPU和LPU的卓越性能完美結合,使其呈現極低延遲與超大吞吐量的特點。

黃仁勳介紹稱,LPX與Vera Rubin平台結合後,推理吞吐量/功耗比將能提升35倍。LPU晶片將由三星代工,預計機架將於今年下半年開始出貨。

就在昨日,分析師郭明錤發文稱,在輝達投資Groq之後,LPU的出貨量預測已大幅上調。預計2026至2027年的總出貨量將達到400萬至500萬顆。新架構機櫃預計於今年第四季度開始量產,2026年與2027年機櫃出貨量分別約為300至500個,以及15000至20000個。

在他看來,LPU需求增長快速增長主要來自外部因素。一方面,LPU與輝達生態系(如CUDA)高度整合,大幅降低應用開發與部署門檻。另一方面,如今業內超低延遲推理需求快速增加,包括AI智能體(AI Agents)以及正在興起的即時處理(Real-Time)、終端使用者(Consumer-Facing)與物理AI(Physical-AI)等類型應用。

值得一提的是,黃仁勳在主題演講上也強調,AI已完成從感知智能到生成智能,再到物理智能和智能體智能的關鍵躍遷。

財通證券指出,大模型在推理過程中會存在延遲,延遲與使用者體驗感精密掛鉤,大模型推理過程中的延遲主要在Decode階段,核心瓶頸在於記憶體頻寬。LPU具備更快的記憶體頻寬,可縮短大模型推理過程中的延遲。同時,基於LPU的大模型不僅具有更快的推理速度,還可以提供更具性價比的價格,可進一步提高使用者體驗感。

該機構表示,目前Tokens的消耗量大幅增長,帶動推理晶片市場規模的高增長。LPU有望在推理晶片市場中逐步滲透,具有高成長性的市場空間。看好LPU的高成長性及LPU以機櫃出貨時帶來的PCB機會,建議關注:智微智能(參股元川微)、星宸科技(多輪增資元川微)、滬電股份(輝達PCB供應商)、勝宏科技(輝達PCB供應商)、深南電路。 (科創板日報)