【GTC 2026】黃仁勳祭出終極AI推理神器！

2026/03/17

•

黃仁勳介紹稱，LPX與Vera Rubin平台結合後，推理吞吐量/功耗比將能提升35倍。

在GTC 2026主題演講上，一款名為輝達Groq 3 LPU的全新晶片正式亮相。

台北時間周二凌晨，輝達正式推出Vera Rubin平台，包括Groq 3 LPU（簡稱LPU）在內，共計搭載了七款晶片，分別為Vera CPU、Rubin GPU、NVLink 6交換機、ConnectX-9超級網路卡、BlueField-4 DPU和Spectrum-6乙太網路交換機。

據悉，輝達將建構包含256個LPU的Groq 3 LPX機架，提供128GB（每個LPU整合500MB的SRAM）的SRAM和40 PB/s的推理加速頻寬，並通過每個機架640 TB/s的專用擴展介面將這些晶片連接起來。這款機架將與Vera Rubin NVL72、Vera CPU等另外四款機架一同構成完整的AI超級電腦平台Vera Rubin。

輝達表示，Groq 3 LPX 是Vera Rubin的推理加速器，旨在滿足智能體系統對低延遲和大上下文的需求。Vera Rubin和LPX通過協同設計的架構，將Rubin GPU和LPU的卓越性能完美結合，使其呈現極低延遲與超大吞吐量的特點。

黃仁勳介紹稱，LPX與Vera Rubin平台結合後，推理吞吐量/功耗比將能提升35倍。LPU晶片將由三星代工，預計機架將於今年下半年開始出貨。

就在昨日，分析師郭明錤發文稱，在輝達投資Groq之後，LPU的出貨量預測已大幅上調。預計2026至2027年的總出貨量將達到400萬至500萬顆。新架構機櫃預計於今年第四季度開始量產，2026年與2027年機櫃出貨量分別約為300至500個，以及15000至20000個。

在他看來，LPU需求增長快速增長主要來自外部因素。一方面，LPU與輝達生態系（如CUDA）高度整合，大幅降低應用開發與部署門檻。另一方面，如今業內超低延遲推理需求快速增加，包括AI智能體（AI Agents）以及正在興起的即時處理（Real-Time）、終端使用者（Consumer-Facing）與物理AI（Physical-AI）等類型應用。

值得一提的是，黃仁勳在主題演講上也強調，AI已完成從感知智能到生成智能，再到物理智能和智能體智能的關鍵躍遷。

財通證券指出，大模型在推理過程中會存在延遲，延遲與使用者體驗感精密掛鉤，大模型推理過程中的延遲主要在Decode階段，核心瓶頸在於記憶體頻寬。LPU具備更快的記憶體頻寬，可縮短大模型推理過程中的延遲。同時，基於LPU的大模型不僅具有更快的推理速度，還可以提供更具性價比的價格，可進一步提高使用者體驗感。

該機構表示，目前Tokens的消耗量大幅增長，帶動推理晶片市場規模的高增長。LPU有望在推理晶片市場中逐步滲透，具有高成長性的市場空間。看好LPU的高成長性及LPU以機櫃出貨時帶來的PCB機會，建議關注：智微智能（參股元川微）、星宸科技（多輪增資元川微）、滬電股份（輝達PCB供應商）、勝宏科技（輝達PCB供應商）、深南電路。 (科創板日報)

科技