當地時間周二,輝達在加州聖克拉拉舉辦的AI基礎設施峰會上發佈了最新的 Rubin CPX GPU。這款晶片專為處理百萬級Token的程式碼生成和視訊生成任務而設計。輝達 Vera Rubin 晶片(圖片來源:輝達)在人工智慧領域,Token(標記)是一種基礎處理單位,可以代表一個詞、一個子詞,甚至是視訊或音訊中的片段。無論是使用 ChatGPT、Claude、Gemini 還是 Grok,這些模型都會將使用者輸入的文字或指令拆分成若干 Token,並基於這些 Token 進行分析和生成回答。Rubin CPX 將與輝達的 Vera CPU 及 Rubin GPU 配合使用,構成 Vera Rubin NVL144 CPX 平台的一部分。其中,“NVL144” 表示該系統配備 144 個 GPU。輝達首席執行官黃仁勳表示:“Vera Rubin 平台將再次推動 AI 計算實現跨越式發展——不僅推出新一代 Rubin GPU,還引入了一類全新處理器架構——CPX。正如 RTX 曾徹底革新圖形處理與物理模擬領域,Rubin CPX 是首款專為‘超大規模上下文 AI’打造的 CUDA GPU,可支援模型在數百萬個 Token 的知識範圍內同時進行推理與運算。”據官方介紹,Vera Rubin NVL144 CPX 的 AI 性能將達到現有 Grace Blackwell 架構 GB300 NVL72 系統的 7.5 倍。輝達表示,該平台將顯著提升客戶的 AI 商業化能力,並測算出:每投入 1 億美元,預計可實現高達 50 億美元的基於Token的收益。Rubin CPX 預計將在 2026 年底正式上市。 (超算百科)