輝達“數十億美元級業務”走向落地

當地時間5月18日,輝達宣佈,Vera CPU已完成對Anthropic、OpenAI、SpaceX AI及甲骨文雲的首批交付。此舉標誌著輝達創始人兼首席執行長黃仁勳此前聲稱的“公司下一個數十億美元級業務”已從概念驗證正式邁向商業化落地。

與生成式AI生成內容、回答問題不同,代理式AI必須執行複雜任務、呼叫外部工具、生成並運行程式碼、安排多步驟流程,甚至進行長上下文檢索和強化學習沙盒計算,這些工作流對高性能CPU的協同能力提出了極高要求。

而NVIDIA Vera專為強化學習(RL)和代理式AI設計,為模型之外的程式碼、工具和資料工作流提供支援。作為加速系統中的主機CPU,Vera與NVIDIA GPU無縫協作,能夠指導資料搬運、管理記憶體並編排系統控制,確保AI工作流全速運行。憑藉高性能、高效的核心和海量的LPDDR5X記憶體頻寬,Vera使軟體環境的運行速度提升高達50%,效率是傳統架構CPU的兩倍。

具體來看,Vera搭載了88個輝達自研的Olympus核心,擁有1.2 TB/s的記憶體頻寬,單核性能提升了50%。在持續高負載下,任務處理速度更快,從而大幅提升整個AI系統的運行效率,實現以更迅速的響應完成工作。

在首批客戶中,甲骨文的態度最為積極。“OCI(甲骨文雲基礎設施)計畫從2026年起部署數十萬顆輝達Vera CPU,因為Vera能夠提供OCI所需的效率、密度和空間佔用,從而助力下一代企業級人工智慧的發展。”OCI高級副總裁Karan Batta表示。

有分析人士認為,甲骨文的這一承諾表明代理式AI對CPU的需求並非單純的技術敘事,而是可直接兌現為商業訂單、拉動業績增長的真實市場需求。

值得注意的是,Vera並非一款獨立產品,而是輝達AI工廠中的重要組成部分。它將與Rubin GPU、BlueField 4 DPU、Spectrum-X乙太網路網路平台以及MGX機架一道,共同構成下一代人工智慧基礎設施的核心。在Vera Rubin NVL72系統中,Vera可通過第二代NVLink-C2C與Rubin GPU相連,形成統一的記憶體架構,大幅改善GPU的資料供給效率與整體計算效能。

上述分析人士進一步表示,Vera的交付意味著輝達的新一代人工智慧硬體產品的落地兌現已從GPU擴展到CPU,未來或將進一步擴展至網路乃至機架系統。伴隨行業資本開支維持高增態勢,輝達作為生成式AI與代理式AI最大受益者的市場地位或將被進一步鞏固。 (上海證券報)