當地時間5月18日,輝達宣佈,Vera CPU已完成對Anthropic、OpenAI、SpaceX AI及甲骨文雲的首批交付。此舉標誌著輝達創始人兼首席執行長黃仁勳此前聲稱的“公司下一個數十億美元級業務”已從概念驗證正式邁向商業化落地。
與生成式AI生成內容、回答問題不同,代理式AI必須執行複雜任務、呼叫外部工具、生成並運行程式碼、安排多步驟流程,甚至進行長上下文檢索和強化學習沙盒計算,這些工作流對高性能CPU的協同能力提出了極高要求。
而NVIDIA Vera專為強化學習(RL)和代理式AI設計,為模型之外的程式碼、工具和資料工作流提供支援。作為加速系統中的主機CPU,Vera與NVIDIA GPU無縫協作,能夠指導資料搬運、管理記憶體並編排系統控制,確保AI工作流全速運行。憑藉高性能、高效的核心和海量的LPDDR5X記憶體頻寬,Vera使軟體環境的運行速度提升高達50%,效率是傳統架構CPU的兩倍。
具體來看,Vera搭載了88個輝達自研的Olympus核心,擁有1.2 TB/s的記憶體頻寬,單核性能提升了50%。在持續高負載下,任務處理速度更快,從而大幅提升整個AI系統的運行效率,實現以更迅速的響應完成工作。