記憶體超越輝達50% AMD Helios部署Oracle
今天,在加州聖荷西舉行的開放式運算專案(OCP) 全球高峰會上,Meta 推出了一種新型AI 開放機架的規格,該機架具有開放機架寬(ORW) 外形,標誌著開放基礎設施創新的重大飛躍,同時AMD在加州聖荷西舉行的開放式運算專案全球高峰會上展示了其為Meta 平台為Meta 平台打造的新版規格。該平台專為AI 優先的資料中心環境打造,旨在與輝達機架式GPU 和CPU 組合(例如搭載Blackwell 和Grace 處理器的GB300 NVL72)直接競爭。
AMD於今年稍早首次推出Helios 平台,重點介紹了其採用全AMD 硬體的全新設計。該平台結合了AMD的Epyc 伺服器CPU、Instinct 400 GPU、AMD Pensando 網路介面和AMD ROCm 軟體,AMD 聲稱,這使其在快速擴展的AI 基礎設施產業中擁有巨大的效能和效率優勢。
AMD 也宣布了首批Helios 系統客戶。 AMD 與Oracle 合作,首次部署Helios 機架系統,這被描述為「雙方長期、多代合作的擴展」。 Oracle 將從2026 年第三季開始部署約50,000 塊MI450 GPU,並將在2027 年部署更多GPU。
為了增強可擴展性,AMD 現已證明其符合Meta 開發的全新Open Rack Wide 規範。該規範旨在改善AI 系統的功率、散熱和可維護性。 AMD 聲稱,支援該規範和OPC 標準將使AMD 合作夥伴能夠更快、更有效地擴展規模。
AMD「Helios」AI 機架是基於Meta 在OCP 2025 上提交的開放式設計藍圖構建,旨在實現跨AI 資料中心的最佳化、可部署效能。 「Helios」是基於新一代AMD Instinct™ MI450 系列GPU 構建,重新定義了開放式機架級AI 基礎架構的潛力。
基於AMD CDNA™ 架構,每個MI450 系列GPU 均提供高達432 GB 的HBM4 記憶體和19.6 TB/s 的記憶體頻寬,為資料密集型AI 模型提供業界領先的容量和頻寬。在機架規模上,搭載72 個MI450 系列GPU 的「Helios」系統可提供高達1.4 exaFLOPS 的FP8 性能和2.9 exaFLOPS 的FP4 性能,總HBM4 內存高達31 TB,總頻寬高達1.4 PB/s——這一跨越式發展,可實現數十億參數。
另外「Helios」還具有高達260 TB/s 的縱向擴展互連頻寬和43 TB/s 的基於乙太網路的橫向擴展頻寬,有助於確保跨GPU、節點和機架的無縫通訊。與前幾代產品相比,「Helios」的效能提升高達17.9 倍1,同時記憶體容量和頻寬比NVIDIA 的Vera Rubin 系統高出50%。(IT前哨站)