#TensorWave
AMD,殺瘋了
本周,亞特蘭大 SC24 會議上熱議的 11 月份 Top500 超級電腦排名較 5 月份在德國漢堡 ISC24 會議上發佈的 6 月份名單有了很大變化,而且正在安裝的新機器也有一些有趣的進展。 當然,最大的新聞是,期待已久的“El Capitan”系統由惠普企業公司打造,採用 AMD 的混合 CPU-GPU 計算引擎,現已投入運行,並且不出所料,成為排行榜上新的flopper。而且,它遠遠領先於美國的競爭對手,以及中國傳聞的百億億次級機器的規格。 El Capitan 的很大一部分(截至撰寫本文時我們還不知道它到底有多大),包括 43,808 台 AMD“Antares-A”Instinct MI300A 裝置(根據我們的計算),已經由勞倫斯利弗莫爾國家實驗室根據各種基準進行了測試,包括自 1993 年以來用於對超級電腦進行排名的高性能 Linpack 測試。使用 HPL 測試的 El Capitan 部分的峰值理論性能為 2,746.4 petaflops,明顯高於我們預期的 2.3 exaflops 到 2.5 exaflops。(當然,這是針對 64 位精度的浮點運算而言的。)HPL 測試的峰值持續性能為 1,742 petaflops,計算效率為 63.4%。這是我們對新加速系統進入市場時所期望的效率水平(我們的標準是 65%),我們預計在 2025 年的後續排名中,El Capitan 將在基準測試中發揮更多的理論容量,因為該系統正在逐步獲得勞倫斯利弗莫爾的認可。 提醒一下,MI300A 於 2023 年 12 月與其兄弟 MI300X(具有八個 GPU 晶片組,沒有 CPU 核心)一起發佈。MI300A 有三個晶片組,總共有二十四個“Genoa”Epyc 核心和六個 Antares GPU 流式多處理器晶片組,運行頻率為 1.8 GHz。在 Cray EX 系統中,所有 MI300A 計算引擎都通過 HPE 的“Rosetta”Slingshot 11 乙太網路互連相互連接。總而言之,在測試的 El Capitan 部分中,GPU 晶片組上有 105 萬個 Genoa 核心和略低於 1000 萬個流式多處理器。這顯然需要管理大量的並行。但這並不瘋狂。位於中國無錫國家超級計算中心的神威“太湖之光”超級電腦自 2016 年以來一直位列 Top500 排行榜,至今仍是全球第十五強大的機器(至少在使用 HPL 測試的機器中),總共擁有 1065 萬個核心。
AMD最近出了開源的AI模型,不知道和他們的GPU有沒有關係