AMD向Arm晶片開砲，輝達回擊

2024/07/27

•

AMD 聲稱，其目前的資料中心矽片的速度已經比Nvidia 的Grace CPU 超級晶片快兩倍多，效率高達2.75 倍。

該晶片設計公司是在上周發布的自己的測試之後做出上述斷言的，在測試中該公司考慮了Nvidia 的2022 Grace CPU 超級晶片。

該產品結合了一對CPU 晶片，每個晶片包含72 個Arm Neoverse V2 核心，透過900GB/秒的NVLink 晶片間互連將它們連接起來，並支援高達960GB 的高速LPDDR5x 記憶體。不過，AMD 似乎正在測試480GB 版本。

需要明確的是，這不是Nvidia 的Grace-Hopper Superchip（GH200），它結合了單個Grace CPU、高達480GB 的LPDDR5x 和144GB H100 GPU 晶片。

與Nvidia 的Grace CPU 相比，AMD測試了運行Epyc 4 Genoa (9654) 和Bergamo (9754) 的單插槽和雙插槽系統，每個系統都配備768GB 的DDR5 4800MT/秒記憶體。

在十種工作負載（包括通用計算、服務器端Java、電源效率、事務數據庫、決策支援系統、Web 服務器、內存數據庫、視頻編碼和高效能計算(HPC)）中，AMD 宣稱其套件的性能是Nvidia 晶片的1.5 倍到4 倍。

值得一提的是，與任何供應商提供的基準測試一樣，讀者請謹慎對待。

在SPECpower-ssj2008 基準測試中，AMD 聲稱單個128 核Epyc 9754 的每瓦性能比Nvidia 基於Arm Neoverse V2 的晶片高出約2.5 倍，而一對Bergamo Epycs 將這一優勢提升至2.75 倍。

對於那些一直關注Grace 開發的人來說，這一切都不應該感到驚訝——儘管情況並不像AMD 讓你相信的那麼簡單。

正如The Next Platform在二月份報導的那樣，斯托尼布魯克大學和水牛城大學的研究人員比較了從多個科研機構和一個雲構建商收集的Nvidia 的Grace CPU 超級晶片和幾台x86 處理器的性能資料。

當然，這些測試大多以HPC 為中心，包括Linpack、高效能共軛梯度法(HPCG)、OpenFOAM 和Gromacs。雖然Grace 系統的性能在測試中差異很大，但最糟糕的情況下，它介於英特爾的Skylake 架構（大約2015 年）和其Ice Lake（2019 年）技術之間，擊敗了AMD 的Milan（自2021 年開始），與2023 年初推出的Xeon Max 相差無幾。

研究結果表明，在正確的基準上，AMD 最強大的Genoa 和Bergamo Epyc 處理器可能會擊敗Nvidia 的首款資料中心CPU。

但正如我們之前提到的，所有這些都取決於工作負載。在其Grace CPU Superchip資料表中，Nvidia 顯示，該晶片的效能是雙96 核心Epyc 9654s（與AMD 測試中使用的Genoa Epyc 相同）的90% 到2.4 倍，並且在各種雲和HPC 服務中的吞吐量高達三倍。

雖然傳統的CPU 較量可能有意義——歸根結底，Grace 和Epyc 都是資料中心CPU 平台——但我們還沒有真正看到Nvidia 的Grace CPU 超級晶片在HPC 應用之外得到廣泛部署，通常是為了準備更大規模部署新一代GH200 晶片。英國的Isambard-3 和Isambard-AI 超級電腦就是該戰略付諸實踐的典範。

Nvidia 自己將CPU 超級晶片宣傳為旨在「處理海量資料以最大程度地提高能源效率」的晶片，並特別提到了人工智慧、數據分析、超大規模雲應用程序和HPC 應用程序。

此外，在GH200 組態中，大部分計算都由GPU 完成- Grace 主要為加速器提供資料。顯然，Nvidia 認為Grace 及其NVLink-C2C 互連能夠勝任這項任務，因為它選擇在即將推出的GB200 超級晶片上重複使用CPU，我們在Nvidia 的GTC 開發者大會上回顧了這款晶片。

可以說，這就是Nvidia 需要Grace 所做的一切，才能成功。這也解釋了為什麼這家加速冠軍已經開始著手開發其繼任產品。

我們必須想像，將Grace-Grace 與第四代Epyc 進行交叉購買的人數（當然，在HPC 領域之外）是一個相當短的名單。老實說，我們更有興趣看到GH200 與AMD 的MI300A APU之間的正面對抗。

AMD 最後討論了Arm 相容性——這個主題值得進行更多基準測試。

我們感覺AMD 的測試可能只是為了消除人們對x86 失去動力和Arm 接管的擔憂。

Arm 對HPC 社區或雲來說並不是新事物，這些市場遠遠沒有拒絕這種架構。事實上，現在每個主要的美國雲端供應商都擁有自己的Arm CPU。

但如果這真的是關於AMD 的Zen 4 和Zen 4c 核心與Arm 的Neoverse V2 架構的比較，那麼與亞馬遜網絡服務的Graviton4 進行比較會更有用。

Graviton4 於2023 年底發布，基於與Grace 相同的Neoverse V2 核心，但擁有96 個核心並支援標準雙插槽組態和12 個DDR4 通道，而不是Grace 的鑷接LPDDR5x 模組。

運行Graviton4 的實例已在預覽版中推出數月，並於上周正式推出。或許更重要的是，AWS 同時提供基於Epyc 4 和Graviton 4 的實例，這使得人們將兩者進行比較的可能性大大提高。

與此同時，Nvidia 發布了類似的基準測試來反駁AMD 的說法，正如您所想像的那樣，它們看起來與Team Red 提供的結果大不相同。根據Nvidia 的說法，Grace CPU Superchip 在伺服器端效能上比雙插槽EPYC 9654 快2.4 倍，在資料中心吞吐量上快3 倍。平均而言，Grace CPU 在多次測試中快1.5-2.0 倍。

AMD EPYC 處理器在效能和效率方面領先ARM 處理器，且毫不妥協

資料中心是現代數字經濟的支柱，為需要高效能、高能源效率和易用性的各種應用和服務提供支援。無論您運行的是在線購物、網站託管、數據分析、視頻流還是人工智慧(AI) 工作負載，您都需要一款能夠提供最佳結果且不影響任何方面的處理器，並且所有處理器都具有無縫可移植性，以便您可以專注於主要業務。

資料中心業務的重要性日益增加，如今大量電力專用於資料中心和雲端基礎設施，這促使許多供應商提出替代處理器選擇，這些選擇通常聲稱比常見的x86 解決方案更具優勢。這些新替代方案之一來自Nvidia，其基於ARM處理器IP 的「Grace Superchip」。通常，這些方案會大張旗鼓地推出，並聲稱與x86 相比具有顯著的性能和能源效率優勢。但很多時候，這些說法很難轉化為現實世界的競爭性工作負載場景——因為替代方案過時、不夠優化或假設記錄不充分。

AMD EPYC 處理器繼續在資料中心效能、能源效率、安全性和總擁有成本方面樹立新標準，這得益於對成熟的x86 架構的持續創新。無論是在本地部署、在雲端環境中部署還是在不同行業部署，第四代AMD EPYC 處理器產品組合都能提供尖端解決方案來滿足各種工作負載要求。廣泛的AMD EPYC 生態系統包含250 多種不同的伺服器設計，支援近900 個獨特的雲端實例，並受到全球一些最大公司的信任，用於運行其服務。 AMD EPYC 處理器在廣泛的基準測試中保持著300 多項效能和效率世界紀錄，包括商業應用、技術計算、數據管理、數據分析、數字服務、媒體和娛樂以及基礎設施解決方案。

正如我們在本文中所展示的，EPYC 在眾多行業標準基準測試中領先於基於ARM 的解決方案。此外，借助AMD 首創的久經考驗的x86-64 架構，您無需昂貴的移植或架構轉換即可獲得這一優勢。

我們在十個關鍵工作負載上比較了AMD EPYC 處理器和NVIDIA Grace CPU Superchip 的效能，涵蓋通用運算、伺服器端Java、電源效率、事務資料庫、決策支援系統、Web 服務器、記憶體分析、視頻編碼和HPC 工作負載。我們使用行業標準基準和測試方法來確保公平透明的比較。 Raghu Nambiar 在部落格中發布了一套完整的測試結果，其中包括測試討論以及系統和測試組態的檔案，鏈接如下。圖1 顯示了結果摘要，即AMD EPYC 處理器效能與NVIDIA Grace CPU Superchip 系統效能的比率。

*圖1：AMD EPYC處理器與NVIDIA Grace CPU超級晶片效能對比*

可以看出，AMD EPYC 處理器在代表多個垂直行業的工作負載中提供的性能是NVIDIA Grace CPU 超級晶片的兩倍以上，展示了AMD EPYC 處理器在數據中心性能方面的卓越能力，毫不妥協。

值得注意的是，AMD EPYC 架構為您提供了開箱即用的效能和能源效率。您可以獲得關鍵應用所需的所有效能，同時還有助於實現能源目標，而無需更改架構甚至系統供應商。領先的能源效率以基於AMD EPYC 的服務器的形式提供，這些服務器來自您熟悉和信任的服務器供應商，可用於運營您當前的業務。下面的圖2 提供了上圖中資料的細分，以更直接地關注使用備受推崇的SPECpower_ssj2008 基準測試的系統結果，該基準旨在展示工作負載處理中的能源效率。

如圖所示，基於單插槽和雙插槽AMD EPYC 9754 的系統分別比NVIDIA Grace 系統高出約2.50 倍和約2.75 倍。此外，在相同測試中，雙插槽AMD EPYC 9654 系統比同一NVIDIA 系統高出約2.27 倍。

除了效能和效率之外，相容性是資料中心運營商需要考慮的另一個重要因素。據估計，全球有數兆行軟件代碼，其中大部分是為x86 架構編寫的。 AMD EPYC 處理器基於AMD 首創的x86-64 架構，該架構是資料中心產業使用最廣泛、支援最廣泛的架構。這意味著您可以在AMD EPYC 處理器上運行各種工作負載，而不會出現任何相容性問題，也不需要昂貴的架構轉換到不同的ISA。人們很容易忘記軟件連接埠是一回事，真正的負擔在於必須管理和維護多個程式碼庫。此外，每個ARM 實現因晶片供應商而異，因此使用一個ARM 晶片並不意味著您可以期望與另一個供應商的ARM 晶片無縫相容。

AMD 認為架構變更既困難又昂貴，而且充滿風險。基於開放標準的方法與不懈創新相平衡，為客戶提供了更好的途徑。 AMD EPYC 處理器幫助伺服器供應商和生態系統IHV 支援向最新功能和標準（如PCIe® 5.0、DDR5 和CXL）的過渡，以確保面向未來和互通性，並為客戶提供平穩的採用路徑。很少有ARM 產品在將擴展的IHV 服務器生態系統帶入共同創新方面擁有良好的記錄。 AMD 繼續執行穩定的處理器創新路線圖，並為客戶提供值得信賴的選擇來推進其資料中心。

AMD EPYC 處理器是資料中心效能和效率的最佳選擇，因為它們在十種關鍵工作負載中的表現優於NVIDIA Grace CPU Superchip，這是基於大量行業標準基準測試出版物和測試的結果。 AMD EPYC 處理器還具有x86 處理器架構相容性的優勢，使您能夠部署廣泛的工作負載，而不會做出任何妥協，也無需昂貴的架構轉換到不同的ISA。對於希望透過簡單的按鈕最大限度地提高效能，同時最大限度地降低資料中心的功耗和空間佔用的資料中心運營商來說，AMD 處理器是最佳選擇。在人工智慧時代，您需要為新興的人工智慧工作負載提供容量，AMD 提供了最佳選擇，它基於行業標準，數據和基準的透明度，以及整個生態系統中平台和解決方案的廣泛可用性，無需昂貴的架構轉換。（半導體產業觀察）

科技