AMD公佈AI路線圖：MI325X將比H200快1.3倍！還有全新AI PC晶片！

2024/06/04

•

6月3日，AMD董事長兼CEO蘇姿丰在Computex 2024展會的開幕主題演講中，公佈了全新雲端AI加速晶片路線圖，今年將推出全新Instinct MI325X。同時，AMD也發布了代號為“ Strix Point ”的第三代AI PC晶片“銳龍AI 300系列”，以及AMD Ryzen 9000系列桌面處理器（Granite Ridge）。

今年將推出MI3 25X，性能相比輝達H200提升1.3倍

根據AMD公佈的全新雲端AI加速晶片路線圖顯示，AMD今年將推出全新的AI加速晶片Instinct MI325X，2025年推出MI350，2026年推出MI400。

據介紹，MI3 25X將延續CDNA3架構，採用第四代高頻寬記憶體(HBM) HBM3E，容量大幅提升至288GB，記憶體頻寬也將提升至6TB/s，整體的效能將進一步提升，其他方面的規格則基本上保持與MI300X一致，方便客戶的產品升級過渡。

蘇姿丰指出，MI3 25X的AI效能提升幅度為AMD史上最大，相較競品輝達H200將有1.3倍以上的提升，同時更有性價比優勢，MI325X將於今年第四季開始供貨。

另外，AMD也將在2025年推出新一代的MI350系列，該系列晶片將採用3nm製程，基於全新的構架，整合288GB HBM3E內存，並支援FP4/FP6資料格式，推理運算速度較現有MI300系列晶片快35倍。

根據供應鏈資訊透露，MI350將進入液冷世代，為AI伺服器運算提供更強的算力、更佳的能源效率。

2026年，AMD也將推出新一代的MI400系列，維持一年一更新的節奏。

AMD銳龍AI 300系列發表：AI算力高達50TOPS！

早在2023年初，AMD就發布了銳龍7040系列(代號Pheonix)的全球首款集成獨立NPU AI引擎的x86處理器，基於全新設計的XDNA架構，算力約10TOPS(每秒10萬億次浮點運算)，加上CPU、GPU整體算力約33TOPS，開創了AI PC的新時代。

2023年底，AMD又推出了銳龍8040系列(代號Hawk Point)，NPU AI算力一舉提升了60％，達到約16TOPS，整體算力也提升至39TOPS。

而最新的代號為Strix Point的“銳龍AI 300系列”，則採用了全新的Zen5 PU架構，GPU內核也升級為了RDNA3.5架構，NPU也是全新的XDNA2架構，號稱是“面向下代AI PC /Copilot+ PC的世界一流處理器」。

銳龍AI 300系列首發只有兩款型號，“銳龍AI 9 HX 370”和“銳龍AI 9 HX 365”都定位高端市場。

其中，「銳龍AI 9 HX 370」是頂級旗艦，CPU部分擁有12核心24線程，多年來首次在這一定位上提供更多核心，相比銳龍8040系列增加了多達1/3。二級快取還是每核心1MB，總容量自然增加到12MB。三級快取終於打破了16MB的“禁錮”，增加了足足一半來到24MB。最高主頻5.1GHz。GPU部分不但升級架構，CU單元數量也從12個增至16個，命名為「Radeon 890M」。NPU算力則提升到了50TOPS，增加了2倍有餘。

「銳龍AI 9 365」也是高階型號，10核心20線程，二級快取10MB，三級快取仍為24MB，最高頻率達5.0GHz，NPU算力也是50TOPS，GPU部分也是Radeon 890M。

從AMD第一和第二代XDNA NPU架構的比較圖中，可以看到整體佈局基本上一致，但規模大幅擴充。

AI Tile(初代叫AIE Tile)也就是核心的AI計算引擎模組，從之前的20個增加到32個，再加上本身的增強。

Mem Tile也就是本地記憶體模組，從原來的5個增加到8個，可以更好地配合更大規模的本地調度、運算。

另外，用於互連的交叉匯流排也從普通的Data Fabric，升級為Zen/RDNA家族上無所不在的Infinity Fabric，傳輸頻寬和效率更高。

AMD聲稱，XDNA2 NPU的運算能力提升了多達5倍，多任務並行能力翻了一番，能源效率也提升了最多2倍。

需要指出的是，這裡說的AI算力提升5倍，是指的Llama 2 70億參數大模型的響應速度，從啟動到獲得第一個token，銳龍AI 9 HX 370達到了銳龍9 8940HS的多達5倍。

另外非常關鍵的一點，XDNA2首發引入了全新的Block FP16浮點精度，也就是BFloat16、BF16。它在CPU、GPU上已經很常見，而在NPU上還是第一次。

傳統的FP8浮點格式性能高且精度不足，FP16浮點格式精度高而性能略遜，而將二者融合起來的BF16可以在精度、性能上達到較好的平衡，靈活性也更高。

同時，大多數AI應用都採用了16位元精度，因此有了BF16，不再需要量化為8位元精度，減少了轉換步驟，提高了執行效率。

高通驍龍X Elite NPU的算力為45TOPS，Intel即將推出的下一代酷睿Ultra Lunar Lake NPU算力同樣是45TOPS，銳龍AI 300系列則一舉超越二者，成為當今最強NPU。

至於蘋果M4，其NPU的算力只有區區38TOPS，還不到Windows陣營這邊Copilot+ PC的最低算力需求門檻40TOPS。

隨著算力的大幅提升，NPU的應用也將不再局限於一些持續性低負載場景(例如視訊會議)，而是有了更多可能，一方面可以在更多場景中部分取代CPU、GPU ，以更高的能源效率執行AI運算，大大提升筆記本的續航力。

另一方面，更強力的NPU配合更強的CPU、GPU，可以在更多場景中部署端側AI，進一步擺脫對雲端的依賴，最大好處就是可以避免隱私外洩和安全威脅。

當然，硬體算力再強，也需要生態應用的落地配合。身為AI PC的先驅，AMD 2024年內的ISV合作廠商將超過150家，既有Adobe、微軟、Topaz Labs這樣的世界級大廠，也有百川智能、釘釘、、無問芯穹、有道這樣的國內名企，前途不可限量。

新一代AI PC的最大亮點就是配合最新的Windows系統，可以打造全新的Copilot+體驗，例如歷史回憶、視訊會議即時錄製與翻譯、協同創作等。

官方提供的數據顯示，銳龍AI 9 HX 370對比高通驍龍X Elite，日常辦公室、生產力創作、多任務、圖形等各方面都遙遙領先，尤其是圖形計算性能高出了73%。

對比英特爾目前最強的酷睿Ultra 9 185H，無論是日常應用還是遊戲，都有大幅的提升，平均效能提升36%。就看英特爾下一代Lunar Lake的表現了。

對比蘋果M3，銳龍AI 9 HX 370在各方面也都有著很大的性能優勢，特別是在3D性能上，超出了98%。

銳龍AI 300系列的筆電將從7月起陸續上市，目前已有100多款設計，涵蓋宏碁、華碩、戴爾、惠普、聯想、微星等各大主要OEM品牌。

華碩會在台北電腦展上宣布一系列配備銳龍AI 300系列處理器的筆記本，其中輕薄本有16吋的靈耀(Zenbook S)、14/15/16吋的無畏(Vivobook S)，創作本有16和13吋的ProArt P16/X13，遊戲本有16吋的ROG幻系列、14/16吋的天選系列(TUF GAMING A14/A16)。

微星首批三款，都是16吋大螢幕機型，包括高階商務辦公的Summit A16 AI+，輕薄全能遊戲型的絕影A16 AI+、主打超薄商務與創作的尊爵A16 AI+。

AMD Zen5 Ryzen 9000系列發表：效能比i9-14900K快56%！

全新發表的AMD Ryzen 9000系列桌面處理器（Granite Ridge），基於Zen5架構，第一批產品將於2024年7月推出。

蘇姿丰強調，Ryzen 9000系列是繼Ryzen 7000「Raphael」和Ryzen 8000「Hawk Point」系列之後，AM5插槽的第三個系列，將配備兩個Zen5小晶片，每個小晶片最多有8個核心，最高16個核心和32線程，與Ryzen 7000系列類似。 AMD也繼續支援SMT（同時多執行緒功能）。

AMD首批推出了四款CPU產品，都配有2CU RDNA2集顯：

Ryzen 9 9950X配備16核心32線程，170W TDP，最高主頻5.7 GHz；

Ryzen 9 9900X配備12核心24線程，120W TDP，最高主頻5.6 GHz；

Ryzen 7 9700X配備8核心16線程，65W TDP，最高主頻5.5 GHz；

Ryzen 5 9600X配備6核心12線程，65W TDP，最高主頻5.4 GHz。

根據AMD官方測試，其Zen 5核心面向PC平台的IPC效能相比Zen 4平均提升了約16%。

與英特爾Core i9-14900K相比，AMD旗艦16核心Ryzen 9 9950X在遊戲效能測試的速度快4%到23%。在生產力性能測試中，9950X顯示出更大的優勢，比英特爾Core i9-14900K快7%至56%。

AMD宣布Ryzen 9000系列將於7月31日推出，具體定價細節很快就會公佈。(芯智訊)