AMD公佈AI路線圖:MI325X將比H200快1.3倍!還有全新AI PC晶片!


6月3日,AMD董事長兼CEO蘇姿丰在Computex 2024展會的開幕主題演講中,公佈了全新雲端AI加速晶片路線圖,今年將推出全新Instinct  MI325X。同時,AMD也發布了代號為“ Strix Point ”的第三代AI PC晶片“銳龍AI 300系列”,以及AMD Ryzen 9000系列桌面處理器(Granite Ridge)。

今年將推出MI3 25X,性能相比輝達H200提升1.3倍

根據AMD公佈的全新雲端AI加速晶片路線圖顯示,AMD今年將推出全新的AI加速晶片Instinct MI325X,2025年推出MI350,2026年推出MI400。


據介紹,MI3 25X將延續CDNA3架構,採用第四代高頻寬記憶體(HBM)  HBM3E,容量大幅提升至288GB,記憶體頻寬也將提升至6TB/s,整體的效能將進一步提升,其他方面的規格則基本上保持與MI300X一致,方便客戶的產品升級過渡。


蘇姿丰指出,MI3 25X的AI效能提升幅度為AMD史上最大,相較競品輝達H200將有1.3倍以上的提升,同時更有性價比優勢,MI325X將於今年第四季開始供貨。

另外,AMD也將在2025年推出新一代的MI350系列,該系列晶片將採用3nm製程,基於全新的構架,整合288GB HBM3E內存,並支援FP4/FP6資料格式,推理運算速度較現有MI300系列晶片快35倍。


根據供應鏈資訊透露,MI350將進入液冷世代,為AI伺服器運算提供更強的算力、更佳的能源效率。

2026年,AMD也將推出新一代的MI400系列,維持一年一更新的節奏。

AMD銳龍AI 300系列發表:AI算力高達50TOPS!

早在2023年初,AMD就發布了銳龍7040系列(代號Pheonix)的全球首款集成獨立NPU AI引擎的x86處理器,基於全新設計的XDNA架構,算力約10TOPS(每秒10萬億次浮點運算),加上CPU、GPU整體算力約33TOPS,開創了AI PC的新時代。

2023年底,AMD又推出了銳龍8040系列(代號Hawk Point),NPU AI算力一舉提升了60%,達到約16TOPS,整體算力也提升至39TOPS。

而最新的代號為Strix Point的“銳龍AI 300系列”,則採用了全新的Zen5 PU架構,GPU內核也升級為了RDNA3.5架構,NPU也是全新的XDNA2架構,號稱是“面向下代AI PC /Copilot+ PC的世界一流處理器」。


銳龍AI 300系列首發只有兩款型號,“銳龍AI 9 HX 370”和“銳龍AI 9 HX 365”都定位高端市場。


其中,「銳龍AI 9 HX 370」是頂級旗艦,CPU部分擁有12核心24線程,多年來首次在這一定位上提供更多核心,相比銳龍8040系列增加了多達1/3。二級快取還是每核心1MB,總容量自然增加到12MB。三級快取終於打破了16MB的“禁錮”,增加了足足一半來到24MB。最高主頻5.1GHz。GPU部分不但升級架構,CU單元數量也從12個增至16個,命名為「Radeon 890M」。NPU算力則提升到了50TOPS,增加了2倍有餘。


「銳龍AI 9 365」也是高階型號,10核心20線程,二級快取10MB,三級快取仍為24MB,最高頻率達5.0GHz,NPU算力也是50TOPS,GPU部分也是Radeon 890M。

從AMD第一和第二代XDNA NPU架構的比較圖中,可以看到整體佈局基本上一致,但規模大幅擴充。


AI Tile(初代叫AIE Tile)也就是核心的AI計算引擎模組,從之前的20個增加到32個,再加上本身的增強。

Mem Tile也就是本地記憶體模組,從原來的5個增加到8個,可以更好地配合更大規模的本地調度、運算。

另外,用於互連的交叉匯流排也從普通的Data Fabric,升級為Zen/RDNA家族上無所不在的Infinity Fabric,傳輸頻寬和效率更高。

AMD聲稱,XDNA2 NPU的運算能力提升了多達5倍,多任務並行能力翻了一番,能源效率也提升了最多2倍。

需要指出的是,這裡說的AI算力提升5倍,是指的Llama 2 70億參數大模型的響應速度,從啟動到獲得第一個token,銳龍AI 9 HX 370達到了銳龍9 8940HS的多達5倍。


另外非常關鍵的一點,XDNA2首發引入了全新的Block FP16浮點精度,也就是BFloat16、BF16。它在CPU、GPU上已經很常見,而在NPU上還是第一次。

傳統的FP8浮點格式性能高且精度不足,FP16浮點格式精度高而性能略遜,而將二者融合起來的BF16可以在精度、性能上達到較好的平衡,靈活性也更高。

同時,大多數AI應用都採用了16位元精度,因此有了BF16,不再需要量化為8位元精度,減少了轉換步驟,提高了執行效率。


高通驍龍X Elite NPU的算力為45TOPS,Intel即將推出的下一代酷睿Ultra Lunar Lake NPU算力同樣是45TOPS,銳龍AI 300系列則一舉超越二者,成為當今最強NPU。

至於蘋果M4,其NPU的算力只有區區38TOPS,還不到Windows陣營這邊Copilot+ PC的最低算力需求門檻40TOPS。

隨著算力的大幅提升,NPU的應用也將不再局限於一些持續性低負載場景(例如視訊會議),而是有了更多可能,一方面可以在更多場景中部分取代CPU、GPU ,以更高的能源效率執行AI運算,大大提升筆記本的續航力。

另一方面,更強力的NPU配合更強的CPU、GPU,可以在更多場景中部署端側AI,進一步擺脫對雲端的依賴,最大好處就是可以避免隱私外洩和安全威脅。


當然,硬體算力再強,也需要生態應用的落地配合。身為AI PC的先驅,AMD 2024年內的ISV合作廠商將超過150家,既有Adobe、微軟、Topaz Labs這樣的世界級大廠,也有百川智能、釘釘、、無問芯穹、有道這樣的國內名企,前途不可限量。

新一代AI PC的最大亮點就是配合最新的Windows系統,可以打造全新的Copilot+體驗,例如歷史回憶、視訊會議即時錄製與翻譯、協同創作等。


官方提供的數據顯示,銳龍AI 9 HX 370對比高通驍龍X Elite,日常辦公室、生產力創作、多任務、圖形等各方面都遙遙領先,尤其是圖形計算性能高出了73%。


對比英特爾目前最強的酷睿Ultra 9 185H,無論是日常應用還是遊戲,都有大幅的提升,平均效能提升36%。就看英特爾下一代Lunar Lake的表現了。

對比蘋果M3,銳龍AI 9 HX 370在各方面也都有著很大的性能優勢,特別是在3D性能上,超出了98%。


銳龍AI 300系列的筆電將從7月起陸續上市,目前已有100多款設計,涵蓋宏碁、華碩、戴爾、惠普、聯想、微星等各大主要OEM品牌。


華碩會在台北電腦展上宣布一系列配備銳龍AI 300系列處理器的筆記本,其中輕薄本有16吋的靈耀(Zenbook S)、14/15/16吋的無畏(Vivobook S),創作本有16和13吋的ProArt P16/X13,遊戲本有16吋的ROG幻系列、14/16吋的天選系列(TUF GAMING A14/A16)。


微星首批三款,都是16吋大螢幕機型,包括高階商務辦公的Summit A16 AI+,輕薄全能遊戲型的絕影A16 AI+、主打超薄商務與創作的尊爵A16 AI+。

AMD Zen5 Ryzen 9000系列發表:效能比i9-14900K快56%!


全新發表的AMD Ryzen 9000系列桌面處理器(Granite Ridge),基於Zen5架構,第一批產品將於2024年7月推出。


蘇姿丰強調,Ryzen 9000系列是繼Ryzen  7000「Raphael」和Ryzen  8000「Hawk Point」系列之後,AM5插槽的第三個系列,將配備兩個Zen5小晶片,每個小晶片最多有8個核心,最高16個核心和32線程,與Ryzen 7000系列類似。 AMD也繼續支援SMT(同時多執行緒功能)。


AMD首批推出了四款CPU產品,都配有2CU RDNA2集顯:

Ryzen 9 9950X配備16核心32線程,170W TDP,最高主頻5.7 GHz;

Ryzen 9 9900X配備12核心24線程,120W​​ TDP,最高主頻5.6 GHz;

Ryzen 7 9700X配備8核心16線程,65W TDP,最高主頻5.5 GHz;

Ryzen 5 9600X配備6核心12線程,65W TDP,最高主頻5.4 GHz。

根據AMD官方測試,其Zen 5核心面向PC平台的IPC效能相比Zen 4平均提升了約16%。


與英特爾Core i9-14900K相比,AMD旗艦16核心Ryzen 9 9950X在遊戲效能測試的速度快4%到23%。在生產力性能測試中,9950X顯示出更大的優勢,比英特爾Core  i9-14900K快7%至56%。


AMD宣布Ryzen 9000系列將於7月31日推出,具體定價細節很快就會公佈。(芯智訊)