1530億晶體管芯片發布,AMD正式叫板輝達

在生成式AI浪潮的推動下,AMD也成為半導體市場的一個贏家。

根據最新的數據顯示,自今年年初以來,AMD的市值大漲超過90%。如果將時間線拉長到五年,AMD的市值大漲超過660%。在這背後,除了文章開頭談到的生成式AI推動外,AMD所推動的基於ZEN架構CPU和專為數據中心專用GPU設計的CDNA架構產品,收購Xilinx和Pensando所獲得的的FPGA和DPU,以及公司在Chiplet和3D V-Cache等技術的投入功不可沒。

在今天於舊金山舉辦的產品發布會上,AMD CEO Lisa Su更是直言,我們仍處於AI 生命週期的非常、非常早的階段。而根據他們的預估,數據中心AI加速器的TAM到2027年將會達到1500億美元,這意味著未來四年的CAGR將會超過50%。




正是在這樣龐大市場需求的推動下,AMD帶來了公司最新的,極具競爭力的AMD Instinct MI300系列的產品更多細節和更新。與此同時,AMD還帶來了第四代的Epyc產品的更新,全面擁抱數據中心新時代。


1530億晶體管的怪獸芯片,震撼登場

在AMD今天的發布會上,最受人關注的毫無疑問是公司的Instinct MI 300系列。因為在英偉達(NVIDIA,輝達)GPU把持的AI時代,大家希望AMD的這系列芯片能成為萬億芯片巨頭的最強競爭者。而從Lisa提供的參數看來,MI 300系列的新芯片擁有極強的競爭力。

“人工智能是塑造下一代計算的決定性技術,也是AMD 最大的戰略增長機會。”Lisa Su強調。

對AMD有了解的讀者應該知道,MI 300是他們在去年六月發布的,面向AI和HPC推出的一個重要產品。通過將CPU和GPU以chiplet的方式集成到一個芯片,並採用統一的內存架構,AMD希望這個市場能夠給AI市場帶來不一樣的產品。



而在今日,AMD帶來了公司的AMD Instinct MI 300X,一款專門面向生成式AI推出的加速器。和AMD Instinct MI 300A不一樣,AMD Instinct MI 300X並沒有集成CPU內核,而是採用了8 個GPU chiplet(基於CDNA 3架構)和另外4 個IO 內存chiplet的設計,這讓其集成的晶體管數量達到了驚人的1530億。而為了緩解AI 大型語言模型(LLM) 所面臨的內存制約,AMD為這款芯片集成了192GB的HBM 3,其存儲帶寬也高達5.2 TB/s,可以處理的參數高達400億。



作為一款對標英偉達H100的產品,如圖所示,AMD Instinct MI 300X的HMB密度是前者的2.4倍,帶寬則為前者的1.6倍。這讓AMD的這顆產品在當前的AI時代競爭力大增。同時,據AMD方面透露,基於帶寬高達896GB/s的AMD Infinity架構,我們可以將八個M1300X 加速器組合在一個系統中,這樣就能為開髮帶來更強大的計算能力,為AI 推理和訓練提供不一樣的解決方案。據AMD介紹,該芯片會在今年三季度送樣,值得一提的是,這種設計方法也是英偉達的8 路HGX 和英特爾Ponte Vecchio 的X8 UBB的選擇。



如前面所說,AMD同期還推出了AMD Instinct MI300A,這是全球首款面向AI和HPC的APU,採用了集成24 個Zen 4 內核、CDNA3 GPU 內核和128GB HBM3的設計。換而言之,和MI 300X只是集成GPU內核不一樣,AMD Instinct MI300A在設計上同時集成了CPU和GPU。與MI250 相比,該產品提供了8 倍的性能和5 倍的效率。

據外媒seminalysis所說,MI300A 憑藉異構CPU+GPU 計算成為頭條新聞,而El Capitan Exascale 超級計算機正在使用該版本。他們指出,MI300A 在72 x 75.4mm 基板上採用集成散熱器封裝的設計,適合插槽SH5 LGA 主板,每塊板有4 個處理器,能有效地支付開發成本。seminalysis透露,該芯片已經出貨,但真正在第三季度出現增長,這和AMD的說法也是一致的。他們進一步指出,標準服務器/節點將是4 個MI300A。不需要主機CPU,因為它是內置的。

“這是迄今為止市場上最好的HPC 芯片,並將保持一段時間。”seminalysis強調。



在發布這些面向AI應用芯片的同時,我們自然就繞不開AMD在軟件方面的投入,這在很多分析人士看來,會是AMD在這個市場發力的一個短板。但從AMD總裁Victor Peng的介紹我們可以看到,他們也在這個市場訂下了一個目標,那就是Open(software approach)、Proven(AI capability)和Ready(support for AI models)。




據Victor Peng介紹,AMD 擁有一套完整的庫和工具ROCm,可以用於其優化的AI 軟件堆棧。與專有的CUDA 不同,這是一個開放平台。而在過去的發展中,公司也一直在不斷優化ROCm 套件。AMD同時還在與很多合作夥伴合作,希望進一步完善其軟件,方便開發者的AI開發和應用。


“我們在構建可與模型、庫、框架和工具的開放生態系統協同工作的強大軟件堆棧方面取得了真正的巨大進步。”Victor Peng說。


備受關注的Bergamo,如約而至

在介紹了MI300的同時,AMD在今天還介紹公司了另一款重頭戲產品——新一代的EPYC。這是一系列為數據中心設計的芯片,到了第四代,AMD則準備了四條針對不同市場的產品線,當中更是包括了備受關注的、以雲原生計算需求為目的的Bergamo系列以及代號為Genoa-X的第二代EPYC 3D V-Cache CPU。



據Lisa Su 介紹,新一代的AMD EPYC Genoa 在雲工作負載中的性能是英特爾競爭處理器的1.8 倍,在企業工作負載中的速度是英特爾競爭處理器的1.9 倍。Lisa同時談到,絕大多數人工智能都在CPU 上運行,而AMD 的產品在這方面性能方面比競爭對手的至強8490H 具有絕對領先優勢,性能高出1.9 倍,效率也同樣是競爭對手的1.8 倍。



在介紹了EPYC Genoa之後,Lisa著重介紹了公司的雲原生產品Bergamo,一款讓開發者期待已久的高密度服務器CPU。據介紹,該芯片基於AMD 的密度優化Zen 4c 架構,提供多達128 個CPU 內核,比AMD 當前一代旗艦EPYC 9004 “Geona”芯片多32 個內核。在AMD CTO Mark Papermaster看來,Zen 4c是AMD緊湊密度的補充,是公司核心路線圖的新泳道,它在大約一半的核心區域提供與Zen 4 相同的功能。



在分析人士看來,Zen 4c 和Bergamo 設計的目的是提供盡可能多的計算資源,這也是AMD在摩爾定律失效的情況下,為滿足盡客戶需要繼續增加核心數量需求而做出的一個決定。根據AMD提供的數據,全新的Zen 4C核心可以減少35%的面積,在每個CCD中可以提供的核心數量是Zen 4的兩倍,在每個Socket中則能增加33%的核心。換而言之,Zen 4 每個CCD 有8 個內核,而Zen 4c 每個CCD 有16 個內核。這也意味著Zen 4c EPYC 芯片的CCD 總體上少於其原始Zen 4 芯片。



據AMD介紹, 這次發布的Bergamo僅使用八個Zen 4C Chiplet和中央IO Chiplet,這和標準EPYC 芯片最多使用十二個Zen 4 Chiplet設計略有不同。得益於這個設計,Bergamo成為了一個擁有820億晶體管的設計,低於完整Genoa 芯片中的約900億個晶體管。這個更高的內核數量和更小的時鐘速度設計使得該芯片比Genoa 設計更節能——這是AMD定義該產品所專注市場時考慮的重要因素。AMD也透露,Bergamo在性能和效率方面的表現也非常出色。



依賴於其高核心密度和高能效,AMD 希望Bergamo在該領域能與基於Arm 的Ampere、Amazon 和其他使用Arm 架構內核的公司競爭,AMD 也希望這款芯片會成為Intel於2024 年推出的,具備144核心的Sierra Forest的有力競爭者。

除了上述產品之外,AMD還帶來了具有1.1GB L3緩存的“Genoa-X”EPYC 處理器。據了解,Genoa-X是AMD 第一代V-cache Milan-X的繼任者。與上一代產品一樣,AMD 正在使用緩存芯片堆疊為其他常規的Genoa Zen 4 CCD 添加更多的L3 緩存。在這種設計下,Genoa/Genoa-X 芯片上有12 個CCD,這允許AMD 向芯片添加768MB 的額外L3 緩存。


更多芯片在路上

在這次的盛會上,AMD還披露了全新的DPU規劃,這是他們通過收購Pensando所獲得的技術。在他們看來,AMD 的Pensando SmartNIC 是新數據中心架構不可或缺的一部分。按照AMD的規劃,他們接下來會將P4 DPU 卸載集成到網絡交換機,從而在機架級別提供服務。為此,他們正在與HPE Aruba Networks 一起開發智能交換機。



AMD 同時強調了其代號為“Giglio”的下一代DPU 路線圖,與當前一代產品相比,該路線圖旨在為客戶帶來更高的性能和能效,預計將於2023 年底上市。AMD 還發布了AMD Pensando Software-in-Silicon Developer Kit (SSDK),使客戶能夠快速開發或遷移服務以部署在AMD Pensando P4 可編程DPU 上,與AMD 上已經實現的現有豐富功能集相協調Pensando 平台。AMD Pensando SSDK 使客戶能夠發揮領先的AMD Pensando DPU 的強大功能,並在其基礎架構中定製網絡虛擬化和安全功能,與Pensando 平台上已實施的現有豐富功能集相協調。

依賴於這些豐富的產品,AMD正在衝擊數據中心的下一個高峰。(半導體行業觀察)