AMD在資料中心GPU市場的重大突破:從MI450到全端AI解決方案的戰略轉型

概述:AMD資料中心業務的戰略轉折點

在2025年9月8日的高盛會議上,AMD資料中心解決方案執行副總裁Forrest Norrod的發言標誌著AMD在人工智慧晶片市場的重要戰略轉折點。這次訪談不僅揭示了AMD在資料中心GPU業務的最新進展,更重要的是展現了其從單純晶片供應商向全端AI解決方案提供商的重大轉型。

AMD目前在伺服器CPU市場佔據41%的份額,在短短七年內從幾乎為零增長到這一令人矚目的水平。這一成功為AMD在GPU市場的雄心提供了堅實基礎。更為關鍵的是,AMD已明確表示其MI450系列將成為公司在AI訓練和推理領域全面競爭的轉折點。

MI450:AMD的"米蘭時刻"

  • 技術規格和性能突破

AMD MI450系列代表了公司在資料中心GPU領域的最重要產品。根據最新資訊,MI450將配備432GB的HBM4記憶體,比NVIDIA的Vera Rubin平台多50%的記憶體容量和頻寬,同時提供相當的計算性能。這一記憶體優勢對AI推理工作負載尤為重要,特別是隨著推理規模的擴大。

MI450採用了AMD最新的chiplet架構和TSMC的先進製程。預計將使用TSMC的3nm製程節點,並結合HBM4記憶體技術。這代表了NVIDIA首次採用chiplet設計的同時,AMD繼續在這一領域保持技術領先。

  • OpenAI的戰略合作夥伴關係

最引人注目的發展是AMD與OpenAI的深度合作關係。在AMD 2025年6月的Advancing AI活動中,OpenAI CEO Sam Altman親自出席並對MI450表示"極度興奮"。Altman透露,OpenAI作為AMD的"非常早期的設計合作夥伴",為MI450的需求提供了"重要反饋"。

這種合作關係的深度體現在技術細節上:AMD執行副總裁Forrest Norrod表示,來自Altman團隊的反饋推動了MI450在記憶體架構、擴展結構甚至數學核心方面的改變。這種客戶驅動的產品開發方式確保了MI450能夠滿足現實世界AI工作負載的需求。

全端解決方案:Helios機架系統

  • ZT Systems收購的戰略意義

AMD於2025年3月完成了對ZT Systems的49億美元收購,這一戰略舉措標誌著AMD從晶片供應商向系統整合商的重大轉變。ZT Systems在為全球最大雲端運算公司設計和部署資料中心AI計算和儲存基礎設施方面擁有超過15年的經驗。

這次收購使AMD能夠提供"新一類端到端AI解決方案",結合AMD的CPU、GPU和網路矽片、開源ROCm軟體以及機架級系統能力。預計該交易將在2025年底前在非GAAP基礎上產生增值效應。

  • Helios機架架構的技術創新

AMD的Helios機架系統將包含72個MI450 GPU,是公司"從頭開始設計的機架級解決方案"。與NVIDIA的NVL72機架相比,Helios在物理上更大,這雖然不會給客戶帶來問題(因為物理空間相對不重要),但使其更易於製造、支援和服務,並且預計比密度優先的設計更可靠。

AMD在設計Helios時特別考慮了資料中心的相容性。例如,機架內風冷與液冷的比例與NVIDIA相當或相似,確保客戶可以使用相同數量的冷卻器建設資料中心。這種深思熟慮的設計方法降低了客戶採用AMD解決方案的門檻。

市場定位和競爭策略

  • 從推理到訓練的漸進策略

AMD採用了多代分階段的方法來逐步建立其GPU解決方案的競爭力和差異化。從MI300系列開始,AMD專注於推理工作負載,利用其chiplet架構提供比競爭對手更多的記憶體容量,從而實現更高效的推理。

MI325將擴展軟體生態系統,而MI355將系統性地建構訓練能力,無論是在矽片還是軟體方面。這一切都將在MI450中匯聚,AMD將其定位為"無藉口的一代",目標是在任何AI工作負載(訓練或推理)中都具有領先性能。

  • 軟體生態系統的重要性

AMD深知軟體是其成功的關鍵。公司正在系統性地建構對不同框架、庫和開放原始碼專案的支援,這些對其目標客戶群體至關重要。雖然AMD可能無法快速匹配NVIDIA在長尾客戶支援方面的投資,但其專注於為佔市場80-85%的前20大客戶提供完整支援的策略是現實和有效的。

ROCm作為AMD的開源CUDA替代方案,正在快速改進。根據最新報告,ROCm在性能和易用性方面都取得了顯著進步。AMD已經在過去四個月中在軟體基礎設施方面取得了一些進展,儘管進步速度仍需加快以跟上競爭對手。

市場機遇和增長前景

  • 資料中心GPU市場規模

AMD預測到2028年AI加速器總可定址市場(TAM)將達到5000億美元。這一預測在一年多前首次提出時引起了質疑,但現在已經得到了更廣泛的認同。AMD的主要客戶,包括超大規模雲服務提供商,繼續對AI的長期前景保持極度樂觀,這在他們的資本支出計畫中得到了體現。

當前的增長速度主要受資料中心和電力可用性限制,而不是需求不足。這為AMD這樣能夠提供高效解決方案的公司創造了巨大機遇。

  • 收入增長預期

AMD預計MI450將在2026年產生重大收入貢獻。公司與多個終端客戶密切合作,為MI450的部署做準備,並收到了"極其積極的回應"。除了OpenAI,Oracle、Meta和Microsoft等主要客戶都已經在使用AMD的Instinct系列處理器。

根據分析師預測,AMD的資料中心GPU收入可能從2024年的約50億美元增長到2026年的顯著更高水平。Oracle已經宣佈將部署超過27000個由AMD加速器和EPYC Turin CPU驅動的AI節點。

客戶拓展和市場滲透

  • 超大規模雲服務商的進展

AMD在贏得主要超大規模雲服務商方面取得了重要進展。與開始CPU業務時不同,所有主要客戶現在都已經是AMD的客戶,並且已經有了資料中心合作關係。這為GPU業務的擴展提供了有利的起點。

Microsoft、Oracle、Meta和OpenAI已經公開表示支援AMD的Instinct GPU。AMD正在與其他幾家大型超大規模雲服務商進行密切合作,預計在MI355部分以及肯定在MI450上,終端客戶和超大規模雲服務商的範圍將顯著擴大。

  • 企業市場的機遇

除了雲服務商,AMD還看到了企業市場的巨大機遇。隨著企業對AI應用變得更加成熟,AMD觀察到AI使用與CPU需求之間存在直接相關性。使用AI進行產品供應或改進產品供應的公司越成熟,其增量CPU通用計算需求就越多。

挑戰與風險

  • 技術執行風險

儘管AMD對MI450充滿信心,但公司也認識到這是一個"非常複雜的機架級解決方案",存在潛在的機械問題、訊號完整性問題和熱問題。AMD正在密切關注一長串項目,並制定了"非常嚴格的去風險計畫"。

  • 軟體生態系統的挑戰

雖然AMD在軟體方面取得了進展,但與NVIDIA的CUDA生態系統相比仍有差距。NVIDIA多年來在AI方面進行了大量投資,並為眾多客戶提供支援。AMD的策略是專注於真正重要的客戶,而不是試圖快速匹配NVIDIA的長尾支援。

財務表現和未來展望

  • 當前財務狀況

AMD的資料中心業務在2025年第二季度實現了32.4億美元的銷售額,同比增長14.3%,但環比下降11.8%。這一下降主要是由於4月份停止向中國銷售MI308 GPU造成的影響。

儘管面臨挑戰,AMD預計2025年資料中心GPU銷售額將達到約63億美元,如果能夠恢復對中國的銷售,可能達到71億美元。

  • 未來收入預期

分析師預測AMD的收入將從2025年的330億美元增長到2026年的401億美元,每股收益從2025年的3.90美元增長到2026年的6.02美元。一些樂觀的分析師認為,如果AI銷售規模擴大更快,每股收益可能達到8美元。

結論:AMD的戰略轉型與市場前景

AMD在資料中心GPU市場的策略代表了從傳統晶片供應商向全端AI解決方案提供商的根本性轉變。通過MI450系列、Helios機架系統和與OpenAI等關鍵客戶的深度合作,AMD正在建構一個能夠與NVIDIA競爭的綜合生態系統。

雖然面臨技術執行和軟體生態系統的挑戰,但AMD的多代產品路線圖、戰略收購和客戶關係表明其有能力在AI市場中獲得有意義的市場份額。隨著AI市場繼續快速增長,AMD有望從其戰略投資中獲得豐厚回報,並在2026年及以後實現顯著的收入和利潤增長。

AMD的成功將不僅取決於其技術執行能力,還取決於其在軟體生態系統建設和客戶關係維護方面的持續投資。如果能夠成功執行其路線圖,AMD有望在AI時代成為資料中心基礎設施的重要力量。 (穩中求勝君)