2025年6月12日,加州Advancing AI大會現場,蘇姿丰拋出一組震撼資料:AI加速器市場正以超60%的復合年增長率狂奔,2028年市場規模將突破5000億美元,較其年初預測再上台階。台下坐OpenAI CEO奧爾特曼,他剛透露AMD下一代MI400晶片研發中已融入工程師的關鍵建議。
同步亮相的MI350X/MI355X晶片,直指輝達Blackwell架構軟肋:288GB HBM3E記憶體容量達對手1.6倍,推理性能最高領先1.3倍,訓練任務中也能超出競品13%。更耐人尋味的是,蘇姿丰現場播放了一段影片-搭載MI355X的伺服器叢集僅用1/3能耗完成同等AI負載,暗示「效能溢價」背後藏著每瓦算力的性價比殺招。
「每顆晶片都是美元熔爐」-蘇姿丰毫不諱言產業現狀。單顆高階AI晶片價格已飆升至數萬美元,而全球科技巨頭仍在瘋狂投入基礎設施,僅2025年上半年,微軟、Meta和Google的AI資本支出合計就超400億美元。這種供需失衡,正是她上調市場預期的底層邏輯。
AMD的逆襲早有伏筆。 2024年第四季,其資料中心營收暴漲69%至38.6億美元,但AI GPU銷售額僅18.4億美元,遠低於分析師預期。彼時MI300系列產能受限,全年出貨量約22.4萬片,單價約2.25萬美元,而輝達Blackwell晶片單價高達3-7萬美元。價格優勢未能轉化為市場份額,成為AMD最大痛點。
為扭轉戰局,蘇姿丰啟動「飽和人才收購」-過去一年吞併25家AI相關公司,重點補足軟體生態短板。這些動作直指AMD的阿克琉斯之踵:ROCm平台長期被輝達CUDA壓制,後者已成產業事實標準。最新ROCm 7軟體棧整合vLLM等最佳化框架,試圖以開放性對抗CUDA的封閉生態。
更隱密的佈局在客戶側。馬斯克的xAI已採用MI300晶片,OpenAI正參與MI400設計。當奧爾特曼首次聽到MI400參數時曾懷疑“絕無可能”,但如今坦言:“AI已從玩具變成生產力工具,算力需求是爆發式的”。
288GB HBM3E記憶體+8TB/s頻寬-MI355X的紙面參數堪稱暴力。但真正顛覆性突破藏在架構深處:
放棄CPU-GPU融合設計,全面轉向純GPU路線,專注AI負載最佳化;
支援FP4/FP6新資料類型,使低精度計算效率提升35倍;
液冷版MI355X功耗達1400W,效能較風冷版MI350X再提升15%,直面資料中心能耗極限。
這些改進源自於CDNA 4架構和台積電3nm工藝的加持。與上一代MI300X相比,MI350系列AI計算效能提升4倍,推理速度暴漲35倍。在實際測試中,其運行Llama 3-70B模型的token生成速度比輝達GB200快31%,每瓦性能高出40%。
但記憶體才是真正的勝負手。輝達GB200配備144GB HBM3E,而MI355X直接翻倍至288GB,記憶體頻寬8TB/s堪比超級電腦。這對大模型推理至關重要——當參數規模突破兆級,視訊記憶體容量常成為瓶頸。 AMD甚至在展示中讓MI355X同時處理3個千億級模型,挑釁意味明顯。
蘇姿丰特別強調:「推理市場成長將遠超訓練」。這一判斷直擊行業變局——隨著大模型進入落地期,推理負載正急劇膨脹。
訓練與推理成本倒掛:GPT-4單次訓練耗資7800萬美元,而每日推理成本超60萬美元;
邊緣推理爆發:汽車ADAS晶片需求年增45%,成為成長最快的AI處理器應用場景。
市場資料佐證了她的觀點:到2026年,全球AI推理晶片規模將達382億美元,較2026年86億美元成長344%。這解釋了AMD為何在MI355X上瘋狂堆砌推理性能——35倍的代際提升史無前例。
應用場景也在分化:
雲推理:需應對突發流量,MI350X的風冷設計較適合彈性擴容;
邊緣推理:MI355X的液冷方案適配車載、工廠等極端環境;
端側推理:AMD正與高通合作,將NPU技術匯入驍龍平台。
“未來沒有純訓練或推理晶片,只有動態適配工作負載的智能算力”,蘇姿丰在閉門會議中向投資者描述下一代MI400的願景。
出口管制正在重塑AI晶片產業鏈。當被問及中國市場時,蘇姿丰坦言:「我們積極遊說政府放寬對盟國的AI元件出口限制」。她透露沙烏地阿拉伯大單簽約前曾專門諮詢華盛頓,確保符合貿易合規要求。
這種謹慎源自於慘痛教訓:2024年Q4,因對華發貨受限,AMD資料中心收入比預期短少近3億美元。為規避風險,AMD啟動「雙架構戰略」:
對歐美市場:供應全規格MI355X,搭載完整CDNA 4架構;
對受限地區:推出縮水版MI352,記憶體頻寬降至5TB/s,FP6精度停用。
但替代方案已在興起。中國頭部雲廠商的測試資料顯示:
在ResNet-50推理任務中,華為升騰910B性能達MI300X的82%;
寒武紀思元590在BERT模型訓練效率接近輝達A100水準。
“地緣政治正在催生第三個AI晶片生態圈”,行業分析師在最新報告中警告,“當中國客戶被迫轉向本土晶片,AMD可能永久失去30%的市場份額”。
儘管藍圖宏偉,AMD仍面臨三重挑戰:
1. 軟體生態的代差
輝達CUDA擁有400萬開發者,而ROCm生態不足50萬。在PyTorch的官方範例中,CUDA程式碼佔比超90%。 AMD雖收購多家AI軟體公司,但生態遷移需時3-5年。
2. 液冷革命的基礎建設門檻
MI355X的1400W功耗要求資料中心全面轉向液冷。而目前全球僅15%的資料中心支援液冷機櫃,改造單機櫃成本超20萬美元。
3. 商業模式的降維打擊
輝達已從硬體轉向DGX Cloud算力服務,而AMD仍依賴晶片銷售。當客戶更願為「token付費」而非購買晶片,傳統硬體廠商估值體系將崩塌。
資本市場的遲疑顯而易見:新品發佈當日,AMD股價下跌2.2%。投資人擔憂的或許是-當蘇姿丰眺望5,000億美元市場時,AMD能否分羹超20%? 目前其在AI加速器份額不足10%,而輝達獨佔90%以上。
從MI300到MI355X,AMD的激進迭代折射出AI晶片產業的殘酷法則:每12個月必須實現效能翻番,否則立即出局。蘇姿丰的5000億預言,實則是給整個行業的「軍令狀」-只有當算力成本降至當前1/10,AI才能真正滲透進醫療、教育、製造等普通場景。
短期看,液冷機櫃裡的MI355X仍是科技巨頭的專屬武器;但長期而言,隨著MI400架構融入更多邊緣計算特性,「千元級AI伺服器」或將顛覆產業格局。正如奧爾特曼所言:「當AI推理成本低於人類時薪,機器智慧將像電力一樣無處不在」。
這場晶片戰爭沒有終點,但有永恆的贏家──所有渴望用更低成本獲取智慧的人類。
參考文獻