AWS 在 re:Invent 上推出自研 Trainium3 晶片並透露與輝達合作的路線圖,引發“雲端晶片戰”新一輪比拚。
- 在 AWS re:Invent 大會上,亞馬遜正式發佈了其新一代 AI 訓練加速器 Trainium3,並推出基於該晶片的新伺服器據稱能比上一代大幅提升性能與能效。與此同時,AWS 透露計畫在未來的 Trainium4 中採用輝達的 NVLink Fusion 技術以實現更高效的互聯。
- AWS 還在大會上同步推出包括 Nova 2 在內的新款基礎模型與定製化工具(如 Nova Forge),表明 AWS 正在把晶片 + 模型 + 雲服務做一體化競爭策略。
(以上為最核心的兩點:亞馬遜既自研晶片,又願意相容/協作輝達的互聯技術,這種“自研+開放互通”的策略,是本次事件的關鍵。)
- 定位:Trainium 系列是 AWS 專為模型訓練設計的加速器家族。Trainium3 為該路線的最新一代,主打“更高訓練吞吐與更低能耗”的雲端訓練平台。
- 性能承諾:AWS 宣稱新一代伺服器在訓練性能和能效上實現顯著提升,能以更低成本支援大型模型訓練。多家媒體報導 Trainium3 在某些指標上比上一代快數倍,並得到部分企業使用者的試用認證。
- 路線靈活:值得注意的是,AWS 同時宣佈將在未來版本引入 NVLink Fusion(輝達的高速互聯方案),顯示 AWS 在“自研”和“相容主流生態”之間尋求平衡。
為什麼有人說這會對輝達構成威脅?
- 雲端客戶大量自研等於潛在替代需求:AWS 是全球最大的雲服務商之一,如果越來越多 AI 客戶選擇在 AWS 的 Trainium 實例上訓練模型,長期會壓縮對輝達 GPU(如 H100/H200)的純粹需求。
- 價格與成本優勢:Trainium 的早期版本就主打“比通用 GPU 更低的訓練成本”;若新代繼續擴大性能/能效比優勢,企業在算力採購上會更傾向於成本更優的專用實例。
- “機房級整合”能力:AWS 不只是賣晶片,它能把晶片、網路、儲存、模型服務整合為一套完整產品(比如 Bedrock / Nova Forge),這對客戶吸引力極強。輝達雖然生態龐大,但云服務商的“端到端”產品也有不可替代性。
但這並非單向打壓——也可能演變為合作或互補:
- AWS 已公開表示將在 Trainium4 中採用 NVLink Fusion,這意味著即便 AWS 自研,面對更大規模的多晶片互聯場景,它也願意使用輝達的互聯技術。兩者既競爭又存在合作空間。
- 雲廠商自研晶片是長期趨勢
中國的阿里、華為、浪潮等也在推進自研 AI 晶片與雲端算力佈局。AWS 的動作再次證明:掌握“硬體 + 雲服務”能顯著提高平台議價能力與成本控制。對中國雲廠商與晶片廠商而言,這是追趕與競合的雙重機會。 - 模型與算力“捆綁銷售”更普遍
AWS 除了晶片,還推出 Nova 家族模型與 Nova Forge 工具,說明未來客戶更在意“效率與一體化服務”,不僅僅是買晶片。中國企業若要搶市場,需提供同樣一體化、低門檻的產品體驗。 - 輝達的王座短期難以被一錘定音撼動
輝達在硬體生態、軟體工具(CUDA)、合作夥伴與市場份額上都具備深厚優勢。單靠一款晶片難以立即替代其全盤優勢;但“雲端自研+局部互通”的策略會長期重塑需求格局。對中國本土晶片廠商而言,這既是挑戰也是進入機會窗口。
AWS 推出 Trainium3,並同時選擇在未來版本中支援 NVLink Fusion,這一組合耐人尋味:一方面 AWS 希望通過自研降低成本並掌控堆疊;另一方面又承認在互聯等技術上,與已有生態協作更有利於客戶。換言之:
未來的雲端晶片戰不會是單純的“全盤替代”或“徹底孤立”,而是以“更強的整合能力、服務能力與成本優勢”為贏者。
對關注 AI 基礎設施的你來說,值得持續關注的點包括:Trainium3 的真實基準與客戶案例、Trainium4 與 NVLink 的合作細節、以及中國雲/晶片廠商的應對節奏。 (思考的邊界)