財經雜誌—多自研少採購,亞馬遜超50%新增算力來自自研晶片

無論是在美國還是中國,雲廠商和AI創業公司自研算力晶片的趨勢早已開始且逐步深入,這個過程雖然很慢,但不可逆


亞馬遜自研的AI訓練晶片Trainium 2


亞馬遜旗下雲端運算業務——亞馬遜AWS,在其年度全球大會re:Invent宣佈了自研資料中心晶片進展。

亞馬遜AWS目前量產了三款自研晶片,分別是——Graviton 4、Trainium 2、Inferentia 2。

Graviton 4是一款Arm架構的CPU(中央處理器)晶片,它主要對標英特爾、AMD的x86架構晶片。Trainium 2,是一款AI(人工智慧)訓練晶片,它主要對標輝達旗下A100/H100等旗艦AI訓練晶片。Inferentia 2是一款AI推理晶片,它主要對標輝達旗下A10等入門等級的AI推理晶片。

亞馬遜AWS CEO(首席執行官)馬特·加曼(Matt Garman)在美國西部時間12月4日宣佈,將在2025年量產新一代AI訓練晶片Trainium 3。這款晶片採用了3納米工藝製程,性能比前代產品Trainium 2高出兩倍,性價比可以提升40%。

《財經》從亞馬遜AWS瞭解到,2024年亞馬遜AWS全球新增CPU(中央處理器)算力的一半以上都是基於Arm架構Graviton系列晶片,規模已經超過了x86架構晶片(主要生產企業包括英特爾、AMD)。

一位晶片行業人士解讀,亞馬遜AWS等雲廠商自研晶片一般有兩條邏輯:其一,雲廠商自研晶片通常可以降低單位算力成本,讓自家雲業務更有性價比;其二,節省外部晶片採購費用,減少對晶片供應商的依賴。不過,這些晶片不會直接對外銷售,而是在雲廠商的資料中心,變成雲化的算力對外租賃。

某中國雲廠商的一位不具名的晶片負責人曾分析稱,雲廠商自研晶片通常可以針對自身業務特點做最佳化。自研晶片在實現量產的前提下,通常比英特爾、輝達的晶片採購成本、營運成本更低。節省下來的成本用於降低算力價格。


01 誰在用?

一批知名企業是亞馬遜AWS三款自研晶片(Graviton 4、Trainium 2、Inferentia 2)雲服務的使用者,其中包括蘋果公司、全球最大的ERP(企業資源管理)軟體企業SAP、AI創業公司Anthropic、知名資料分析企業Datadog、社交平台Pinterest。

馬特·加曼(Matt Garman)公開表示,在亞馬遜AWS彈性計算產品的1000個最大客戶,有90%以上正在使用Graviton晶片的算力資源。亞馬遜AWS此前還公佈稱,有超過5萬名客戶在使用Graviton晶片。

蘋果的搜尋產品採用了Graviton 4和Inferentia 2的雲服務,其機器學習推理工作負載的效率提高了40%以上。蘋果機器學習和AI高級總監伯努瓦·杜賓(Benoit Dupin)在re:Invent 2024演講時表示,蘋果還處於評估Trainium 2晶片的早期階段。目前的測試情況是,在Trainium 2上對其模型進行預訓練,效率將提高50%。

AI創業公司Anthropic更激進。Anthropic聯合創始人兼首席計算官Tom Brown(湯姆·布朗)在re:Invent宣佈了“雷尼爾計畫”(Project Rainier)。該計畫的核心內容是,Anthropic未來將使用一個擁有數十萬枚亞馬遜自研晶片的算力叢集,其晶片數量將是Anthropic現有算力叢集的五倍以上。這將是世界上最大的機器學習算力叢集(詳見《Anthropic將使用數十萬枚亞馬遜自研晶片》)。

亞馬遜近兩年三次參與了Anthropic公司的投資,總投資額高達80億美元。Anthropic的主要競爭對手是微軟投資的AI創業公司OpenAI。Anthropic的Claude系列模型性能極強,是目前市面上幾乎少數可以和OpenAI旗下GPT-4對標的模型(詳見《亞馬遜再出手,向OpenAI最大挑戰者Anthropic追投40億美元》)。

亞馬遜AWS公開資料顯示,Graviton 4、Trainium 2比同規格其他晶片,性價比可提升40%。一位亞馬遜AWS中國區人士向《財經》表示,在亞馬遜AWS的雲服務中,自研晶片通常比同等規格的英特爾、AMD、輝達算力資源售價低10%以上。


02 對晶片市場影響幾何?

亞馬遜AWS並不是唯一一家在自研晶片的雲端運算公司。微軟、Google也在做類似的工作。在中國市場,華為、阿里、騰訊、百度等擁有雲業務的科技公司也在自研晶片。



亞馬遜AWS高級副總裁彼得·德桑蒂斯(Peter DeSantis)認為,亞馬遜AWS每年都進行巨額差異化技術投資,比如自研晶片。這樣做的目的是建成高性能和低成本的基礎設施。

目前,雲廠商是英特爾、AMD、輝達等晶片廠商資料中心業務的重要客戶。雲廠商每使用一枚自研晶片,就會少從晶片廠商採購一枚晶片。這是此消彼長的關係。

一位晶片廠商技術人士對《財經》解釋,雲廠商的自研晶片如果能大規模量產,採購、營運成本會更低。目前亞馬遜AWS、阿里雲的CPU都做到了大規模量產,這有效降低了算力成本。但即使成本更高,為避免受制於人,一些雲廠商也會堅持自研路線。

資料中心晶片市場主要分成CPU晶片、GPU/AI晶片兩部分。GPU/AI晶片市場,輝達處於壟斷地位,市場份額超過90%,暫時受影響較小。但這只是暫時的,雲廠商近兩年為爭奪大模型這個主戰場,大規模採購輝達的AI晶片。它們為此付出了巨額資本支出。因此雲廠商自研AI晶片的動力越來越強。

一位國際雲廠商人士今年11月曾對《財經》表示,雲廠商不可能一直這樣受制於人。那怕成本更高,也要自研AI晶片,減少對輝達的依賴。

CPU晶片市場,雲廠商的自研動作已經取得了實際進展。英特爾、AMD正受到亞馬遜AWS等雲廠商自研晶片的衝擊。

資料中心CPU晶片市場分成x86架構、Arm架構兩大陣營。英特爾、AMD主導了x86架構晶片,但這個格局在鬆動。雲廠商、晶片創業公司自研晶片以Arm架構為主,包括亞馬遜、華為、阿里等公司的自研CPU晶片,都採用了Arm架構。2023年8月,伯恩斯坦研究公司 (Bernstein Research)報告稱,亞馬遜AWS在資料中心中部署了全球50%以上的Arm伺服器晶片。

Arm架構的資料中心晶片佔比正在迅速提升。國際市場調研機構Creative Strategies 2024年10月資料顯示,2023年Arm架構資料中心晶片出貨量佔比約為7.1%,2027年佔比將達到22%。

上述晶片廠商技術人士進一步解釋,現在90%以上的資料中心CPU都是英特爾、AMD提供的,x86晶片短期內地位無法撼動。但是,雲廠商和AI創業公司自研的Arm晶片正在一步步蠶食x86晶片的市場。這個過程雖然很慢,但很可能不可逆。

財報資料顯示,英特爾受伺服器市場周期波動、AMD市場競爭、雲廠商自研晶片等影響,2023年資料中心晶片業務營收155.2億美元,同比下滑19.1%。 (財經雜誌)