AI晶片大戰升級!亞馬遜推出首款3nmAI晶片Trainium 3,挑戰輝達、Google

年底,AI晶片領域的競爭愈發激烈。繼11月,Google發佈自研TPU,引發市場廣泛關注,輝達隨即入股新思科技加碼推廣自身GPU後,亞馬遜剛發佈的新產品,也很有可能成為攪動市場的另一極。

美國時間12月2日,在拉斯維加斯舉辦的亞馬遜雲科技re:Invent全球大會上,亞馬遜正式推出了新一代自研AI晶片Trainium 3。這是亞馬遜首款3nm製程的AI晶片,由台積電代工生產。

圖片來源:unsplash

根據亞馬遜AWS首席執行官馬特·加曼(Matt Garman)的介紹,Trainium 3的計算能力較之Trainium 2大幅提升,是在當前的人工智慧浪潮中,專為滿足下一代生成式AI工作負載的高性能需求而設計打造的,能夠幫助客戶更快地建立更大的模型,並在部署模型時提供卓越的效能。

AWS方面同時拿出了整合144顆新一代晶片的Trainium3 UltraServer伺服器。該公司給出的資料顯示,新伺服器的計算能力是上一代產品的4.4倍,記憶體頻寬是上一代產品的4倍,能夠將能效提升40%,同時大幅提高了產品部署能力上限,通過伺服器之間的互聯互通,最多能部署多達百萬顆Trainium 3晶片,將此前的天花板提高了10倍。

從AWS披露的資料來看,Trainium 3的產品性能是更新換代等級的存在,但市場更關注的,還是其與佔據絕對主導地位的輝達和正在崛起的Google之間的比較。

不過,AWS方面拒絕直接就其新一代晶片的性能與輝達、Google進行對比,沒有提供太多相關資訊。

Barron's等提到,從記憶體來看,每顆Trainium 3整合了144GB高頻寬記憶體,而Google最新TPU是192GB,輝達最新的Blackwell GB30更是高達288GB,同時,性能更強的輝達超級新品Rubin也即將走向市場。

從這方面來看,目前幾大巨頭之間的晶片在性能上仍有明顯差距。

科技媒體IMPLICATOR.ai撰文指出,與輝達的GPU不同,亞馬遜的Trainium晶片是專為在AWS雲服務中訓練和運行大模型而設計的定製化AI晶片,會針對AWS的雲基礎設施和Bedrock平台進行針對性最佳化。

AWS也在官方新聞中,著重強調了專用晶片的“性價比優勢”,稱與同等GPU系統相比,Trainium在相關場景中可以將訓練和推理成本降低50%。

實際上,Google的TPU是專為加速機器學習和深度學習任務而設計的。輝達在這些競爭者冒頭時曾發聲表示,公司的產品領先業界一代,是唯一能夠運行所有AI模型並應用於計算場景的平台。

與專為特定AI框架或功能設計的產品相比,輝達晶片提供了更高的性能、多功能性和可互換性。

就在亞馬遜發佈新品的同一時間,輝達首席財務官科萊特·克雷斯(Colette Kress)在瑞銀全球技術與AI大會上表示,其他晶片競品絕無可能動搖輝達的地位。

她還表示,輝達的護城河不只晶片,而是標準和生態,所有模型都運行在輝達的平台上,市場地位非常穩固。

不過,相較於競爭關係,亞馬遜與輝達的合作同樣值得關注。

大會期間,AWS與輝達共同宣佈,前者將在下一代晶片Trainium 4中使用後者的NVLink Fusion技術。

該技術能夠實現不同類型晶片之間的高速連接,以及不同伺服器之間的快速通訊。晶片領域的頭部企業英特爾、高通都是使用者。

通過引入該技術,AWS得以建構規模更大、適用性更強的AI伺服器,進一步提高互聯互通能力,再次推高部署能力的上限,幫助客戶更好地訓練大模型。

IMPLICATOR.ai的文章分析稱,相較於“打不過就加入”,AWS引入輝達技術更類似一種引流策略,在無法快速實現晶片替代的情況下,這種合作能夠幫助那些依賴輝達工作負載的企業更輕鬆地逐步遷移到Trainium基礎設施中。

輝達CEO黃仁勳則表示,輝達和AWS將攜手打造AI產業革命的計算架構,加速世界邁向智能化的道路。

令人好奇的是,誰成為亞馬遜新AI晶片第一批擁躉?

亞馬遜強調,新一代的晶片和伺服器都是為了讓雲服務客戶能以更低成本享受更好的服務,訓練出質量更高的大模型來實現自身的AI雄心。

事實上,除了自用外,Trainium 3目前的市場前景仍然成疑。

以往,Trainium的主要客戶是Anthropic、理光(Ricoh)等公司,使用者基礎本就不多。其中,Anthropic一直是最大客戶。實際上,AWS方面此前就曾表示,計畫在今年底之前向Anthropic提供100萬個Trainium晶片。

摩根大通分析師道格・安穆斯(Doug Anmuth)稱,考慮到亞馬遜對Anthropic的投資及兩者歷來的緊密關係,Trainium最新晶片預計仍會首先供應這家打造出了Claude的公司。

未來,只要電力等供應充足,AWS可以在新的伺服器上複製為Anthropic打造的架構,吸引其他大型客戶,讓自己的晶片被更廣泛地使用。

不過,就算是Anthropic,這家公司對晶片也有多種選擇。除了輝達的主流產品,該公司去年還曾表示與Google達成協議,將採購後者100萬顆TPU晶片。

另外,在今年的re:Invent大會中,AWS還發佈了包括推理模型、語音模型、純文字模型在內的Nova 2系列模型,並推出了“開放式訓練”服務Nova Forge,允許使用者在訓練的各階段注入自己的資料,支援更多行業為特定知識定製大模型,同時通過Nova Act進軍代理服務市場,幫助使用者建構自動化網頁操作智能體。

從基礎設施、自研晶片,再到大模型、代理服務,這家雲服務巨頭已癒發凸顯出全面押注AI垂直一體化的趨勢。

而資本市場還無法明確判斷該公司相關戰略的前景。12月2日亞馬遜股價收盤微漲0.23%,今年以來漲幅為6.85%,在“美股科技七巨頭”中與特斯拉相近,低於其他公司。 (鈦媒體AGI)