賭城豪賭!亞馬遜“All in”自研晶片,招招刺向輝達軟肋:表面喊著合作,背後全是“算計”



(本圖片由AI生成)

本周的拉斯維加斯,金錢永不眠,但真正的豪賭不在賭場,而在AWS的發佈會現場。

當眾多開發者湧入re:Invent大會時,雲端運算霸主亞馬遜終於不再沉默。面對輝達的步步緊逼,它直接將籌碼推向了桌子中心:All in自研晶片。

亞馬遜先是用一張Trainium3鎮住全場:性能飆升4倍,成本直接腰斬一半;緊接著,它又亮出了袖中的“底牌” Trainium4,FP4吞吐量暴漲6倍、記憶體頻寬提升4倍,招招直指輝達的軟肋。

這一次,亞馬遜不再甘心做一個“賣鏟子”的中間商。這場關於算力控制權的戰爭,亞馬遜已經不想再忍了。

與此同時,全新的Nova模型家族和“模型鍛造”工坊更顯示出亞馬遜試圖在AI時代重塑“雲端霸權”的野心。

這不只是一次產品發佈,這是亞馬遜對輝達“稅收”的抗爭,也是對Google和微軟等雲服務商發起的大規模反擊。

矽谷出租屋裡的歡呼:

輝達GPU不再是唯一選擇

故事的開始,發生在一個看似不起眼的矽谷出租屋裡。

那裡聚集著AI視訊初創公司Decart的幾十名工程師。這是一家剛剛融資1億美元、估值高達31億美元的新晉獨角獸企業。但此時正陷入一場絕望的程式碼馬拉松:他們試圖訓練一款名為“Lucy”的AI視訊生成應用,目標是實現即時渲染,沒有任何卡頓。

在嘗試了輝達GPU等多款競品晶片後,結果都不怎麼樣。Decart聯合創始人迪恩·萊特斯多夫(Dean Leitersdorf)回憶道:“在突破之前,我們只能生成1.5到2秒的視訊,然後螢幕上的畫面就變成了一團噪點。模型運行越來越亂,一切都會模糊。”

直至AWS向他們提供了尚在保密階段的自研AI訓練晶片Trainium3。

那是馬拉松程式設計的兩周後,所有人都身心俱疲。萊特斯多夫正在打Zoom電話,突然聽到身後傳來瘋狂的歡呼聲。“那一刻,我看到四個人興奮地跳上跳下,”萊特斯多夫說,“Trainium3讓我們運行了更龐大、更聰明的模型,而且不會崩潰。”

Decart的實測資料顯示,Trainium3生成的視訊影格率是其他晶片的4倍。

這一幕極具象徵意義。長期以來,輝達GPU是AI行業的硬通貨,是不可踰越的護城河。但現在,缺口被撕開了。

亞馬遜在周二正式宣佈Trainium3開始上市銷售,採用3奈米工藝,由AWS旗下的Annapurna Labs設計。官方資料顯示,相比同等GPU系統,Trainium3能將AI模型的訓練和運行成本降低高達50%。

(本圖片由AI生成)

在這個算力成本決定生死的時代,“50% 的成本削減”對任何一家AI公司來說,都是無法拒絕的誘惑。

AWS Trainium晶片首席架構師羅恩·迪亞曼特(Ron Diamant)直言不諱地表示:“歸根結底,主要優勢就是性價比。”

會上,亞馬遜AWS宣佈已擁有包括Anthropic、Karakuri、Metagenomi、Neto.ai、理光和Splash Music在內的穩定客戶群。

此外,亞馬遜發佈了計算叢集Trainium3 UltraServer,每個UltraServer可容納144顆Trainium3晶片。更誇張的是,這些伺服器可以連接起來,為單個應用提供高達100萬顆晶片的算力支援。這是上一代系統規模的10倍。

在能源消耗日益成為資料中心噩夢的當下,AWS宣稱新系統的能效比上一代提高40%。 這對於那些正為“天文數字”般電費帳單發愁的AI巨頭們來說,無疑是另一劑強心針。

“特洛伊木馬”:

亞馬遜的陽謀

如果說Trainium3是正面強攻,那麼亞馬遜對下一代晶片Trainium4的預告,則是一記精妙的“側翼包抄”。

眾所周知,輝達最深的護城河不僅是GPU,更是NVLink互連技術和CUDA生態。為了打破這一壟斷,亞馬遜AWS祭出了一招“以夷制夷”。

AWS在大會上透露,正在研發中的Trainium4將支援輝達的NVLink Fusion高速互連技術。

這意味著,客戶可以在AWS的機房裡,混用亞馬遜的自研晶片與輝達GPU。亞馬遜似乎拋出了這樣的橄欖枝:“你不需要立刻拋棄輝達,而是可以把它們連在一起用。但你會發現用我的晶片更便宜、更高效。”

這是一種典型的“特洛伊木馬”策略。通過相容對手標準,降低客戶的遷移門檻,然後用極致的性價比慢慢蠶食市場份額。

(本圖片由AI生成)

迪亞曼特在接受採訪時表現得十分“謙遜”。他說:“我不認為我們是在試圖取代輝達。”一再強調是要給客戶更多選擇。

但市場反應很誠實。當Meta開始與Google商談購買TPU晶片、OpenAI與博通合作開發晶片的消息傳出,再加上亞馬遜的這一記重拳,輝達股價應聲波動。

儘管輝達曾在社交平台X上強硬回擊稱自己“領先行業整整一代”,是唯一能運行所有AI模型的平台,但不可否認的是,“去輝達化”正在成為矽谷巨頭們心照不宣的共識。

即便像Anthropic這種接受輝達100億美元投資的盟友,在AWS的誘惑面前也表現出了“渣男”的一面。AWS透露,Anthropic正在使用超過100萬顆Trainium2晶片建構Claude模型。

Nova模型與“代工廠”模式:

不僅僅是賣雲服務

如果硬體層面比拚的是“省錢”,那麼軟體和模型層面的競爭則是“奪權”。

亞馬遜一直被詬病在生成式AI大模型方面“趕了個晚集”,落後於OpenAI的GPT和Google的Gemini。但這次,AWS CEO馬特·加曼(Matt Garman)顯然想通過“實用主義”彎道超車。

全新的Nova模型家族周二悉數亮相:

——Nova Pro與Nova Lite: 對標GPT-5和Gemini 3.0等等級的強力模型。

——Nova Sonic: 即時語音模型。

——Nova Omni: 能夠像人一樣處理音訊、視訊、圖像和文字的多模態推理模型。

亞馬遜宣稱,Nova 2 Pro在各項基準測試中匹配甚至超越了OpenAI和Google的旗艦模型。

亞馬遜特別提到,該模型在執行複雜指令和電腦操作等智能體任務方面表現突出。較小的Nova 2 Lite模型則在多項基準測試中與Claude 4.5 Haiku、GPT-5 Mini和Gemini Flash 2.5性能相當。

但真正的殺手鐧並非模型本身,而是名為Nova Forge的新工具。

這一工具允許企業客戶在模型“預訓練”階段就匯入自己的資料。這與目前市面上常見的“微調”(Fine-tuning)截然不同。微調只是在成品模型上修修補補,限制了調優空間;而Nova Forge是讓客戶參與到地基澆築中。

亞馬遜AI業務負責人羅希特·普拉薩德(Rohit Prasad)在發佈前接受採訪時表示:“每個企業都需要精通自身業務領域的前沿模型。”他透露,Nova Forge的技術最初是為Alexa等內部團隊開發的,“這本質上是全新的開放式訓練範式”。

Reddit就成為了第一個吃螃蟹的人。

(本圖片由AI生成)

Reddit首席技術官克里斯·斯洛維(Chris Slowe)表示,傳統的微調根本不管用,因為大多數通用模型被設計得過於“嚴格”,會拒絕分析Reddit上某些具有爭議或攻擊性的內容。但通過Nova Forge,Reddit將自家龐大語料庫注入模型底層,訓練出了一個真正的“Reddit專家”。

“其他大語言模型只是從概念上理解Reddit,而我們的模型真正懂其中的‘黑話’。”斯洛維說。

這正是亞馬遜的精明之處。它沒有選擇用一個通用的超級ChatGPT來統治世界,而是通過Nova Forge,讓每一家公司都能以更低成本擁有一個屬於自己的“前沿模型”, 無論是Reddit、索尼還是Booking.com。

“授人以漁”的策略,或許正是亞馬遜在AI時代差異化競爭的關鍵。

AWS CEO的冷靜思考:

拒絕泡沫,擁抱實效

在AI淘金熱中,AWS CEO加曼的態度顯得異常冷靜。

在大會前的專訪中,加曼毫不避諱地談到了他對所謂“AI泡沫”的看法。

“當人們談論泡沫時,我認為風險最大的是那些交易,”加曼直言那些雖然沒有大規模應用、甚至沒有寫出多少程式碼,卻獲得數十億美元融資的初創公司,“一家沒有程式碼的初創公司估值能有30億美元?也許吧,但也可能不是。這些才是大問號。”

加曼的賭注不在於製造下一個ChatGPT,而在於將AI變成一種像水電一樣廉價、可靠的基礎設施。

他更看重AI的實際效能,並舉了亞馬遜內部案例:AWS一個團隊最近對內部程式碼庫進行了大規模重寫。按照傳統估算,這需要30個人工作18個月。但在AI智能體的輔助下,僅僅6個人只用71天就完成了任務。

這種效率的提升是實實在在的,而不是資本講的故事。

當然,挑戰依然存在。雖然亞馬遜在上一季度交出了超預期財報,但Google和微軟憑藉Gemini、OpenAI ChatGPT等明星AI,依然在快速蠶食市場份額。此外,亞馬遜內部激進的AI轉型也引發了陣痛,包括10月份宣佈的裁員計畫以及部分員工對AI環境影響的擔憂,都是加曼必須面對的難題。

結語:

巨人的反擊

很長一段時間裡,亞馬遜在AI領域給人的印象是“沉睡的巨人”。微軟深度繫結了OpenAI,Google擁有DeepMind,而AWS似乎還在靠著老舊的雲服務模式慣性滑行。

但re:Invent 2025徹底粉碎了這種印象。

亞馬遜正在建構一個嚴密的戰略包圍圈:

(本圖片由AI生成)
  • 底層: 用Trainium晶片打破輝達的價格壟斷,用更低能耗解決資料中心的電力焦慮。
  • 中層: 用Nova Forge打破通用大模型的壟斷,讓企業擁有定製化模型的主權。
  • 頂層: 用Bedrock和智能體平台,將AI嵌入到每一個具體的應用開發中。

正如加曼所說:“兩年前,人們在建構AI應用;現在,人們在建構內建AI的應用。”

這不再是關於誰的模型能寫出更優美的詩歌,而是關於誰能讓AI以更低成本、更可控方式,真正流淌進商業的各處毛細血管裡。

輝達的股價或許還會繼續走高,OpenAI的發佈會或許依然吸睛,但亞馬遜已經把戰場拉回了它最擅長的領域:規模、成本與效率。

在這場沒有硝煙的戰爭中,亞馬遜不想做那個最亮眼的公司,它只想做那個笑到最後、賺走每一分基礎設施利潤的公司。對於黃仁勳和奧特曼來說,真正的麻煩可能才剛剛開始。 (網易科技)