L3快取容量飆到5.3倍。
芯東西拉斯維加斯12月4日報導,剛剛,在年度雲端運算盛會AWS re:Invent上,全球最大雲端運算巨頭亞馬遜雲科技(AWS)發佈第五代自研伺服器CPU——Graviton5。
Graviton5在單個封裝中整合192個核心,核心數較上一代翻倍,核心架構升級為Neoverse V3,並最佳化了記憶體系統,搭配大容量快取,支援DDR5-8800記憶體,IO系統支援DDR5記憶體,且是亞馬遜雲科技伺服器叢集中首款支援PCIe Gen 6的CPU。
該晶片配備2MB二級快取(L2 Cache);三級快取(L3 Cache)容量達到前代產品的5.3倍,達到192MB,這意味著每個核心能獲得高達2.6倍的三級快取,帶來更優的整體性能和穩定性。
在AWS re:Invent大會期間,亞馬遜雲科技副總裁、傑出工程師Ali Saidi與芯東西等少數媒體進行了深入交流。Saidi告訴芯東西,Graviton5採用3nm製程,已掌握成熟的電壓控制技術,主頻適中,同時通過系統層面的創新最佳化散熱,例如採用裸片冷卻技術,去除CPU頂蓋,減少頂蓋帶來的熱阻,直接在CPU上安裝散熱器,確保核心能夠有效散熱,無需擔心散熱問題。
據Saidi透露,亞馬遜雲科技正與記憶體供應商合作,推動現有產品支援更高頻率,對不同工作負載的測試表明,這是一套平衡的系統,能夠為核心提供充足的記憶體頻寬,同時實現顯著的性能提升。
亞馬遜在2018年發佈了首款Graviton處理器,2019年推出Graviton2,2021年推出Graviton3,2023年發佈Graviton4。每一代產品都力求實現25%~30%的性能提升,Graviton5也不例外——每個核心性能比上一代提升約25%。
亞馬遜雲科技針對多種工作負載進行了測試:在CPU密集型機器學習場景中,Graviton5比Graviton4快32%;在Nginx等負載平衡場景中,速度提升27%;作業類應用速度提升30%至40%;資料庫場景中,不同類型資料庫的性能普遍提升約30%。
亞馬遜雲科技計算與機器學習服務副總裁Dave Brown在演講中分享了一些Graviton5早期客戶的測試資料:Airbnb性能提升高達25%,Atlassian性能提升30%、延遲降低20%,Honeycomb.io延遲降低25%、每核心性能提升36%,SAP的SAP HANA分析查詢性能提升60%。
蘋果雲系統與平台副總裁Payam Mirrashidi也來到現場為AWS Graviton CPU站台。
他分享說,目前,蘋果每天通過運行在亞馬遜雲科技和Graviton上的Swift應用處理數十億次請求。將核心服務用Swift重構並遷移到Graviton後,蘋果實現了40%的性能提升和30%的成本降低。從x86到Graviton的遷移過程極為順暢,幾乎可以直接替代Java環境。蘋果早在十多年前就將移動裝置遷移到Arm架構。
“如今,遷移到基於Arm的Graviton,我們再次收穫了基礎設施效率提升的巨大價值。”Mirrashidi說,“我們迫不及待地想看到大家用AWS Graviton和Swift創造出更多精彩成果。”
據Saidi分享,亞馬遜雲科技與Arm在核心定義方面密切合作:Graviton2採用Neoverse N1核心,Graviton3採用Neoverse V1核心,Graviton4採用Neoverse V2核心,Graviton5採用Neoverse V3核心。每一代都通過與Arm合作,確保核心滿足需求,進而為客戶帶來顯著性能收益。
”Graviton的成功證明,通過授權Arm IP,我們能夠打造出具有行業競爭力的系統。未來,我們將繼續專注於這一模式,持續為客戶創造價值。”Saidi說。
基於Graviton5的M9g實例(預覽版)今日同步發佈,相比M8g實例性能提升高達25%,是目前Amazon EC2中性價比最高的實例。
Saidi在媒體溝通會期間分享說,該實例每核心配備4GB記憶體,將於2026年正式全面可用,後續還將拓展更多實例類型。
以Graviton4為例,亞馬遜雲科技提供的實例最高支援3TB記憶體、190個核心、600Gbps網路頻寬和100TB儲存容量,涵蓋多種實例類型,可滿足客戶各類工作負載需求。
目前Graviton5僅推出一款實例類型,未來將拓展更多選擇。
亞馬遜雲科技公用計算高級副總裁Peter DeSantis在演講中談道,亞馬遜雲科技雲服務的核心屬性包括安全性、可用性、彈性、成本等,亞馬遜雲科技正在大規模投資資料中心、電力和容量建設,以支援AI轉型,同時大力投入降低模型建構和工作負載運行的成本。如今亞馬遜雲科技的晶片系列包括Graviton專用伺服器CPU和Trainium AI訓練晶片等。
亞馬遜雲科技計算與機器學習服務副總裁Dave Brown回顧了亞馬遜雲科技造芯歷程和設計思路的演變。據他分享,Nitro系統改變了人們對雲端運算可能性的認知,證明只要能掌控晶片、硬體和系統架構,就能實現商用硬體無法企及的性能和效率提升。在深入研究Nitro系統的過程中,亞馬遜雲科技自然產生了一個疑問:
“既然定製晶片能同樣改善網路和儲存性能,為什麼不能將其應用於計算領域?”
於是,亞馬遜雲科技重新思考:如果專門為雲工作負載設計一款伺服器處理器 —— 不是適配、不是改造,而是從零開始為雲原生場景打造——會是什麼樣子?
這就是Graviton處理器的由來。
這款全新設計的處理器,核心目標是為客戶在雲中日常運行的工作負載提供最優性價比。
如今,各行各業的企業都在通過Graviton獲得更高性能和更低成本:Adobe將碳排放減少37%,Epic Games借助它支撐全球大規模低延遲遊戲工作負載,F1通過Graviton使模擬運算速度提升40%,Pinterest降低了47%的成本,SAP的雲原生SAP應用性能提升35%。
這些正在運行的生產系統,通過Graviton實現了更快、更環保、更經濟的運行。
其軟體合作夥伴通過最佳化編譯器、改進執行階段、完善庫檔案,並在平台上全面支援Graviton。圍繞Graviton形成的長期架構和行業協作生態還在持續成長和成熟。
要在Amazon EC2中實現最優性價比,需要關注每一個層級。除了提高晶片性能外,這還涉及系統的建構和運行方式。
由於亞馬遜雲科技同時設計處理器和伺服器,它能夠實現全端最佳化,其中就包括客戶不常關注的散熱環節。
大多數處理器採用傳統散熱方案:晶片之上是熱介面材料,然後是保護頂蓋,再覆蓋一層熱介面材料,最後是散熱器。這種方案可靠且易於製造,幾十年來一直是行業標準,但亞馬遜雲科技深入分析後發現,其物理原理存在最佳化空間。
熱傳遞的物理邏輯很簡單:散熱路徑中的每一層都會減緩熱量傳導,阻力越大,結溫越高;而高溫會增加漏電率,漏電率上升又會導致功耗增加,低效問題會迅速累積。
傳統CPU採用這種設計,是因為需要適配多種系統、形態和工具方案,頂蓋能提供穩定的介面。
但由於亞馬遜雲科技掌控著Graviton的整個系統,有機會嘗試不同思路。
因此,它沒有遵循傳統模式,而是設計了 “直接貼合晶片” 的散熱方案:移除頂蓋和對應的熱介面材料,減少熱阻,讓熱量傳導更高效。這需要精密製造和精心選材,但成果顯著——風扇功耗降低了33%。
提升系統效率只是實現卓越性能的一部分,晶片本身必須一代比一代更出色。Graviton的研發是長期且持續迭代的過程:每一代產品都會拓展支援的工作負載類型,而新工作負載的出現會讓亞馬遜雲科技發現新的瓶頸,進而指導下一代產品的研發,形成持續最佳化的循環。
每一款Graviton處理器都基於前代成果,不斷推動架構向前發展。
亞馬遜雲科技針對實際應用性能最佳化Graviton。在Graviton3時代,亞馬遜雲科技發現二級快取(L2 Cache)缺失對實際工作負載性能有明顯影響。
快取是CPU性能最重要的影響因素之一,因此成為其核心最佳化方向。快取的作用是儲存頻繁訪問的資料,若資料不在快取中,處理器就必須訪問主記憶體,速度會慢得多。
現代CPU採用三級快取架構:一級快取(L1)最快但容量最小,二級快取(L2)容量更大但速度稍慢,三級快取(L3)容量最大且為所有核心共享。
如果三級快取都未命中,就必須訪問DRAM,耗時可達100ns。對CPU周期而言,這是很長的時間。
因此,大容量快取至關重要:能將更多資料留在核心附近,減少慢速記憶體訪問。
基於此,Graviton4將每個核心的二級快取容量從1MB翻倍至2MB,這也是其相比Graviton3性能提升高達30%的原因之一。
二級快取擴容顯著降低了二級快取缺失率。
但CPU設計始終需要權衡取捨:Graviton4的核心數增加了15%,三級快取僅增加12%。
這對於當時要支援的縱向擴展工作負載是合適的平衡,但更多核心共享相對少量增加的三級快取,導致每個核心能分配到的三級快取反而減少,進而使三級快取缺失率上升。這就是晶片設計中需要不斷評估的權衡問題。
此外,亞馬遜雲科技還進行了一項重大架構調整:在兩個CPU之間加入一致性鏈路,使其能為資料庫和大型分析工作負載提供最多192個核心。
但鏈路連接會帶來額外開銷:當一個核心需要訪問另一個CPU上的記憶體時,請求必須通過互連鏈路傳輸,增加延遲、協議開銷,有時還會出現排隊,在某些場景下,耗時可能達到原來的3倍。
因此,其團隊思考:能否在單個封裝中實現192個核心,同時讓所有核心都能均勻、快速地訪問記憶體,並配備更大容量的快取?
這就是Graviton5設計的來源。
如今,使用亞馬遜自研伺服器CPU Graviton系列的客戶數量已超過90000家,實現數百萬顆CPU量產。
其中包括前1000名Amazon EC2大客戶中的98%,涵蓋初創企業、大型企業等不同規模的客戶,部分客戶的大部分甚至全部計算工作都運行在Graviton上。這些客戶包括Adobe Analytics、SAP、亞馬遜自身、Stripe、Pinterest、Airbnb等知名企業。
多年來,Graviton一直是Amazon EC2中性價比最高的選擇,讓客戶“以更少成本實現更多價值”。
客戶採用Graviton後,通常有兩種方式轉化性能提升的價值:一種是改善應用延遲,對於延遲敏感型場景,Graviton帶來的更高性能和更低延遲,能直接推動業務成果最佳化;另一種是在保持服務等級協議(SLA)或延遲不變的前提下,提升每秒事務數或請求數。
對於擁有大規模伺服器叢集的客戶而言,如果每個實例的處理能力提升25%,意味著伺服器數量可減少25%,性能提升直接轉化為成本降低。
再加上Graviton本身相比x86產品的成本優勢,客戶能獲得顯著的性價比提升。 (芯東西)