自研Arm CPU,Google全面突圍

Google推出Google Axion,旗下首款專為資料中心設計的Arm處理器。



4月9日,Google發布了Google Axion,這是其首款專為雲端運算和資料中心設計的基於Arm的處理器。 Google在一篇部落格文章中表示,Axion 只是該公司設計自主晶片的最新成果,其歷史可以追溯到2016 年的第一代Tensor 處理單元,這些晶片也是為Google的資料中心製造的。

自2021 年發布Pixel 6 手機以來,Google的Pixel 智慧型手機陣容一直在使用其定制的系統單晶片(SoC),它也被稱為Tensor。 Google聲稱,採用Arm公司Neoverse V2平台的新型Axion晶片的性能將比以前為資料中心製造的基於Arm的CPU提高30%,比目前基於x86設計的晶片提高50%。

Axion以Titanium為基礎,Titanium是一個由專用客製化矽微控制器和分層擴展卸載組成的系統。 Titanium 卸載了網路和安全等平台操作,因此Axion 處理器的容量更大,客戶工作負載的效能也提高了。 Titanium也將儲存I/O處理卸載到Hyperdisk上,這是我們全新的區塊儲存服務,效能與實例大小分離,可即時動態調配。

Google已經在其資料中心使用基於Arm的新一代伺服器,為包括Google地球引擎和YouTube廣告平台在內的許多服務提供動力。 Google表示,"很快"將把這些服務以及其他服務轉移到基於Axion的伺服器上。基於Axion的伺服器將於2024年稍後向Google雲端客戶推出。在此期間,企業可以在Google網站上註冊以深情試用使用Axion晶片的虛擬機器。

人工智慧是當今科技領域最熱門的話題之一,也是各大科技公司競相投入的領域。要訓練出高效能、高智慧的AI模型,不僅需要大量的數據和演算法,還需要強大的運算能力和硬體支援。

在這方面,谷歌一直走在最前面。例如Tensor處理單元(TPU),這些晶片經過最佳化,可以運行其TensorFlow軟體和各種機器學習模型。對Google 來說,透過其在機器學習和TensorFlow軟體開發方面的專業知識和經驗、其大規模的資料中心和雲端基礎設施的經驗,可以有效的在晶片和伺服器市場獲得相應的優勢:

以獲得對其硬體和軟體堆疊的效能、效率和安全性的更多控制。

減少對英特爾和高通等第三方晶片供應商的依賴,避免潛在的供應鏈問題或價格波動。

透過根據其特定需求和用例客製化晶片,實現其產品和服務的更快創新和迭代。

透過使用機器學習和開源工具來自動化和簡化流程,降低晶片設計和製造的成本和複雜性。

谷歌已經成功的自研晶片專案包括:

TPU: Google客製化的人工智慧加速器,可以高速低精準度執行矩陣乘法和卷積運算。 TPU用於訓練和推理大規模神經網絡,例如用於自然語言處理、電腦視覺和推薦系統的神經網路。 TPU可透過谷歌雲端TPU服務供第三方使用,也可作為較小版本出售。

Tensor: Google首款專為Pixel智慧型手機設計的晶片上移動系統(SoC)。 Tensor在現場可編程閘陣列(FPGA)上整合了一個軟神經處理單元(NPU),可以以低延遲和高吞吐量加速深度神經網路推理。 Tensor還具有專用的Transformer引擎,可以解決萬億參數的語言模型。

Hopper: Google基於新GPU架構的下一代人工智慧加速器。 Hopper具有第四代張量核心和FP8精度的Transformer引擎,可以將大型語言模型的速度比上一代提高30倍。 Hopper也支援NVLink交換器系統,可連接最多256個GPU,以加速擴展工作負載。

Skywater: Google的開源項目,為晶片設計者提供設計、驗證、測試和製造自己晶片的軟體工具。 Skywater也提供免費使用Skywater Technology Foundry的130nm製程節點進行原型設計和生產。 Skywater旨在使晶片設計民主化,降低愛好者、學者和新創公司的進入門檻。

目前,Google90%以上的人工智慧訓練工作都在使用這些晶片,TPU支撐了包括搜尋、語音辨識、自然語言處理、圖像辨識等谷歌主要業務。推出新的晶片意味著,谷歌正在追趕亞馬遜和微軟這些雲端領域競爭對手的腳步。亞馬遜和微軟2021年就已經推出ARM架構的CPU,作為提供差異化運算服務的一種方式。 (半導體產業縱橫)