性能暴漲400%！英特爾發布5nm最強AI晶片Gaudi 3，輝達危險了嗎？

2024/04/10

•

「牙膏藍廠」終於迎來翻身日。

就在剛剛，北京時間4月9日23點半，美國亞利桑那州Intel Vision 2024會議上，晶片巨頭英特爾（Intel）發布性能最強的新一代Gaudi3 AI 加速晶片，以及全新的下一代英特爾至強6處理器等產品。

其中，英特爾Gaudi 3 AI晶片採用台積電5nm工藝，支援128GB HBMe2內存。相較於上代產品，英特爾Gaudi 3帶來4倍（400%）的BF16 AI運算能力提升，1.5 倍的記憶體頻寬以及2 倍的網路頻寬提升。

同時，在AI模型算力中，相較於輝達H100 GPU，Gaudi3 AI晶片的模型訓練速度、推理速度分別提升40%和50%，平均效能提高50%，能源效率平均提高40%，而成本僅為H100的一小部分。

相較於最新輝達H200，Gaudi3 AI晶片的推理速度竟然也提升30%。堪稱最強AI 晶片。

英特爾預計，Gaudi 3將於2024年第二季起出貨，戴爾、惠普、聯想、超微型電腦等企業將成為首批客戶。

英特爾CEO基辛格（Pat Gelsinger）表示，「創新技術正在以前所未有的速度發展，每家公司都在加速成為AI公司，這一切都需要半導體技術提供支援。從PC到資料中心再到邊緣，英特爾正在讓AI走進千行百業。”

實際上，隨著ChatGPT爆火，AI 模型、數據、算力基礎設施成為生成式AI 技術發展的三大要素。

根據Gartner數據顯示，2024年，企業在生成式AI 方向上預期支出達400億美元，到2027年這項數據增加至1,510億美元。同時，到2026年，企業對生成式AI 使用程度達80%，同時至少有50%的邊緣運算部署將與AI、機器學習（ML）等方向有關。

然而，AI 技術的全部潛力並沒有完全釋放出來。僅10%的企業組織去年推出以生產為導向的生成式AI 方案；同時，有46%的專家指出，基礎設施是將大模型產品化的最大挑戰。

因此，英特爾希望能夠利用長期的AI 技術積累，透過開放生態系統的力量，乘上AI 熱潮。與輝達部分類似，英特爾也將提供一整套AI 算力基礎設施方案，從而「解鎖」企業AI，推動生成式AI 的廣泛應用和快速商業化，有望幫助企業應對AI 項目時所面臨的挑戰。

基辛格在會上表示，到2030年，半導體市場規模將達1兆美元，而AI 是其中的主要動力。

從整體路線圖來看，AI PC、Edge AI（邊緣）、Data Center AI（資料中心）將成為英特爾三大重要的運算生態系統，比輝達覆蓋面積更廣，加上其開放、可擴展的軟體和演算法特性，廣泛適用於多個AI 領域，從而推動英特爾持續為企業客戶打造全新AI 方案。

具體到技術產品層面，此次Intel 產業創新開幕活動上主要公佈五個方向的重要進展：

1、首先是英特爾Gaudi3。新一代Gaudi 3 AI加速器專為高性能、高效率的生成式AI 計算而構建，每個加速器都具有獨特的異構計算引擎，由64 個AI 定制和可編程TPC和8 個MME 組成，每個Gaudi 3 MME 都能夠執行64000個平行運算，支援128 GB HBMe2 記憶體容量、3.7 TB 記憶體頻寬和96 MB 板載靜態隨機存取記憶體(SRAM) 。同時，每個Gaudi 3當中都整合24個200 Gb乙太網路端口，提供靈活且開放標準的網路。而Gaudi 3 的PCIe 功率為600w，頻寬為每秒3.7TB。

英特爾Gaudi 3 AI加速器於今年第二季進行首批供貨，預計將於2024 年第三季全面上市，英特爾Gaudi 3 PCIe 附加卡預計將於2024 年第四季上市。

2.全新英特爾至強6處理器品牌，應用於資料中心、雲端和邊緣場景。

其中，與第二代至強處理器相比，配備能源效率核（先前代號為Sierra Forest）的全新至強6處理器每瓦效能提高2.4倍，機架密度提高2.7倍，客戶能以近3:1的比例替換舊系統，大幅降低能耗，預計將於2024年第二季度推出；而配備性能核的英特爾至強6處理器，可將下一個令牌（token）的延遲時間最多縮短6.5倍，能運行700億參數的Llama2模型，預計不久後推出。

3.預覽下一代英特爾酷睿Ultra處理器。英特爾宣布將推出下一代酷睿Ultra客戶端處理器家族（代號Lunar Lake），將具備超過100 TOPS平台算力，以及在神經網路處理單元（NPU）上帶來超過46 TOPS的算力，從而為下一代AI PC提供強大支援。據悉，英特爾預計2024年出貨4,000萬台AI PC設備。

4、面向網路互連層面的新品部署。與NVLink一樣重要，透過超以太網聯盟（UEC），英特爾公佈以AI高速互聯技術（AI Fabrics）開放技術的乙太網路解決方案，利用高速互聯技術支援AI模型訓練和推理，產品組合包括英特爾AI網絡連接卡（AI NIC）、整合到XPU的AI連接芯粒（Chiplet）、基於Gaudi加速器的系統，以及一系列面向英特爾代工的AI互聯軟硬體參考設計。

5.全面更新的邊緣運算和Tiber業務組合。英特爾也發表新的Edge晶片產品，包括酷睿TM Ultra、酷睿TM、凌動處理器以及面向Edge的英特爾ArcTM GPU，預計所有新品將於本季上市，應用於包括零售、工業製造、醫療保健等關鍵領域，並將於今年獲得英特爾Tiber邊緣平台的支援。另外，英特爾也發表Tiber業務解決方案組合，以簡化企業對生成式AI 軟體服務的部署工作，預計Tiber方案將於今年第三季全面推出。

英特爾揭露，截至目前，英特爾邊緣運算處理器銷量達2億塊，已邊緣部署超過9萬個解決方案。

另外，英特爾也宣布聯合Hugging Face、RedHat、SAP、VMware等15家公司，將共同創建一個開放、多供應商的生成式AI系統平台，透過RAG（檢索增強生成）技術，提供運行大量現存專有資料來源得到增強版開放大模型。

英特爾強調，公司不僅將提供包括硬體、軟體、框架和工具，而且希望設備製造商、資料庫提供者、系統整合商、軟體和服務提供者等參與其中，推動英特爾AI開放生態系統的構建，以及將生成式AI技術進行場景落地。

整體來說，基於英特爾5nm Gaudi 3 AI晶片，以及至強6處理器和軟體棧，該公司正逐步建立AI 領域的算力基礎設施生態，全面挑戰輝達以及現有AI 晶片市場格局。

英特爾方面去年7月對鈦媒體App表示，市場需要替代品。客戶非常歡迎英特爾Gaudi方案在向大眾部署AI 方面發揮重要的領導作用。「幾十年來，英特爾一直致力於把新的技術普及、普惠到各行各業。透過降低進入門檻，提高市場參與度，從而加快創新速度。”

「未來，每一家公司都成為一家AI 公司。」基辛格說。

那麼，前有OpenAI、微軟、亞馬遜“造芯”，後有英特爾“彎道超車”，輝達真的危險了嗎？

黃仁勳前段時間這段話其實表達的非常明確：「資料中心需要你經營它。購買和銷售晶片的人考慮的是晶片價格。營運資料中心的人考慮的是成本，我們總擁有成本（TCO）非常好。即使競爭對手晶片是免費的，他們也不如我們，客戶也不會買。我們的目標是增加更多的價值。但這背後需要很多努力，我們必須不斷創新、我們不能把任何事情視為理所當然、我們有很多競爭對手。”

事實上，AI 晶片是一個不斷向前「奔跑」的高技術產業。它沒有壟斷，只有不斷創新提供更大價值，才有可能讓企業持續保持領先地位。因此，無論是輝達還是英特爾，他們都有非常強大的市場競爭力，也都有望成為AI 加速運算市場的「領導者」。

英特爾強調，未來公司將在AI 浪潮中全力引領創新，為各行各業帶來前所未有的價值。 (鈦媒體AGI)