「牙膏藍廠」終於迎來翻身日。
就在剛剛,北京時間4月9日23點半,美國亞利桑那州Intel Vision 2024會議上,晶片巨頭英特爾(Intel)發布性能最強的新一代Gaudi3 AI 加速晶片,以及全新的下一代英特爾至強6處理器等產品。
其中,英特爾Gaudi 3 AI晶片採用台積電5nm工藝,支援128GB HBMe2內存。相較於上代產品,英特爾Gaudi 3帶來4倍(400%)的BF16 AI運算能力提升,1.5 倍的記憶體頻寬以及2 倍的網路頻寬提升。
同時,在AI模型算力中,相較於輝達H100 GPU,Gaudi3 AI晶片的模型訓練速度、推理速度分別提升40%和50%,平均效能提高50%,能源效率平均提高40%,而成本僅為H100的一小部分。
相較於最新輝達H200,Gaudi3 AI晶片的推理速度竟然也提升30%。堪稱最強AI 晶片。
英特爾預計,Gaudi 3將於2024年第二季起出貨,戴爾、惠普、聯想、超微型電腦等企業將成為首批客戶。
英特爾CEO基辛格(Pat Gelsinger)表示,「創新技術正在以前所未有的速度發展,每家公司都在加速成為AI公司,這一切都需要半導體技術提供支援。從PC到資料中心再到邊緣,英特爾正在讓AI走進千行百業。”
實際上,隨著ChatGPT爆火,AI 模型、數據、算力基礎設施成為生成式AI 技術發展的三大要素。
根據Gartner數據顯示,2024年,企業在生成式AI 方向上預期支出達400億美元,到2027年這項數據增加至1,510億美元。同時,到2026年,企業對生成式AI 使用程度達80%,同時至少有50%的邊緣運算部署將與AI、機器學習(ML)等方向有關。
然而,AI 技術的全部潛力並沒有完全釋放出來。僅10%的企業組織去年推出以生產為導向的生成式AI 方案;同時,有46%的專家指出,基礎設施是將大模型產品化的最大挑戰。
因此,英特爾希望能夠利用長期的AI 技術積累,透過開放生態系統的力量,乘上AI 熱潮。與輝達部分類似,英特爾也將提供一整套AI 算力基礎設施方案,從而「解鎖」企業AI,推動生成式AI 的廣泛應用和快速商業化,有望幫助企業應對AI 項目時所面臨的挑戰。
基辛格在會上表示,到2030年,半導體市場規模將達1兆美元,而AI 是其中的主要動力。
從整體路線圖來看,AI PC、Edge AI(邊緣)、Data Center AI(資料中心)將成為英特爾三大重要的運算生態系統,比輝達覆蓋面積更廣,加上其開放、可擴展的軟體和演算法特性,廣泛適用於多個AI 領域,從而推動英特爾持續為企業客戶打造全新AI 方案。
具體到技術產品層面,此次Intel 產業創新開幕活動上主要公佈五個方向的重要進展:
1、首先是英特爾Gaudi3。新一代Gaudi 3 AI加速器專為高性能、高效率的生成式AI 計算而構建,每個加速器都具有獨特的異構計算引擎,由64 個AI 定制和可編程TPC和8 個MME 組成,每個Gaudi 3 MME 都能夠執行64000個平行運算,支援128 GB HBMe2 記憶體容量、3.7 TB 記憶體頻寬和96 MB 板載靜態隨機存取記憶體(SRAM) 。同時,每個Gaudi 3當中都整合24個200 Gb乙太網路端口,提供靈活且開放標準的網路。而Gaudi 3 的PCIe 功率為600w,頻寬為每秒3.7TB。
英特爾Gaudi 3 AI加速器於今年第二季進行首批供貨,預計將於2024 年第三季全面上市,英特爾Gaudi 3 PCIe 附加卡預計將於2024 年第四季上市。
2.全新英特爾至強6處理器品牌,應用於資料中心、雲端和邊緣場景。
其中,與第二代至強處理器相比,配備能源效率核(先前代號為Sierra Forest)的全新至強6處理器每瓦效能提高2.4倍,機架密度提高2.7倍,客戶能以近3:1的比例替換舊系統,大幅降低能耗,預計將於2024年第二季度推出;而配備性能核的英特爾至強6處理器,可將下一個令牌(token)的延遲時間最多縮短6.5倍,能運行700億參數的Llama2模型,預計不久後推出。
3.預覽下一代英特爾酷睿Ultra處理器。英特爾宣布將推出下一代酷睿Ultra客戶端處理器家族(代號Lunar Lake),將具備超過100 TOPS平台算力,以及在神經網路處理單元(NPU)上帶來超過46 TOPS的算力,從而為下一代AI PC提供強大支援。據悉,英特爾預計2024年出貨4,000萬台AI PC設備。
4、面向網路互連層面的新品部署。與NVLink一樣重要,透過超以太網聯盟(UEC),英特爾公佈以AI高速互聯技術(AI Fabrics)開放技術的乙太網路解決方案,利用高速互聯技術支援AI模型訓練和推理,產品組合包括英特爾AI網絡連接卡(AI NIC)、整合到XPU的AI連接芯粒(Chiplet)、基於Gaudi加速器的系統,以及一系列面向英特爾代工的AI互聯軟硬體參考設計。
5.全面更新的邊緣運算和Tiber業務組合。英特爾也發表新的Edge晶片產品,包括酷睿TM Ultra、酷睿TM、凌動處理器以及面向Edge的英特爾ArcTM GPU,預計所有新品將於本季上市,應用於包括零售、工業製造、醫療保健等關鍵領域,並將於今年獲得英特爾Tiber邊緣平台的支援。另外,英特爾也發表Tiber業務解決方案組合,以簡化企業對生成式AI 軟體服務的部署工作,預計Tiber方案將於今年第三季全面推出。
英特爾揭露,截至目前,英特爾邊緣運算處理器銷量達2億塊,已邊緣部署超過9萬個解決方案。
另外,英特爾也宣布聯合Hugging Face、RedHat、SAP、VMware等15家公司,將共同創建一個開放、多供應商的生成式AI系統平台,透過RAG(檢索增強生成)技術,提供運行大量現存專有資料來源得到增強版開放大模型。
英特爾強調,公司不僅將提供包括硬體、軟體、框架和工具,而且希望設備製造商、資料庫提供者、系統整合商、軟體和服務提供者等參與其中,推動英特爾AI開放生態系統的構建,以及將生成式AI技術進行場景落地。
整體來說,基於英特爾5nm Gaudi 3 AI晶片,以及至強6處理器和軟體棧,該公司正逐步建立AI 領域的算力基礎設施生態,全面挑戰輝達以及現有AI 晶片市場格局。
英特爾方面去年7月對鈦媒體App表示,市場需要替代品。客戶非常歡迎英特爾Gaudi方案在向大眾部署AI 方面發揮重要的領導作用。「幾十年來,英特爾一直致力於把新的技術普及、普惠到各行各業。透過降低進入門檻,提高市場參與度,從而加快創新速度。”
「未來,每一家公司都成為一家AI 公司。」基辛格說。
那麼,前有OpenAI、微軟、亞馬遜“造芯”,後有英特爾“彎道超車”,輝達真的危險了嗎?
黃仁勳前段時間這段話其實表達的非常明確:「資料中心需要你經營它。購買和銷售晶片的人考慮的是晶片價格。營運資料中心的人考慮的是成本,我們總擁有成本(TCO)非常好。即使競爭對手晶片是免費的,他們也不如我們,客戶也不會買。我們的目標是增加更多的價值。但這背後需要很多努力,我們必須不斷創新、我們不能把任何事情視為理所當然、我們有很多競爭對手。”
事實上,AI 晶片是一個不斷向前「奔跑」的高技術產業。它沒有壟斷,只有不斷創新提供更大價值,才有可能讓企業持續保持領先地位。因此,無論是輝達還是英特爾,他們都有非常強大的市場競爭力,也都有望成為AI 加速運算市場的「領導者」。
英特爾強調,未來公司將在AI 浪潮中全力引領創新,為各行各業帶來前所未有的價值。 (鈦媒體AGI)