華為高管近期罕見公佈昇騰 AI 算力的性能情況。
鈦媒體App 6月17日消息,近期舉行的2024世界半導體大會暨南京國際半導體博覽會的一場分論壇上,江蘇鯤鵬·昇騰生態創新中心首席營運官王陶透露,昇騰叢集是國內唯一已完成訓練千億參數大模型的技術路線,其 AI 算力性能已經超過了輝達A100。
王陶表示,中國大模型裡面,有近50%(1/2)選擇了昇騰技術路線。與輝達A100相比,昇騰 AI 晶片在訓練效率層面最高是輝達的1.1倍,尤其在訓練Meta Llama、BloomGPT等模型上,昇騰 AI 算力訓練效率大大優於輝達A100,甚至10倍領先其他國產友商。
“經過三年的實驗檢驗,中國大模型總數的1/2選擇的昇騰技術路線。昇騰現在已經是國產化大模型的第一選擇。而我們經過測試,網際網路頭部廠商科大訊飛也用了華為的萬卡叢集,跟輝達A100的相比,我們能達到A100的0.8~1.2倍的效率,在跟輝達相比(指0.8倍)的確還是有一定的差距,但是在大模型訓練這一塊,(我們)跟輝達A100晶片相比已經沒有明顯差距,特別是在萬卡算力叢集,包括在鯤鵬雲腦、科大訊飛這一塊都經過了市場檢驗。”王陶稱。
這是華為高管非常罕見的回應昇騰 AI 算力性能與輝達A100之間的優勢。
據悉,昇騰和鯤鵬分別是華為面向通用計算和智能計算的兩款算力產品,是華為 AI 計算生態裡面的關鍵技術系列。
公開資訊顯示,江蘇鯤鵬·昇騰生態創新中心成立於2019年8月,是南京江北新區與華為聯合宣佈發展鯤鵬計算產業後成立的創新機構。王陶稱,創新中心的使命就是基於華為的鯤鵬、昇騰技術,聯合生態夥伴賦能千行百業進行數位化轉型。
實際上,華為從2018年開始大規模投入 AI 算力和模型:
王陶指出,基於華為自研的 AI 算力,從底層的Atlas 硬體到算子庫,再到上層的開發工具鏈,昇騰在大模型推理、訓練兩個方面均提供一整套解決方案,包括開髮套件、基礎加速庫等。而在開發速度上,基於昇騰方案,客戶大大縮短開發週期,在典型場景下推理性能提高1.5-3倍,實現更強的業務協同。
算力層面,目前,華為在全國20多個城市建設昇騰人工智慧計算中心,超過2500PFlops(每秒運算能力為2500千萬億次)普惠Al算力。
據悉,國內上線及試營運的計算中心城市包括深圳、武漢、西安、許昌、南京、 成都、杭州、瀋陽、重慶、天津、寧波、廣州、青島、北京、大連、上海、無錫、福州、合肥;待上線城市包括昆明、長沙、廊坊、南寧、貴陽、 長春、南昌、濟南。
華為透露,其智算叢集使用率超過90%。其中在南京,昇騰算力共有140P,使用率93%;武漢擁有200P,使用率95%+;深圳的算力使用率超過99%;成都 98%;杭州 80%;瀋陽 98%。
而目前,包括騰訊、百度在內的中國科技巨頭以及科大訊飛等領先的初創公司都購買了910B。
華為公司昇騰計算業務總裁張迪煊上個月透露,昇騰生態系統擁有40個硬體合作夥伴、超過1600個軟體合作夥伴和超過2900個 AI 應用解決方案。
王陶則透露,華為鯤鵬在全國有5100+合作夥伴,15800+解決方案,擁有開發者超過310萬。
王陶強調,目前全球AI算力需求在加速,大算力支撐大模型,促進人工智慧走向新階段。而華為堅持硬體開放、軟體開源、使能夥伴、發展人才,推動生態蓬勃向上。 (鈦媒體AGI)