華為成為中國AI算力服務市場第一,張平安:AI晶片發展絕不能只依賴先進製程



7月9日消息,全球調研機構IDC 最新發佈的《中國智算服務市場(2023 下半年)跟蹤》報告顯示,2023下半年,以GPU、FPGA、ASIC等AI專用算力為主的智算整合和AI IaaS服務的中國智算服務市場整體規模達到 114.1 億元人民幣,同比增長 85.8%。

報告指出,在這其中,智算整合服務市場呈現出一超多強的特徵,華為依託其領先的晶片能力及全端服務能力,市場份額領先,前五名還有新華三、百度、寒武紀和中國電子云。




在7月4日舉行的2024世界人工智慧大會產業發展主論壇上,華為常務董事、華為雲CEO張平安表示,AI晶片發展絕不能只依賴最先進的製程技術,如何能通過架構性創新,在中國建構可持續發展的AI算力的基礎設施,以及AI算力技術,則是重中之重。

“AI發展需要依賴資料、演算法和算力,在中國,我們必須要在一個假定情況下來發展我們的AI,那就是我們當前算力是受限的,中國 AI 創新道路到底要怎麼走?第一個我認為,在算力基礎設施上,我們需要考慮在雲、網、端、芯這些架構融合上進行協同創新,通過協同創新來建構 AI 算力基礎。我們不能盲目追求對端側晶片這樣製程這樣的一個期望,不能把AI基礎設施的最後,就只依賴於說我們是不是有最先進製程的AI晶片,如果沒有了,我們就沒辦法在AI上領先,這個觀點在中國我們必須要摒棄掉,我們更多要思考,怎麼把對晶片、端側上 AI 算力需求釋放到雲端,因為在雲端我們可以構築起中國優勢,建構我們網路頻寬。”張平安表示。



張平安表示,在芯端算力上雲方面,華為創新方向是將端側的AI算力需求通過光纖和無線網路釋放到雲上,通過端雲協同獲得無縫的AI算力。通過雲側的算力,讓端側既保持了豐富的功能,又極大地降低了功耗和對晶片的依賴。

具體在網路技術創新方面,華為具備5G-Advanced網路,這是一個面向AI更優的網路,其上下行頻寬相較5G都得到了10倍的增長,時延從10毫秒降低到1毫秒,讓端側算力上雲、端雲算力協同都有了堅實的網路保障。中國豐富的光纖網路,無線5G-A網路,將構築起中國的AI算力網路,構築中國在世界的領先優勢。

在雲基礎設施方面,為此,華為雲發佈了全新的CloudMatrix架構,從算力規模、擴展模式和使用模式上,匹配超大規模算力訴求。同時,基於雲的技術,華為雲對昇騰叢集進行端到端最佳化,千億參數模型在雲上訓練可實現40天無中斷,平均故障恢復時間小於10分鐘,在長期穩定性、故障恢復等方面具備顯著優勢。



華為昇騰在WAIC展台上披露,其昇騰訓練叢集支援100%主流大模型,SOTA大模型全流程開發時間從月級到周級,基礎算子支援度達到100%,而且MindSpore支援動靜統一、多級編譯調優效率提升200%;而大模型推理層面,華為滿足時延<50ms約束,最大可提升6倍吞吐性能。

張平安指出,中國的AI發展道路,追求的應該是在行業領域構築大模型的全球領先地位。如果各行各業都積極擁抱AI,積極的開放行業的業務場景,中國很有機會在To B領域構築起全球的領先優勢。

目前,華為雲正推動大模型技術迭代和落地,今年6月盤古大模型5.0正式發佈,在自動駕駛、工業設計、建築設計、具身智能、數字內容生產、高鐵、鋼鐵、氣象、醫藥等領域,提供了更加豐富的創新應用和落地實踐。張平安透露,以鋼鐵行業為例,目前盤古大模型已經在寶鋼的一條熱軋生產線上線,預測鋼板精度提高5%,每年有望多生產2萬噸鋼板,增收9000多萬元。

張平安在WAIC另一場昇騰論壇致辭中透露,目前華為昇騰生態和大模型創新已在30多個行業、400多個業務場景落地。而生成式AI雲服務上線以來,華為雲已服務超過600多家創新先鋒企業,通過 AI 硬體產品、基礎軟體、雲服務,以及華為全球資料中心和基礎設施的全端創新,加快華為昇騰與行業的深度適配,做好中國 AI 發展的關鍵一環。

“AI浪潮時代到來之際,讓我們共同來建設中國 AI 產業,一起抓住機遇,開啟 AI 新未來。”張平安表示。 (鈦媒體AGI)