華為兌現了六年前吹過的“牛”



華為一以貫之做“黑土地”,無論在哪個時代,都去做孕育應用誕生的tech of tech。


安徽蕪湖,成了中國大模型產業乃至AI產業的關注焦點。

這裡並非是資料中心傳統意義上的集聚地,如今成為全國十巨量資料中心叢集之一、國家「東數西算」的重要節點,三大營運商、華為、中科曙光、字節跳動等15個龍頭企業資料中心項目落子叢集起步區。

6月14日,華為雲華東(蕪湖)資料中心成為該叢集首個開服的項目,自然受到了額外的關注。

一方面,這是在東數西算和大模型背景下,觀測蕪湖乃至中國智算產業的一個絕佳窗口;另一方面,安徽蕪湖與貴州貴安、內蒙古烏蘭察布三宏量資料中心,是華為最高規格、最大規模、最新技術的資料中心,構成了華為雲的算力「鐵三角」。

有心者可能還記得一個時間點,2018年,華為輪值董事長徐直軍首次發佈華為AI戰略與全端全場景AI解決方案,其中包括全球首個覆蓋全場景人工智慧的華為Ascend(升騰)系列晶片以及基於華為Ascend(升騰)系列晶片的產品和雲服務。

當時大模型還遙遙無期,華為的AI戰略不可謂不超前,而且華為沒有把人工智慧定位為新業務,更多定位為一種使能技術,用全端全場景的能力,支撐所有企業探索人工智慧。

全場景,指包括公有雲、私有雲、各種邊緣計算、物聯網產業終端以及消費類終端等部署環境;全端是技術功能視角,指包括晶片、晶片使能、訓練和推理框架和應用使能在內的全堆疊方案。

如果按照正常的產業發展方向,華為本該早已完成AI全端戰略佈局。但是2019年的“制裁事件”,打亂了華為所有的節奏,也給國內算力產業敲響了警鐘。

產業內外一度懷疑,華為還能不能活下來,AI戰略似乎也難以實現。



華為雲蕪湖資料中心開服的意義遠超一個資料中心本身,它標誌著華為雲全國存算網雲核心樞紐佈局全面完成,繼而成為華為AI全端能力的錨點,也在宣告-華為六年前吹過的“牛”,正在一步步兌現。


通用目的技術,缺失的一環

技術進步是經濟成長的源泉,而長期的經濟成長是由少數幾種關鍵技術所推動的,經濟學家稱之為「通用目的技術」 ,蒸汽機、電力、內燃機和數位技術,就是四種最典型、最重要的通用目的技術。

不同於先前蒸汽機驅動了第一次工業革命,單一技術的作用更大,有學者認為,數位技術曾以電腦和網際網路為典型代表,目前已從過去的單點突破進入多技術協同推進、群體性演變的爆發期,呈現擴散速度加快、迭代周期縮短的特性。

前幾年雲端運算與巨量資料、物聯網等技術如火如荼,在現今的人工智慧面前卻遜色不少,說明即便同屬於通用目的技術,也有主次之分。

華為早有預判:人工智慧是一組技術集合,是一種新的通用目的技術,不僅可以使我們以更高的效率解決已解決的問題,還可以解決許多沒有解決的問題。

其中值得思考的是,華為並沒有將雲端運算、巨量資料、物聯網等技術視作通用目的技術,而是置於人工智慧的技術集合中。


圖片系AI生成


根據技術代差遞補性(Technical Generation Complementary)理論,當一項具有代差的全新技術出現時,由於它本身的不完備性,往往需要現有技術作為其補充,與之形成在技術上的「高低搭配”,因此新技術並不能夠完全取代現有技術而主宰整個市場。

例如,固定電話的出現並沒有立刻導致電報的出局,但行動電話的出現卻直接將電報三振出局;再如五代戰機與四代戰機形成高低搭配,淘汰三代機等。

這也啟示我們,人工智慧是新的代差技術,雲端運算等則是承載人工智慧的底座,當人工智慧與現有技術形成高低搭配的全端組合,它的價值才能徹底釋放。

雖然如何供應大模型算力,業界目前尚未統一,有私有雲、公有雲等多種方式,但最終都在走向雲端運算的技術架構,例如全球多地、多活、多架構,離線線上混布、容器化部署等。

海外公有雲和AI也在趨近,典型如OpenAI和微軟,AWS和一眾大模型創企,都說明了雲端運算成為補足AI技術代差的關鍵,中國市場的特殊之處,就是缺失了晶片層。

每一次通用目的技術的發展,舊有巨頭總會面臨淘汰危局,新的明星企業總會異軍突起,越早轉身,越早抓住機會的企業,才能收集到儘可能多的籌碼。然而,當這些企業準備轟轟烈烈擁抱新時代時,有一重問題難以避開,和華為6年前AI戰略轉型相似,在人工智慧的技術集合中,由於海外封鎖原因,導致中國企業更難獲得底層關鍵的算力。

科大訊飛董事長劉慶峰就提到,關鍵問題是算力能不能頂上,我們特別需要更大規模的國產算力支撐,還好有華為公司,能夠在真正的硬科技算力層面上解決給世界第二種選擇。現在業界能夠量產做大模型訓練除了輝達只有華為一家,在推理上已經做到完全對標輝達。

雲和AI的關係近似電和電機、魚和水,水大魚大,更大的發電廠才有豐富多樣的電器。與此同時,雲端運算從定義IaaS往下已經延伸到了晶片指令集,如果哪家公有雲巨頭沒有深入到晶片側,則意味著在智慧時代即將出局。

沒有算力根技術的基礎設施,智慧便無法發展。由此雲運算被硬生劃分為兩個階段,以x86為主的通算雲,和以NPU、GPU為主的智算雲,所有的一切都在重構。


重新定義大模型時代的資料中心

資料中心是AI全端技術的重要一環,自然也處於重構當中。資料中心向下納管數以十萬計的伺服器,計算、儲存和網路共同構成龐大的計算群集,支撐AI大模型的訓練等任務;

向上將算力服務化,以雲端運算的形式對外輸出給千行百業,讓企業不必擔心基礎設施底座,只需要專注於自己的核心業務,實現AI戰略轉型。

根據Scaling Law原理,隨著模型規模的增加,包括參數數量、資料規模和計算資源,模型的效能也會相應提高,這也是為何單體資料中心的規模越做越大,企業需要的單一算力叢集規模也越來越大。

因此,具備更大規模效應的公共算力中心,才是解決算力緊缺問題的最佳方案,“算力的盡頭是上雲”,而具備自主可控晶片的升騰雲服務,則是企業所需雲算力的最佳方案。

如果說先前的資料中心產業格局,更多是政府規範下的市場自然演進,先有需求再有建設,那麼,「東數西算」就是在國家頂層規劃下,算力產業資源與生態的協調再分配。不僅要解決當下的算力需求,也要考慮未來產業如何發展。

2022年2月,「東數西算」工程正式全面啟動,如今火熱的大模型,在2022年底才掀起了新一輪的算力熱潮,東數西算工程適度超前建設的思路,在大模型領域有了直觀的效果。


圖片來自網路


面對大模型時代的資料中心,也要遵循Scaling Law的指引,華為雲華東(蕪湖)資料中心率先打了個樣。

華為雲華東(蕪湖)資料中心的建設規格與以往有很大不同,依照Uptime Tier3、國標A級標準設計,每個園區總體規劃多棟DC+1棟綜合樓+變電站,江北、三山、職教園三個園區,總佔地6000畝,規劃了300萬台伺服器,園區之間通過光纖網進行連接,對外是TB級網際網路出口頻寬。

規格高、規模大隻是一方面,華為雲還在資料中心引進了多種首創技術。例如AI技術精準控制溫度,採集了資料中心、IT基礎設施、雲服務的全端資料集進行訓練,首創了雲服務感知能效調優技術,AI智慧調優精度高達99.5%,可使PUE降低8 %至15%,液冷資料中心PUE低至1.1,華東區域能源效率最優,每100萬台伺服器每年可節省10億度電。

此外,華為雲蕪湖資料中心也是業界首個全端使用IPv6的雲資料中心,同時首創機房產品化,交付過程中的品質問題降低了90%,在維運層面首次引進IOT技術,實現了告警秒級上報,故障分鐘級定位。

資料中心內,伺服器一刻不停地計算、儲存、傳輸,但是作為AI基礎設施底座,使用者對資料中心的感知並不明顯,他們也不必關心資料中心的建設,更不必提「風火水電”等資料中心的基本要素。

他們關心的是,資料中心如何直接作用於大模型等人工智慧業務換句話說,資料中心只是表象,內裡的AI全端能力,是華為更值得關注的部分。


主權AI,如何建設?

在AI熱潮下,全球主要國家均大力投資AI基礎設施,「主權AI」的概念隨之興起,指的是單一國家或地區透過建立AI基礎設施、提高AI能力來滿足自身發展需求,這也是國家層面希望人工智慧作為通用目的技術起到的效果,經濟成長、產業革新。

實際上,不僅國家需要主權AI,產業、企業和個人都需要自己的主權AI,這就涉及從智算中心到雲端運算,從晶片到大模型平台的全端AI體系。華為雲升騰AI雲服務不僅包含雲化算力,也提供了AI開發生產線ModelArts和AI開發者生態AI Gallery。

首先,升騰雲服務可提供「6A」級算力,故障恢復快、資源獲取快,模型遷移快、 雲上推理投資優、就近服務時延優、雲上性能優,滿足自研大模型、增量訓練大模型、智慧應用開發等;

升騰雲服務可提供多樣化算力的使用、管理和部署模式,獨有的多級恢復機制和完備的工具鏈可實現千卡訓練連續30天不中斷,任務恢復時長小於30分鐘,為大模型和AI應用的開發、運行、維運提供最佳算力雲底座。

其次,升騰雲服務提供了AI開發生產線ModelArts,其是針對AI開發者的一站式開發平台,提供海量資料預處理及半自動化標註、大規模分佈式訓練、自動化模型生成及端- 邊- 雲模型按需部署能力,幫助使用者快速建立和部署模型,管理全周期AI工作流程。



同時,升騰雲服務還可以滿足多樣化算力部署模式,除了支援華為全場景AI框架升思MindSpore外,還支援Pytorch、Tensorflow等主流AI框架。這些框架中90%的算子,都可以透過華為端到端的遷移工具平滑遷移到升騰平台。

最後是AI開發者生態AI Gallery,基於升騰雲服務算力底座,建構一站式AI社區服務平台,包含豐富AI資產、服務、解決方案。適配業界主流開源大模型,易用開發工具與超強算力,協助企業與開發者快速建立模型應用,在大模型時代快人一步。

縱觀全球大模型產業,中國大模型產業缺少關鍵一環,因此遭受了最嚴峻的挑戰,如今這些難題正被包括華為在內的產業各方逐步解決。

徐直軍先前曾表示,任何技術只有精準的定位,才會充分發揮其價值,給人工智慧技術合理的定位,是理解和應用此技術的基礎。

當華為確立了人工智慧的定位,也找到了自己在AI產業中的定位。華為是國內最早佈局AI的廠商之一,且攻取的都是AI的根技術,算力、大模型、開發平台等,根深葉茂,本固枝榮,中國大模型產業的天花板可能不在於大模型本身,而在於算力根柢。

回到雲端運算的視角,中國雲端運算產業的競爭焦點,也不只關乎雲端平台本身,更與如何滿足企業的AI需求息息相關。表面上,雲仍然是最重要的基礎設施,企業上雲和深度用雲的處理程序仍在進行中;而實質上,從雲時代到智能時代,企業對於AI的訴求將決定雲端運算行業的未來格局,華為雲正憑藉著全端AI能力,試圖描摹出這個新時代的清晰輪廓。

如同網際網路產業的繁榮,離不開通訊基礎設施的完善,華為一以貫之做“黑土地”,無論在哪個時代,都去做孕育應用誕生的tech of tech。

江湖多風波,何妨且徐行。華為花了六年,兌現了先前的承諾。 (鈦媒體)