中國移動發佈“萬百千”大模型

全端國產化生態大模型“九天智能基座”正式發佈!

剛剛,全端國產化生態大模型“九天智能基座”正式發佈!剛剛,全端國產化生態大模型“九天智能基座”正式發佈!

它由中國移動自研。包括萬卡算力、千億模型及百匯平台三部分。

其中模型部分是九天自主研發的從算子到框架全端國產訓練的千億參數大模型,能力達到GPT-4的90%水平


以它為底座,已經佈局17個細分領域行業大模型,覆蓋政務、醫療、辦公、金融風控、客服、程式碼等行業。

算力方面,中國移動宣佈年內將建成3個國產近2萬卡智算中心。此外,還發佈了AI+5G新通話,AI+辦公等23個AI軟硬產品,AI+工業、AI+交通等20個行業應用。

沒想到,大模型“國家隊”進展已經如此迅速了。

自大模型趨勢開始,營運商等央企就開始將注意力集中到AI自研與行業落地上,為大模型國產自主化持續加碼。歷時一年多,成果開始不斷湧現。

那麼,當下大模型“國家隊”進展究竟如何了?

來參考中國移動的最新發佈。

“萬百千”智能基座發佈

今年數字中國峰會上,中國移動發佈的核心內容為1套“萬百千”智能基座、3大產業融通基地、N個AI+產品及應用。


其中,“萬百千”智能基座正是指“九天智能基座”,它由萬卡算力、千億參數模型及百匯平台組成。

算力方面,中國移動將要建成智算網路新叢集。年內將投產3個近2萬卡超大規模單體智算中心和12個區域智算中心,廣泛升級1500個邊緣節點,將訓/推算力資源配比上升至1:10。建成的單體智算中心可為萬億、千億等超大參數模型訓練提供澎湃算力。

模型方面,九天基座大模型聚焦解決行業複雜系統智能化難題,實現行業定向增強、行業模態匹配、全端國產化、安全可信等四大技術突破。

行業定向增強方面,在全球海量通識知識基礎上,模型針對通訊、電力、運輸、能源等行業專業知識進行增強。成為國內預訓練行業資料佔比最高的大模型,達10%

行業模態匹配方面,九天獨創了結構化資料大模型,能夠更好面向千行百業處理複雜的產業結構化資料。同時建構了語音、視覺、文字等方面能力,可為不同行業提供所需的模態能力。

國產化方面,九天已實現資料建構、預訓練、微調、部署全鏈路核心技術自主創新,適配國產算力,實現全端國產。

安全可信方面,九天已建立資料指令評估體系,同時加強資料處理和清洗、最佳化DPO演算法、加強人類價值觀對齊,確保模型實現指令安全相應。九天是首個同時通過雙備案的央企背景大模型,並獲得中國軟體測評中心安全測評的最高等級A級證書

基於千億基座大模型,中國移動已研發工程設計、金融風控等17款行業大模型,未來還將佈局40款自研行業大模型,賦能生產、生活、社會治理等創新升級。

平台方面,匯聚平台是一個連結大模型廠商和使用者的平台。它已匯聚並開放超30個“自有+開源+生態”大模型、超20個高品質資料集,包含模型體驗、調優、部署、推理、評測全鏈條大模型開發工具,是一個大模型生產超級工廠

一同亮相的三大產業融通基地,分別是訓練基地、評測基地和聯創基地,它們將助力大模型訓練更快、更好、應用落地更明確。

訓練基地優先開放內蒙千卡算力資源,年底開放萬卡算力資源;測試基地聯合賽迪,提供公正、優質大模型測評服務;產創基地開放北京、湖北、山東、福建,匯聚本地優質資源,可為本地央國企、頭部行業客戶、中小企業,提供AI+應用創新“試飛場”。

此外,依託中國移動AI技術的23款AI+產品及20個AI+DICT行業應用也一同亮相。比如,5G+AI新通話支援通話中即時轉寫、字幕翻譯;視訊彩鈴推出文生圖、文生音樂等功能。

以上就是此次中國移動帶來最新大模型進展。


實際上,不只是中國移動一家央企大力在大模型領域積極佈局。不完全統計,幾大營運商、中國電科、國家電網、國投集團等央企都以不同方式完成入局。

為什麼會出現這種現象?作為“國家隊”,它們又有哪些特別之處值得被關注?

為啥“國家隊”值得關注?

去年2月27日,國務院印發《數字中國建設整體佈局規劃》。

其中重點提到,要夯實數字中國建設基礎,要全面賦能經濟社會發展,要強化數字中國關鍵能力,要最佳化數位化發展環境。

與此同時,ChatGPT掀起的大模型趨勢激流勇進。重視發展通用人工智慧、把握人工智慧等新科技革命浪潮,也被在幾次重要會議中提出。

在如此時代背景和發展要求下,營運商自然就走到了聚光燈下。

一方面,營運商有技術實力

首先在算力方面,隨著“東數西算”工程啟動,營運商在建設算力網路方面已悄然走在前列。

目前,中國營運商已經建立起全球規模最大的網路。同時全國約50%以上的IDC(網際網路資料中心)都是由營運商提供。

雲端運算方面,IDC資料顯示,2023年下半年中國TOP5公有雲IaaS廠商中有兩位都是營運商背景。比如移動雲2023年收入已達833億元人民幣,同比增長率65.6%,在公有雲服務市場位居國內第一陣營。

營運商先天具備網路優勢,也進一步夯實其算力基礎。目前中國5G基站總數已達238.4萬個。


其次,營運商有資料優勢

憑藉此前與千行百業的合作,營運商已經積累了龐大業務資料,能夠快速建構稀缺資料集,更快訓出垂直行業大模型。而這些合作經驗也能讓營運商在實際合作中,更快推進技術落地。

同時,東數西算、東數西訓等工程的參與,也讓營運商建構了更靈活的資料流通能力。

最後,不少營運商在AI方面都有提前佈局。

以中國移動為例,在2013年就成立了“九天”團隊,在機器視覺、語音、自然語言處理、網路智能化等領域有多年技術積累。

另一方面,營運商也有身份優勢

大模型趨勢是科技革命,也是全球競爭。隨著趨勢不斷髮展,通用人工智慧國產自主化越來越被重視。加上政務、交通等強調隱私保護的領域也在積極擁抱大模型,對資料安全的要求,都使得央企在競爭中具備獨特自身優勢。

這兩重優勢都讓大模型“國家隊”需要被重點關注。

更何況,“國家隊”的動向一定程度上反映國家對AI、大模型的重視程度,同時也能體現出中國大模型自研水平、國產自有化的能力。而且在落地上,央企更接近國民經濟骨幹行業,比如通訊、政務等,能更快促進中國整體生產力躍升。

不過隨著趨勢演進,“國家隊”成員之間的差距也在逐漸形成。比如帶來最新進展的中國移動,成為今年國家網信辦公佈的已備案大模型清單中首家央企

為什麼是中國移動?它做對了什麼?

為什麼是中國移動?

過去1年裡,中國移動完成了大模型領域的一系列發佈。

去年世界人工智慧大會上,中國移動在大模型領域的第一落子便是發佈兩款行業大模型“九天·海算政務”和“九天·客服”。


幾個月後,中國移動又聯合多家央企發佈“九天·眾擎基座大模型”。它主打融入各類專業知識,深度匹配行業需求。

今年早些時候,在國家網信辦公佈的已備案大模型清單中,中國移動“九天自然語言互動大模型”名列其中。這是首個同時通過國家“生成式人工智慧服務備案”和“境內深度合成服務演算法備案”雙備案的央企大模型。目前已形成9B、13.9B、57B、千億等多種參數量版本,可靈活部署於雲、邊、端不同場景。

以九天基礎大模型為基礎,中國移動已經推出了二十余個行業大模型,覆蓋政府治理、工業生產、民生服務和通訊特色等領域,其中九天·客服大模型、九天·海算政務大模型等已經落地集團內外部客戶。

此外,中國移動還推出了一站式大模型開發平台、大模型應用平台(LLM Studio),面向個人及行業客戶提供從算力、資料、演算法框架到研發工具的全端人工智慧服務。


梳理來看,中國移動的大模型戰略其實非常清晰:

依託自身技術積累及業務,形成從平台、大模型及能力到規模化應用的全面產業級智能化服務能力

據瞭解,中國移動原創性提出體系化人工智慧(Holistic AI)技術,該技術具有AI服務大閉環、AI能力原子化重構、網路原生和安全可信四大技術特徵,通過體系化人工智慧核心技術引擎,實現算力、網路、人工智慧能力全域統一調度和開放服務,從而建構了新型人工智慧服務模式。

無疑,大模型浪潮這對於中國移動自身而言,是一次自我革新的機會,符合發展需求。營運商本身就是數字產業鏈條中的重要參與成員。如果不建構大模型能力,營運商只能“賣水”,在產業鏈中的話語權將可能逐漸被削弱。

對於國家而言,也需要中國移動這樣的營運商站出來,建構更加國有化的大模型能力。

在《數字中國建設整體佈局規劃》中明確指出,要強化數字中國關鍵能力,構築自強自立的數位技術創新體系,築牢可信可控的數字安全螢幕障。


具體推進動作上,憑藉紮實的技術積累,中國移動的步伐越走越快

中國移動從11年前開始佈局AI,長期關注CV、NLP等前沿AI領域技術,目前在內部建立了一支由馮俊蘭博士領軍的百人規模人工智慧研發團隊。

馮俊蘭博士是IEEE Fellow、中國移動集團級首席科學家。於2001年在中國科學院獲得聲學博士學位,同年加入美國AT&T研究中心,曾任高級研究員、主任研究員,主要研究方向包括:語音識別、 語言理解和資料探勘。

2013年9月加入中國移動研究院,一手帶出“九天”團隊。

目前,中國移動AI團隊發表國際頂會、頂刊論文150余篇,發明專利930項,頂級AI競賽TOP5獎項18項,主導了業界近九成網路智能化領域國際標準。

同時在技術落地方面,中國移動也更加關注直接影響國民生活的領域。最新展示的行業大模型覆蓋醫療、辦公、物聯水利、網路安全、社會綜合治理等領域。

資料顯示,九天”產品目前已服務超10億使用者、300家客戶、雲邊端能力呼叫次數超9.6萬億,年賦能價值達41億元。

顯然,在輻射全社會、實現AI普惠、推進數字中國建設上,以中國移動為代表的“國家隊”正在異軍突起,它們在中國大模型浪潮中的地位將愈加不可取代。

而在這場波及全球的科技浪潮中,中國移動等營運商也在將中國的數字基建優勢進一步發揮釋放,為中國數位化建設提供獨有的一股驅動力。 (量子位)