中國移動千億多模態大模型發佈,「九天-九九」風趣暢聊堪比GPT-4o

【新智元導讀】央企通訊巨頭再次奏響大模型舞台的超強音!剛剛結束的中國移動人工智慧生態大會主旨論壇上,中國移動發佈了全自研「九天」千億多模態基座大模型,一舉成為國內最值得信賴、最懂行業的全端大模型。

在通用大模型的時代浪潮中,中國移動,勇立潮頭,不落人後!

5月24日,在第七屆數字中國建設峰會中國移動人工智慧生態大會「AI賦能,智築國基」主旨論壇上,中國移動發佈了最新自研的「九天」千億多模態基座大模型。


憑藉自主研發與行業積累,「九天」基座大模型堪稱「國內最值得信賴、最懂行業」的全端大模型。

和其他企業不同,央企做大模型,是面向國民經濟骨幹行業,目的是給國家基建轉型賦能,「為產業注智,為國家築基」。

中國移動,當得起一句「央企人工智慧領頭羊」。

AI電聊對接會議,遇難題自主尋求人類幫助

GPT-4o發佈當天,向所有人展示了強大的AI語音助手能力,將電影「Her」中的Samantha帶入現實。

而中國移動現場的直播演示,一點也不輸OpenAI。

九天·九九

首先上場的「九天·九九」,是一個定製化的個人助理。

兩位童鞋向在場所有人展示了,真正的AI助理,如何讓主人們效率倍升。

一邊是小天,一邊是九九。

小哥向自己的助手「小天」提問:「我有點緊張,怎麼辦」?

暖心的小天開始為小哥出招,並為他加油打氣。


旁邊女生的助手「九九」則幫她生成了「3道關於二次函數的初中數學題」,並且在後續的追問下給出了詳細的解題步驟,分分鐘搞定初中生的指導。


接下來,九九還生成了一張六一兒童節的圖片,以「九天藍」為背景。


最後,九九還完成了一個非常實用的功能:告訴它自己的時間計畫,它就可以幫忙安排日程了,比如把後天上午9點的一個會議加入議程。


更厲害的是,小天和九九這兩個AI助手,直接在現場互通電話對接起了開會需求,完全沒有主人們的事兒了。

九天·善學

另一個在演示中登場的,是「九天·善學」。

作為一個基於知識資料和專家指導的產品,它可以協助我們進行專業的行業分析或產業洞察。

而且,如果我們有一個待完善的工作,也可以驅動模型與專家對話來進行修正。

比如它在撰寫方案時遇到了一個網路維運方面的問題,會主動開始詢問人類專家。


在兩位專家給出建議後,它就可以自動進行相關的更新和修改。



九天·網路

「九天·網路」則向我們展示了複雜系統如何完成全域的智能感知。

演示過程中,杭州亞運會場館以及周邊區域被3D復刻到了孿生數字世界,而且對通訊網路的訊號覆蓋範圍進行了可視化的渲染。


基於此,「九天·網路」可以感知網路狀態、裝置狀態以及使用者體驗。

全域的監測和感知結果也可以用可視化的方式呈現出來,訊號的光圈使各處的網路狀態清晰可見,在下面的圖片中,黃色區域表示訊號比較好、紅色是訊號比較擁堵的地方,甚至可以追蹤路上的某一個人,從使用者個體的角度出發進行分析。


維運人員在檢查裝置時可以戴著AR眼鏡,視覺監測能力可以協助分析裝置情況,並直接將分析結果疊加在維運人員的視覺範圍中。


此外,也可以讓遠端專家參與進來,對裝置的檢修、維護進行指導。


千億參數+多專家架構

以上所展現的產品和能力,全部來自中國移動「九天」千億多模態基座大模型的加持。

而要實現如此複雜且智能的基座大模型,就需要在模型架構和參數規模上不斷進行技術突破。

中國移動從2013年起就已經開展人工智慧的自主研發,在同一領域深耕十年、持續積累,讓「九天」大模型取得了技術領先的地位。


「九天」基座大模型採用純解碼與多專家相結合的架構,創新了模型的學習方式——通過結構化資料建模,進行漸進式學習。

模型的參數量,從曾經的十億、百億不斷攀升至最新千億等級。

為適應不同的應用場景,「九天」提供1.5B、3B、7B、13.9B、100+B等不同參數量的模型版本,可靈活部署於各種裝置和平台。

不僅如此,中國移動還在醞釀下一步更大的訓練計畫,將資料集規模從5萬億提升至20萬億token,進一步提升模型能力。


有如此前沿的架構和龐大的參數量,「九天」在國際競賽中的表現可謂是十分突出:

在語音合成領域,在2024年INTERSPEECH語音合成聲碼器賽道中獲得國際第一名。


視覺評測方面也同樣出色,獲得2023年CVPR VSS(視覺語義分割)賽道中視覺理解方面的第一名。


對照MME-P榜單,「九天」基座大模型的生成能力相當於全球第9名的水準。


除了競賽成績喜人,各類測試中的評測結果也十分優異。

我們熟知的多語言理解MMLU、編碼HumanEval、數學GSM8K基準中,「九天」基座大模型都取得了不俗的表現。

還有在中文C-Eval、MBPP、BBH基準上,基座大模型取得了領先的優勢。


此外,在11個行業領域,中國移動對基座模型展開了124個細類,多達8萬多道大學考試或職業資格考試題的測試,結果如下圖所示。

「九天」基座大模型在11個領域均拿下了最高成績。


這些發佈會上的「智能」表現,以及競賽和測評中令人印象深刻的成果,完全配得上它「最懂行業」的定位。

複雜系統智能化

作為全端大模型,「九天」讓自己的能力面向各種複雜行業需求,提出了「複雜系統智能化」的理念,旨在為產業「注智」。

大模型的「智能」說起來容易,但實現起來卻很困難,需要攻克許多的難題和壁壘。

為了實現面向複雜系統智能化,中國移動集團首席科學家馮俊蘭等專家,做了大量的工作。

如果說AI是一個大海,現在的智能還僅僅停留在表面。想要走向深水區,除了推理、生成、推理這些通用能力,還需要對複雜系統進行感知、預測、診斷、控制和決策。

大部分複雜系統,都是一個混沌的系統。怎樣才能從微觀走向宏觀,從混沌走向清晰?


這就需要結構化的資料。因為在複雜系統中,會有大量的裝置,大量的資料。

此外,還有多信源的資料,讓AI可以看我所看,為我所為,聽我所聽。

怎麼去表徵好這些訊號,和通用的模態資料進行融合,就是複雜系統實現真正AI的關鍵。

總的來說,複雜系統智能化需要解決兩大問題:一是大而不穩,二是多而不合。

為此,中國移動在「九天」基座大模型的研發過程中使用了多種策略和技術,包括多層資訊加固、溯源資訊場一致性校驗、大小模型協同等。


這幾種技術的結合使用,將「九天」模型打造成為面向「原子化任務」的智能體。

不僅有當下前沿大模型的理解、生成、推理能力,還以此為基礎,進一步延展出感知、預測、診斷、控制、決策等更加「類人」的能力。

從每個行業的微觀資料到泛行業模型的宏觀生態,從混沌、複雜的問題中提取清晰、簡單的解決路徑,這就是「複雜系統智能化」想要實現的目標。

打通模態信源

「九天」之所以將自己定位為通用的「全端」大模型,原因之一是打通了各個模態之間的隔閡,實現複雜的大模型系統在「全模態」之間的智能化推理。

不僅包含語音、語言、視覺這些常見的模態,而且囊括了結構化資料,讓模態的設計都更加匹配各行各業中的落地場景。

另一個原因在於,中國移動發揮自己在通訊領域的龍頭地位,讓大模型可以在各種信源和裝置上靈活部署。

當前的大模型由於參數過大、裝置相容性低等原因,一般只能在伺服器或PC端進行推理,但能夠提供雲邊端全面服務的中國移動表示不服。

「九天」大模型不僅可以部署在常見的移動電子裝置和物聯網感測裝置上,比如智慧型手機、平板、汽車和穿戴裝置,還能應用於各種複雜信源,包括雷達、紅外、聲波、無線射頻等等。


這些複雜信源雖然人類難以感知,但對工業生產、通訊、服務領域的一些支柱性行業至關重要。

對多種信源的強大適配能力,讓「九天」輕鬆走入各行各業的場景,快速落地應用。

聚焦骨幹行業

國內外市場上大模型層出不窮,為什麼只有「九天」敢宣稱自己「最懂行業」?

從模型定位、訓練資料到AI生態、應用場景,「九天」的研發團隊始終沒有忘記自己「聚焦行業」的初衷——

讓最前沿的AI模型服務於骨幹行業的技術革新,服務於國家基礎設施的智能轉型。


因此,「九天」定位為面向複雜行業系統,要在政府治理、工業生產、民生服務、通訊特色這四大領域發揮重要作用,提供基座模型。

從訓練開始,「九天」基座模型就與行業緊密相連——不僅整合通訊、能源、建築、交通等八大行業的專業知識,而且行業資料在所有預訓練資料中的佔比達到10%,超過了所有國內和國際的同行。


另外,對於結構化資料的處理,就著重考慮了行銷、出行等行業應用,增強了模型的網路智能化實戰經驗,較傳統手段有10%-15%的提升,解決了大模型無法精準處理結構化資料的難題。

在視覺理解領域,訓練資料就包含了7000萬路視聯網,以及200億+咪咕圖、文、視訊等行業特色資料,讓模型不僅「看得清」、「看得懂」,而且「看得準」。

在「九天」基座模型的基礎上,中國移動已經建立了一整套面向全行業的大模型體系和AI生態,共開發出15款行業大模型。


全面支援自主生態

作為AI行業的「國家隊」選手,中國移動站在AI技術的浪潮之巔,用實際行動表明了獨立自主研發的決心,顯示了央企應有的擔當。

在研發「九天」大模型體系的過程中,研發團隊同時致力於在算力、晶片、框架、演算法等領域實現AI生態的「國產化」。


在晶片層面,「九天」系列大模型解決了一大訓練難題——在異構晶片之間轉換。

在11個廠家生產的17款不同晶片上,團隊完成了適配、遷移、測試和標準拉齊等一系列工作,從而支援模型在異構晶片間平滑轉化和繼續訓練。

為了助推國內AI產業加速發展,中國移動還提出了「萬千百」智能基座計畫,打造「萬卡大算力、千億大模型、百匯大平台」。


在算力層面,中國移動將建成3個兩萬卡智算中心和12個區域智算中心。

目前,已經在呼和浩特建成的超大單體智算中心,規模超越了全球範圍內所有營運商,成為央企「十大超級工程」之一。

隨著AI大規模落地,對推理算力需求激增,中國移動還將全面升級已經部署的1500個邊緣計算節點,提升訓推算力資源配比達到1:10,即1卡訓,10卡推。

年底,全網大模型訓練卡達到10萬卡+,規模將會超過30 EFLOPS。


其次,中國移動還將升級算網大腦新中樞,並建構數聯網的新保障。

「百匯大平台」上,還會匯聚豐富的大小模型、資料集及AI原生應用,集模型體驗、下載、調優、部署、應用、測評等多種功能為一體,為創業者和開發者提供「一站式」服務平台。

模型安全可信

「九天」系列大模型之所以「值得信賴」,不僅體現在支援國產化的自主研發,還根植於對模型安全性的高標準、嚴要求。

為瞭解決大模型在應用中面臨的「遺忘」、「幻覺」等共性痛點,團隊在訓練中應用了知識升維融合、持續動態學習等關鍵技術。

此外,模型還配備了完善的資料安全、系統安全等保障機制,真正達到安全、可信、可控。

這種對於安全性的執著追求,最終得到了官方的認可。

「九天」自然語言互動大模型同時通過了「生成式人工智慧服務備案」與「境內深度合成服務演算法備案」,成為首個央企研發的完成雙備案的大模型。

在中國軟體測評中心開展的測試中,「九天」大模型也獲得了最高等級(A級)的安全性認證。


十年磨劍,跨越式發展

在一系列卓越的成就背後,是整個集團創「世界一流資訊服務科技創新公司」和勇擔國家科創重任的雄心,以及研發團隊十年如一日地努力前進、力爭上游的決心。

IEEE Fellow、中國移動集團首席科學家馮俊蘭博士是整個AI領域的領頭人。


她在2013年9月加入了中國移動研究院,也就是那個時候,這家營運商已經嗅到AI的未來潛力。

十年間,馮俊蘭博士帶領團隊在AI技術研發上一步步篳路藍縷、穩紮穩打,親歷了公司在AI領域實現「跨越式」發展的全過程。


如今,中國移動成立了「九天」人工智慧研究院,引入2名千人專家、超150個AI 專業博士,形成2000人AI核心團隊,開展了人工智慧基礎技術、演算法、平台、應用的全端研發,具備了大模型資料建構、預訓練、微調、推理等全鏈路技術的自主創新能力。

在去年,中國移動相繼發佈了「九天·客服」、「九天·海算政務」、「九天·網路」等垂直行業大模型,以及面向骨幹行業開放共建的「九天·眾擎基座大模型」,在大模型賽場上發出了響亮的央企聲音。

除了發佈的產品和模型,中國移動還取得了豐碩的科研成果——原創性提出了體系化人工智慧(Holistic AI)技術,受到產學研各界的廣泛認可和支援。


榮獲中國通訊學會科技進步獎一等獎,申請超過930項專利,發表160余篇頂會頂刊論文 ,並在約20個大型國際競賽中取得TOP 5的成績。

展望未來,正如這次大會的主題「AI賦能,智築國基」,中國移動將肩負AI「國家隊」的使命繼續前行,把AI領域最前沿的進展帶入千家萬戶、千行百業。 (新智元)