中國八家互聯網大廠大模型盤點

2022年11月,OpenAI發布基於GPT-3.5的ChatGPT,在國內外瞬間引爆大模型的熱潮。僅僅經過半年多的時間,不少頭部互聯網公司和人工智能公司基本都對外宣布了自己的大模型,中國已出現了“百模大戰”的局面,根據今年5月底發布的《中國人工智能大模型地圖研究報告》顯示,參數在10億規模以上的大模型全國已發布79個。



在過去的幾個月裡,各大廠相繼出招,先是3月16日,百度率先發布“文心一言”,期望對標ChatGPT;再到阿里巴巴旗下超大規模語言模型“通義千問”開放內測,萬維和商湯科技分別發布大模型產品;創新工場CEO李開復、前搜狗CEO王小川、前京東AI掌門人周伯文、前美團聯合創始人王慧文等行業大佬紛紛宣布下場,國產大模型賽道競爭激烈。

且7月7日,WACI 2023大會上,由國家標準委指導的國家人工智能標準化總體宣布,我國首個大模型標準化專題組組長由上海人工智能實驗室與百度、華為、阿里等企業聯合擔任。自此,大模型的“國家隊”集結。

大模型的建造離不開綜合算力資源、算法人才、數據積累及產品先發幾大核心要素。事實也正是如此,只有大廠才有大量資金和人才發展算力、算法、數據,也最有機會率先落地大模型。

對此,零壹智庫、數字化講習所整理了八個算力、算法、數據處於國內前沿的大模型進行介紹,內容主要包含大模型發展佈局和產品方向等方面。下週零壹智庫、數字化講習所將發佈人工智能相關政策報告,內含2020年1月1日至2023年6月14日期間中央及各地方政府出台的71部數字經濟相關政策。

文中涉及的代表性國產大模型是:百度(9888.HK)“文心一言”、阿里雲“通義千問”、騰訊(00700.HK)“混元助手”、華為“盤古”、科大訊飛(002230.SZ)“訊飛星火”、網易(09999.HK)“玉言”、360(601360.SH)“360智腦”、京東(09618.HK)“言犀”。



目錄

一、大模型介紹

(一)百度——“文心一言”大模型

(二)阿里——“通義千問”大模型

(三)騰訊——“混元助手”大模型

(四)華為——“盤古”大模型

(五)科大訊飛——“訊飛星火”大模型

(六)網易——“玉言”大模型

(七)360——“360智腦”大模型

(八)京東——“言犀”大模型


二、總結




01 大模型介紹


(一)百度——“文心一言”大模型

2023年3月16日,百度正式發布大語言模型、生成式AI產品“文心一言”, 文心一言發布首日已有超60萬人申請測試。發布兩天,已有12家企業完成首批簽約合作,同時,申請百度智能雲文心一言API調用服務測試的企業達9萬。

1. 發展佈局

其實,早在2019年,百度就推出了知識增強的語義理解框架文心大模型,並廣泛應用於閱讀理解、情感分析、智能搜索問答、視頻推薦等領域。2021年,百度又基於文心大模型的基礎上發布了全球首個百億參數的對話大模型PLATO-XL。文心大模型系列同時也不斷經歷迭代,為推出大語言模型“文心一言”打下了紮實的基礎。百度的文心大模型在產品能力、生態能力方面已處於國內第一梯隊的水平。

且在研發投入方面,百度自2017年7月開啟ALL IN AI戰略後,2017-2022年的6年間,已投入了超千億的研發費用,研發費用率從15%提升至目前約20%的水平。對比海外互聯網大廠,百度的研發投入佔比也為較高水平。在高強度的研發投入下,百度取得的成果也是顯著的。因此,百度能夠成為國內首家推出大語言模型文心一言的企業,絕對不是心血來潮,而是其在人工智能領域背後多年的積累。

2.強大的中文對話能力

從模型來看,文心一言是高度本土化的AI模型,更加匹配中文環境的使用習慣,作為百度基本盤的搜索業務,不僅能夠提供巨大的基礎數據,而且在中文搜索上具有顯著優勢。甚至近期,在AGIEval、C-Eval等中英文權威測試集和MMLU英文權威測試集中,文心大模型3.5取得了超過ChatGPT和LLaMa、ChatGLM等其他大模型的分數表現,在中文評測項中超越了GPT-4。

對於中文用戶而言,文心一言所提供的強大的中文對話能力,包括對於古漢語的應用,都是具有獨特性的,讓人認為這是一款真正屬於國人的AI工具。中文是世界上使用人數最多的語言,相信未來將存在更大的商機。

3月16日起,除了首批用戶可通過邀請測試碼在文心一言官網體驗產品外,百度智能雲也即將面向企業客戶,開放文心一言API接口調用服務。文心一言將通過百度智能雲對外提供服務,幫助企業構建自己的模型和應用,農業、工業、金融、教育、醫療、交通、能源等重點領域。

憑藉百度的移動生態,文心一言已經擁有了龐大的用戶基礎。到目前為止,已有超過650家企業宣布接入文心一言生態,且百度大語言模型文心一言App已經上架蘋果App Store,百度的AICG生態圈已初具雛形。百度作為國內AIGC的先行者,在國內同類企業中已然佔據了相當的先發優勢。

表1:“文心一言”生態合作夥伴(不完全統計)


數據來源:公司官網、數字化講習所、零壹智庫



(二)阿里——“通義千問”大模型

2023年4月7日,“通義千問”開始邀請測試。同年4月11日的阿里雲峰會上,阿里雲正式宣布推出大語言模型“通義千問”,並表示阿里巴巴所有產品未來將接入“通義千問”大模型,進行全面改造,包括天貓、釘釘、高德地圖、淘寶、優酷、盒馬等。數據顯示,已經有超過20萬家企業申請接入通義千問測試。在大模型的賽道上,阿里邁出了關鍵的一步。

1.發展佈局

2009年,阿里成立阿里雲開始佈局雲計算,並於2011年對外提供雲計算服務。2015年,阿里雲開始推出AI產品,適用於語音識別、圖像識別、視覺識別等多個領域。隨後,阿里投資了深鑑科技、寒武紀等芯片公司,涉足芯片技術領域。2018年,在阿里達摩院的基礎上,阿里宣布成立一家獨立運營的芯片公司“平頭哥”,增強自主研發能力。同時,阿里相繼入股了商湯科技、曠視科技、依圖科技,加強阿里的AI視覺識別功能。正是有這些堅實的基礎,才能使阿里雲在極短的時間內推出“通義千問”大模型。

2.強調算力,助力AI普及

阿里云總裁張勇談到阿里雲戰略的核心,表示未來要做好兩件事情——讓算力更普惠、讓AI更普及。“讓AI更普及”,即讓每家企業的產品都能接入大模型升級改造,並有能力打造自己的專屬大模型。

作為大語言模型,通義千問與ChatGPT類似,它支持多輪交互及復雜指令理解、多模態融合以及外部增強API,能夠實現多輪對話、文案創作、邏輯推理、多模態理解、多語言支持等功能。據阿里雲智能集團CTO周靖人介紹,通義千問作為一個通用的大模型,並不會根據某個具體的業務問題進行優化或定制。開放通義千問的能力,意味著企業不需要從頭開始訓練大模型,而是能夠在通義千問的基礎之上,結合企業自己的應用場景、知識體系、行業特殊需求等,形成自己的企業大模型。

比如,每個企業都可以有自己的智能客服、智能導購、智能語音助手、自動駕駛模型等。拿阿里自身舉例,接入通義千問後的釘釘,只需上傳一張功能草圖,不用寫一行代碼,可立刻生成訂餐等的輕應用;接入通義千問後的天貓精靈變得更擬人更聰明,知識、情感、個性、記憶能力大幅躍升。

表2:“通義千問”生態合作夥伴

(不完全統計)


數據來源:公司官網、數字化講習所、零壹智庫



(三)騰訊——“混元助手”大模型

騰訊的混元大模型包括計算機視覺、自然語言處理、多模態內容理解、文案生成、文生視頻等多個方向,已廣泛應用於騰訊微信搜索、騰訊廣告等業務場景。騰訊正在以其強大的算力集群和混元大模型為引擎,全力優化自身的業務生態。


1.發展佈局

騰訊的AI 大模型技術最早探索可以追溯到2019 年,當時馬化騰對外表示,騰訊建立了四大AI 實驗室,涵蓋AI 從全面基礎研究到多種應用開發。2022 年4 月,騰訊首次對外披露旗下混元AI 大模型的研發進展,這是一個包含CV、NLP、多模態內容理解、文案生成、文生視頻等多個方向的超大規模AI 智能模型。2022 年12 月,騰訊推出了萬億中文NLP預訓練模型HunYuan-NLP-1T(混元AI 大模型),它在自然語言理解任務榜單CLUE 中得分突破80.888 分,獲得第一,並刷新該榜單歷史紀錄。

在2023年6月19日的行業大模型及智能應用技術峰會上,騰訊第一次公佈了騰訊雲行業大模型的研發進展。其圍繞B端需求,反復強調大模型是為“具體場景設計的具體應用”。不難發現,騰訊的大模型策略為:不採用其他大廠的紛紛研發的通用大模型產品,直接根據行業需求進行定制。

2.核心業務場景中成功落地,效果顯著

據了解,混元大模型已成功落地於騰訊廣告、搜索、對話等內部產品並通過騰訊雲服務外部客戶。騰訊的混元大模型是建立在自有的強大底層算力和低成本高速網絡基礎設施之上的,它由騰訊自研的太極機器學習平台承載。該模型涵蓋了NLP大模型、CV大模型、多模態大模型、文生圖大模型以及許多行業/領域/任務模型,尤其值得一提的是,HunYuan-NLP 1T成為國內首個低成本、可直接應用的NLP萬億大模型,其在自然語言理解任務榜單CLUE中榮登榜首。

混元大模型在廣告、搜索、推薦、遊戲、社交等多個互聯網業務領域均發揮了顯著的作用,它已經在騰訊的多個核心業務場景中成功落地,並產生了顯著的效果。例如,它支持微信、QQ、遊戲、騰訊廣告、騰訊雲等多個產品和業務,在廣告內容理解、行業特性挖掘、文案創意生成等方面,模型的表現非常出色。

(四)華為——“盤古”大模型


盤古大模型是一個匯聚深度學習技術的大規模AI模型。這一模型採用三層體系,包括L0基礎大模型、L1行業大模型和L2場景模型。其設計目標是推動AI工業化進程,為各行業提供強大的技術支撐。

1.發展佈局

根據華為披露的時間表,華為盤古大模型2020年啟動研發;2021年4月,華為正式發布了盤古NLP(中文語言)大模型、盤古視覺大模型、盤古科學計算大模型;2021年,聚焦行業應用落地,華為推出用於藥物研發細分場景的大模型;2022年,華為與能源集團合作發布了盤古礦山大模型、盤古氣象大模型、盤古海浪大模型、盤古金融OCR大模型。2023年7月7日,盤古大模型3.0發布,華為雲CEO張平安表示希望用盤古大模型幫助各行各業,例如在金融、政務、礦山、氣象等行業,在產品研發、生產供應鏈、市場營銷以及數字運作領域,讓盤古大模型為他們賦能。

2.強調產業落地應用,深耕行業服務

目前,華為雲盤古大模型已經在100 多個行業場景完成驗證,包括醫藥研發、電力、煤礦、氣象、小語種等。2022年,華為雲就交付了一個阿拉伯語的千億參數大模型,盤古科學計算大模型也用在了氣象預報、海浪預測等方向。與目前開放給部分公眾用戶進行問答互動的文心一言、通義千問不同,盤古大模型至今尚未開放給公眾使用,盤古大模型強調在細分場景的產業落地應用,主要解決商業環境中大規模定制的問題。

在政務領域,華為雲攜手深圳市福田區政務服務數據管理局,上線了基於盤古政務大模型的福田政務智慧助手小福;在煤礦領域,盤古礦山大模型已經在全國8個礦井規模使用;在金融行業,盤古能讓每個銀行櫃員擁有自己的智慧助手;在製造行業,盤古已為華為產線製定最優排產計劃。

華為盤古大模型以其創新的三層體系開啟了AI工業化的新紀元。它在技術上取得的顯著進步,以及在實際應用中所展現出的巨大潛力,標誌著一個新時代的來臨。

表3:“盤古”重要交付夥伴(不完全統計)


數據來源:公司官網、數字化講習所、零壹智庫



(五)科大訊飛——“訊飛星火”大模型

訊飛星火採用“1+N”架構,“1”是通用認知智能大模型算法研發及高效訓練底座平台,“N”是應用於教育、醫療、人機交互、辦公、翻譯、工業等多個行業領域的專用大模型版本。2023年4月24日,科大訊飛星火認知大模型官網正式上線,並開放需求調研。訊飛星火認知大模型圍繞“知識問答、代碼編程、數理推算、創意聯想、語言翻譯”等實用場景,通過海量文本、代碼和知識學習,可實現基於自然對話方式的用戶需求理解與任務執行。

1.發布星火大模型V1.5,共建“星火”生態

2023年6月9日,在科大訊飛24週年慶上,訊飛星火認知大模型V1.5正式發布。時隔一月,訊飛星火認知大模型不僅各項能力持續提升,且在綜合能力上實現三大升級:開放式知識問答取得突破,多輪對話、邏輯和數學能力再升級。星火APP同步發布,面向生活、工作等用戶高頻使用場景上線200多個小助手,將打造大模型時代的隨身助手。

與此同時,在應用落地上,科大訊飛進一步推動星火認知大模型在教育、醫療、工業、辦公等領域落地應用,賦能星火語伴APP、醫療診後康復管理平台、羚羊工業互聯網平台、訊飛聽見智慧屏等產品,並開放了訊飛星火開發接口,攜手開發者共建“星火”生態。

同時,科大訊飛聯手北大、清華、中科大等首批22所全國重點高校,啟動星火認知大模型場景創新賽、開展訊飛高校AI星火營,為產業未來培養通用人工智能時代的領軍人才。


(六)網易——“玉言”大模型

“玉言”大模型脫胎於網易伏羲,訓練語料主要來自小說、百科和新聞等,模型規模從最早的一億參數增長至千億參數,模型領域也從文本拓展到圖文、音樂、行為序列等多種模態,其具備的自然語言處理能力可應用於語言助手文本創作、新聞傳媒、智能客服等領域,甚至在多項任務上超過人類水平。曾拿下中文語言理解權威測評基準CLUE分類任務榜單冠軍。

公開資料顯示,“玉言”大模型參數達到110億,由浪潮信息提供AI算力支持。“玉言”大模型相關技術已用於網易集團內的文字遊戲、智能NPC、文本輔助創作、音樂輔助創作、美術設計、互聯網搜索推薦等業務場景。

1.獲央視點贊,深耕遊戲AI技術

在近期的央視《新聞直播間》欄目在“人工智能產業佈局提速,打開就業新空間”的專題報導中,指出最近網易推出的遊戲《逆水寒》中,就有基於玉言大模型為基礎的最新的文字捏臉玩法。通過數千名用戶在遊戲Beta測試階段不斷輸入文學性文字來對AI進行調整,使“捏臉AI”能準確地理解文學性文字。

用戶在“捏臉”的時候可以在界面內輸入外貌描述,”玉言”會自動理解外貌描述內容並在一秒之內輸出精準的捏臉結果。這種文字捏臉的玩法不僅橋接了網絡文學和遊戲之間的距離,還背後使用AI“玉言”模型的技術也為還原文學經典提供了新的範例。

除此之外,央視還將伏羲挖掘機器人參與浙江桐廬礦山工作,瑤台元宇宙等作為人工智能的創新應用案例集中展示,點贊網易遊戲AI技術的創新性及產業落地能力。


(七)360——“360智腦”大模型

2023年6月13日,360集團公司正式召開“360智腦大模型”應用發布會,發布認知型通用大模型“360智腦4.0”,並宣布360智腦已經接入360旗下產品“全家桶”中。目前,360智腦已具備生成與創作、多輪對話、代碼能力、文本分類、文本改寫、閱讀理解、邏輯與推理、知識問答、多模態、翻譯等十大核心能力,維度涵蓋數百項細分功能,可覆蓋大模型全部應用場景。

1.發展佈局

360智腦首發“文生視頻”多模態功能,任何文字腳本都可生成視頻,不受專業技能和素材限制,並將“360智腦4.0”接入瀏覽器、搜索、安全衛士等360全端產品。在技術優勢方面,360早在2015年就成立了AI研究院,並且開始探索多模態數據。在數據方面,360以搜索為基礎,擁有大規模、多樣性和高質量的訓練語料,今每天抓取1.4億網站的數據,包括2.8億的專業文獻,1.2億的行業數據,以及經過清洗的10T級別的用於大模型訓練的數據,為大模型的應用提供了優勢。

此外,360還具備工程化和場景優勢,在國內是唯一能與微軟的“全家桶”相媲美的全端應用。在內容安全方面,360積累了20年的互聯網內容安全經驗,並建立了完善的大模型安全防護體系。當前360智腦已經通過工信部信通院測試,成為國內首個“安全可信”AIGC大模型。

2. 打造AI數字人

目前,360 AI數字人平台上擁有200多個角色,分為數字名人和數字員工兩大類。數字名人包括歷史人物、偶像明星、文學形像等,用戶可以通過和數字角色進行對話,沉浸式地與角色們交流。此外,360AI數字人支持定制,每個人都能通過上傳私人知識庫,低成本生成自己的專屬數字人,如數字分身、數字助理、數字偶像等。

360將依托360智腦大模型能力,重新定義“數字人”,用戶可以進行個性對話、利用數字員工實現工作協作,以一種更加擬人化、個性化的方式獲取服務。未來,360AI數字人的發展方向是生成聲音、視頻並擁有長期記憶,甚至擁有目標分解和規劃的能力,並且擁有“手和腳”,具備執行力,更好為人類提供服務。


(八)京東——“言犀”大模型

2023年4月10日,京東正式宣布推出千億級參數的文本生成模型——GPT言犀。據悉,該模型覆蓋品類超過3000個,能夠生成超過30億條語句。2023年7月13日上午,京東在2023京東全球科技探索者大會暨京東雲峰會上正式發布京東言犀大模型,同時發布言犀AI開發計算平台。該平台已經啟動預約註冊,預計8月正式上線。

1.發展佈局

其實京東雲旗下言犀人工智能平台,此前已有10餘年智能對話經驗的積累,從2012年已經開始嘗試AI對於客服業務的賦能,再加上其在京東零售、物流、金融、健康等各業務的多年實踐,以及日均千萬次的智能交互,它與AIGC/Chat GPT等相關技術成果相結合,毫無疑問可以加速AIGC規模化的應用落地。

2.賦能電商服務形態,實現新突破

言犀是“京東版”ChatGPT,言犀大模型預訓練參數達到千億級,品類覆蓋3000+,人工審核通過率95%+、生成文字30億+。除了模型規模持續擴充外,京東大模型同時支持多模態,包括圖片生成、語音生成、數字人生成等維度。具體的應用案例包括AI數字人採訪、商品圖片製作、藝術品創作、數字人直播帶貨等。

相較於市面上目前已有的文本生成模型,言犀規模更加龐大,能夠處理更多品類和更大量的數據。與此同時,它還擁有更高的準確性和更為強大的語義理解能力。這些優勢可以在客戶諮詢與服務、營銷文案生成、商品摘要生成、電商直播、數字人、研報生成、金融分析等領域發揮廣泛價值。

目前,京東在任務型智能對話交互方向上取得了一系列成果。在任務型智能對話交互探索方面,京東可以幫助用戶通過語音、文本、數字人等多種人機對話形式完成複雜任務,實現高表現力、可控、可信的智能對話體驗,這一突破將為電商開啟全新客戶服務形態賦能,打破現今電商行業的發展壁壘,實現新的突破。


表4:八家大模型基本信息

數據來源:公司官網、數字化講習所、零壹智庫



02 總結

隨著ChatGPT引爆的新一輪AI熱潮,中國企業在類ChatGPT應用開發上確實已經實現快速追趕。在過去幾年間一些注重人工智能、雲計算的頭部企業,也令他們具備追趕國際領先大模型水平的基礎。不由得讓人更加期待後續國產大模型的表現,AI給整個產業,甚至整個社會帶來的變革,或許正在中國加速萌發。

同時,通過對上述八家大廠大模型的可以得出,通用大模型不是模型應用的唯一方向,面向垂直產業的模型會成為大模型價值的引爆點。大模型B端應用”出於對模型的經濟性考量,未來將呈現階梯式需求。

在行業市場,客戶需求蓬勃且明確。在全球,零售、金融、製造、政府等領域都在靠大模型進行智能化升級。隨著技術不斷迭代,大模型產業應用也將迎來加速,為數字經濟和實體經濟發展注入澎湃動力。(數字化講習所)


未來未可知啊.