廠商總覽
本次評估模型設立「中國市場落地」「全端能力」「商業基礎」、「產品市場」、四項基線,同時滿足這五項基線要求的大模型廠商,將入圍競爭力評估。
中國市場落實:截止目前,海外大模型廠商尚未在中國落地,其產品服務及生態圈打造等關鍵能力在中國市場均有缺失,而非官方通路使用相關服務的企業將面臨高風險。例如,OpenAI 尚未向中國用戶開放ChatGPT 及GPT-4 服務,類似的情況也出現在Google、Meta 等大模型廠商提供的相應服務上。相較而言,接取國產及自主研發的大模型更加現實、穩定且具可控性。
全端能力:大模型服務考核廠商從算力基礎設施、深度學習架構到演算法設計最佳化的全端大模型解決方案能力,以及對應的工程化和營運經驗與水準。因此,入圍的廠商應具備相關全端能力,如應有自建且自運營的算力基礎設施、領先的演算法設計等能力。
商業基礎:大模型廠商在技術層保持投入的同時,還應擁有大模型商業輸出能力的積累,將大模型技術賦能現有業務之中,積累行業know-how 和應用認知,應對大模型市場的爆發性成長和顛覆式創新時具備穩定性。
產品市場:在產業賽道日趨擁擠的情況下,廠商目前需已有成形的大模型和商業化產品,入場競爭博弈,保持先發優勢,後續以獲取的用戶和行業數據不斷迭代優化大模型。
綜合競爭力評估的四大基線
三方維度詮釋主要廠商綜合競爭力
• 產品技術能力:訓練資料、算力支撐模型開發等多個維度決定了AI 大模型的效能效果與應用表現。產品能力越強,證明該廠商大模型的底層技術越堅實可靠、應用服務表現越好。
• 策略願景能力:主要從風險緩解措施、市場認知與理解等多個評估指標來衡量大模型廠商的策略願景。此向度得分越高,代表廠商策略願景完整性越高。
• 生態開放能力:主要從生態開放、生態體系建構、聯合創新這三個構面來評估大模型廠商的生態能力。生態能力越強,則證明該廠商大模型的開放性程度越高、產業協作能力越強。
評估模型及指標體系
三方維度詮釋主要廠商綜合競爭力
評估模型及指標體系
部分指標的廠商基本狀況
• 本報告將根據最終評估的AI 大模型在產品技術能力、策略願景能力、生態開放能力三個維度的綜合表現對比相關廠商在AI 大模型領域的綜合競爭力
商湯:SenseCore 商湯AI 大裝置+ 商湯日日新SenseNova大模型體系
◼ 從基礎設施到模型研發的全端能力
基於「大模型+大裝置」的技術路徑,商湯推進AGI 為核心的發展策略。
商湯領先發布「日日新SenseNova」大模型體系,提供自然語言、內容生成、自動化資料標註、自訂模型訓練等多種大模型以及能力,結合決策智慧大模型,為AGI 實作提供重要起點。除語言大模型「商量SenseChat」外,「如影SenseAvatar」、「瓊宇SenseSpace」、「格物SenseThings」、「秒畫SenseMirage」一系列生成式AI 模型,能夠在文生圖創作、2D/3D數位人生成、大場景/小物件生成實現應用。
歷時五年,商湯建造了AI 大裝置,成為中國稀缺大模型建設基礎設施,並以此作為打造AGI 時代的底座。基於大裝置,商湯擁有了大模型生產的核心平台,不僅對內支持打造了日日新大模型體系,同時具備對外提供大模型訓練賦能的服務,包括從工程開發到生產部署,截止目前,已經服務8 家大型客戶。
◼ 具有前瞻性的開放生態
商湯開源多模態多任務大模型「書生2.5」,具有30 億參數,全球開源模型中ImageNet準確度最高、規模最大,同時也是物體檢測標竿資料集COCO 中唯一超過65.0mAP 大模型。商湯建構了包括OpenMMLab、OpenDILab、OpenXRLab、OpenPPL 在內的開源演算法框架體系,與業界分享創新成果。
商湯積極助力國產晶片廠商,提升GPU的訓練能力,並合作上線大模型推理服務,攻關千卡國產訓練集群,大裝置已完成 58 款國產晶片的適配與應用。
商湯大模型發展關鍵事件時間點
商湯日日新自研大模型體系
商湯:SenseCore 商湯AI 大裝置+ 商湯日日新SenseNova 大模型體系
◼ 體系化研發能力下產業應用累積
商湯建構了從底層訓練系統到演算法設計最佳化的體系化大模型研發能力,如相容解碼建模Uni-Perceiver,將不同模態資料編碼到統一表示空間,統一不同任務範式,從而以相同架構和共享的模型參數同時處理各種模態和任務;採用更先進的大模型結構設計與大batch訓練優化演算法,使得「秒畫SenseMirage」模型參數量為Stable Diffusion 數倍,且具備更優的文本理解泛化性、影像生成風格廣度以及影像高品質生成細節。
商湯透過API 對外提供大模型服務,同時也將其作為自身業務創景創新提效的引擎。「商量SenseChat」具備多輪對話和超長文字的理解能力,並支援程式設計助手,可協助開發者更有效率地編寫和偵錯程式碼等一系列創新應用。另外,商湯將大模型的能力全面賦能自身的商業體系,圍繞著智慧商業、智慧城市、智慧生活和智慧汽車四大關鍵領域,建構AGI 核心能力。目前商湯超大模型已經涵蓋公司核心業務,有20+落地場景大模型交付,5+ 個專案生產Serving 交付。
商湯大模型產業佈局與應用場景累積
商湯大模型的體系化研發能力
◼ 產業級知識增強大模型,夫嫩產業大模型發展
百度文心大模型源自產業、服務產業,是產業級知識增強大模型。百度透過大模型與國產深度學習框架融合發展,打造了自主創新的AI 底座,大幅降低了AI 開發和應用門檻。文心大模型一大特色是“知識增強”,百度自研的多源異構知識圖譜擁有超過5,500 億條知識,被融入到文心大模型的預訓練中。文心大模型憑藉著大量資料和大規模知識的融合學習,能實現更高的效率、更好的效果、更強的可解釋性。
◼ 大模型架構分三層體系
百度文心建構了文心大模型層、工具與平台層、產品與社群三層體系:建構較適配場景需求的基礎、任務、產業三層大模型體系,提供全流程支援應用落地的工具和方法,孵化基於大模型的任務系統與創新產品。目前文心大模型已經建置了36 個大模型。文心API 與提供全流程開箱即用大模型能力的EasyDL 與BML 開發平台,全方位降低應用門檻;新增產品與社群層,包括「文心一格」、「文心百中」和暘谷社區,讓更多人零距離感受到先進的AI大模型技術帶來的新體驗。
百度文心大模型全景圖
百度: AI 大底座+文心大模型
◼ 飛槳平台助力大模型落地
預訓練大模型市場正處於高速發展階段,需要解決差異化程度下開發者和企業的應用需求。百度飛槳深度學習平台向下適配各種硬件,支援文心大模型的開發、高性能訓練、模型壓縮、服務部署的各種能力,貫通AI 全產業鏈,串聯起全棧化的產業生態體系。文心大模型+飛槳深度學習平台生態共享,在市場生態持續發力以百度飛槳為代表的國產開發框架已逐步與產業融合,在社區生態建設上持續發力。文心大模型是飛槳模型庫的重要組成部分,與飛槳共享生態,包含產業級知識增強大模型體系,以及工具平台、API 和創意社
文心大模型與飛槳深度學習平台的關係
區助力大模型的高效率應用。飛槳深度學習平台能協助解決大模型研發和部署的各類問題,大模型使得AI 模型的研發門檻更低、效果更好、流程更加標準化,硬體廠商、開發者以及模型應用企業在文心+飛槳生態中,緊密連結、相互促進,形成共聚、共研、共創的健康生態。
百度大模型發展史
◼ 拓展產業鏈生態,賦能大模型
百度聚焦生態的打造,積極拓展生態夥伴,協力推動產業發展。百度文心聯合深圳燃氣、吉利、泰康保險、TCL、上海辭書出版社等各領域的企業發布了行業大模型,涵蓋電力、燃氣、金融、航太、媒體、城市、影視、製造、社科等領域,加速推動
產業的智慧化轉型升級。目前生態已凝聚535 萬開發者,服務20 萬家企事業單位,與12 家硬體夥伴聯合發布飛槳生態發行版,推動深度學習平台與更多硬體適配;也與中國科研院所、實驗室以及高校強強聯手,一同攻克AI 技術難關,目前已賦能389 所高校,服務747 名教師,學分課培養10 萬餘名AI 學子。
阿里:M6-OFA +「通義」大模型系列
◼ 統一底座為基礎,建構層次化的模型體系
阿里巴巴通義大模型以統一底座為基礎,建構了層次化的模型體系,其中通用模型層涵蓋自然語言處理、多模態、電腦視覺,專業模型層深入電商、醫療、法律、金融、娛樂等行業。通用與專業領域大小模型協同,讓通義大模型系列可兼顧性能最佳化與低成本落地。
自2020 年起阿里先後發表多個版本的多模態及語言大模型,在超大模型、低碳訓練技術、平台化服務、落地應用等方面實現突破。通義大模型系列已在超200 個場景提供服務,實現了2%~10% 的應用效果提升。為加速大模型規模化應用,達摩院也研發了超大模型落地關鍵技術S4框架,百億參數大模型在壓縮率達99%的情況下多任務精度可接近無損。
通義千問發展歷程
◼ 關鍵技術開源,豐富合作生態
通義大模型系列中語言大模型AliceMind PLUG 、 多模態理解與生成統一模型AliceMind-mPLUG、多模態統一底座模型M6-OFA、超大模型落地關鍵技術S4 框架等核心模型及能力已面向全球開發者開源。
阿里通義大模型架構
華為:ModelArts + 盤古大模型
◼ 全端式AI 解決方案輔助AI for Industry & AI for Science
華為雲於2020 年內部立項AI 大模型,並於2021 年4 月正式對外發布盤古預訓練大模型,強調模型資料、網路結構、泛化能力三大核心設計。華為雲規劃「L0 基礎大模型-L1 產業大模型-L2 細分場景大模型」的發展路徑。 L0 階段的盤古大模型由NLP 大模型,CV 大模型、語音大模型、多模態大模型、科學計算大模型等組成,其中CV 大模型超30 億參數,預訓練時輸入10 億級圖像數據,兼顧影像判別與生成能力;NLP 大模型具備領先的中文語言理解與模型生成能力。 L1 階段,基於現有的產業基礎,華為雲推出盤古氣像大模型、盤古礦山大模型、盤古OCR大模型等行業大模型,能夠在L2 階段的煤礦場景下的瓦斯濃度的超前預警、氣象領域的天氣預報等多個細分場景實現落地。
華為雲聚焦全端式AI 解決方案,大模型與昇騰( Ascend ) / 鯤鵬晶片、 昇思(MindSpore)語言、ModelArts 平台深度結合,以算力底座、伺服器、全場景深度學習框架及開發平台共同助力大模型發展。
◼ 拓展產業鏈生態,賦能大模型
華為雲積極拓展產業鏈上下游生態,透過鯕鵬凌雲等合作夥伴計劃,在算力、軟硬體等方面建立生態夥伴網絡,為AI 大模型持續賦能,同時華為雲與下游廠商聯合發布行業解決方案,推動AI 大模型商業化落地。
華為雲盤古預訓練大模型架構
◼ 新一代HCC 高效能運算叢集為大機型提供底層支持
2022 年4 月,騰訊首次對外揭露混元AI大模型,協同了騰訊預訓練研發力量,以統一的平台實現技術復用和業務降本,支援更多的場景和應用。目前,混元AI 大模型完整涵蓋NLP 大模型、CV 大模型、多模態大模型、文生圖大模型及眾多產業與領域任務模型, 先後在MSR-VTT、MSVD 等五大權威資料集榜單中登頂,實現跨模態領域的大滿貫。目前,HunYuan NLP 1T 大模型已在騰訊多個核心業務場景落地,並帶來了顯著的效果提升。近日騰訊正式發布全新的AI 智能創作助手“騰訊智影”,推出了智影數字人、文本配音、文章轉視頻等AI 創作工具。
2023 年4 月,騰訊雲發布的新一代HCC高效能運算集群將為混元大模型提供底層支撐。新一代叢集基於自研星脈高效能運算網路及儲存架構,整合了騰訊雲自研的TACO 訓練加速引擎,大幅縮短訓練時間,節省訓練調校與算力成本。騰訊太極機器學習平台自研的訓練架構AngelPTM,也透過騰訊雲TACO 提供服務,幫助企業加速大模式落地。
◼ 使用者生態繁榮,促進模型迭代
騰訊在社群、閱讀、遊戲等領域擁有龐大使用者群體與強大生態,具有豐富的語料資源、資料累積與場景優勢。騰訊高級執行副總裁湯道生表示,騰訊正在研發類ChatGPT 聊天機器人,將整合到QQ、微信上。目前在智慧寫作、AI 繪圖、遊戲場景生成等方面都有新產品發布或迭代升級,有望助力其大模型在自有生態中快速迭代成長。
騰訊HunYuan 大模型全景圖
名詞解釋
(AI雲原生智慧算力架構)