重磅!華為版ChatGPT,要來了!

6月4日消息,據最新報導,華為將發布一款直接對標ChatGPT的千億級大模型產品,名為“盤古Chat”!


據華為內部消息指,預計華為盤古Chat將於今年7月7日舉行的華為雲開發者大會上對外發布及內測,產品主要面向政府和企業客戶。

這意味在國產大模型“軍備競賽”中,繼阿里和百度之後,又一重要科技巨頭入局。

據悉,盤古大模型於2020年11月在華為雲內部立項成功。對於盤古大模型定位,華為內部團隊確立了三項最關鍵的核心設計原則:一是模型要大,可以吸收海量數據;二是網絡結構要強,能夠真正發揮出模型的性能;三是要具有優秀的泛化能力,可以真正落地到各行各業的工作場景。

根據華為公佈的一份論文數據顯示,華為盤古PanGu-Σ 大模型參數最多為1.085 萬億,基於華為自研的MindSpore 框架開發。整體來看,PanGu-Σ 大模型在對話方面可能已接近GPT-3.5 的水平。



公開資料獲悉,華為盤古大模型於2021 年4 月正式對外發布,後來又在2022 年4 月升級到2.0 版本。目前,AI 大模型中的NLP 大模型、CV 大模型以及科學計算大模型(氣象大模型)均已被標記為即將上線狀態。

據介紹,這是首個乾億參數中文預訓練大模型,CV 大模型則首次達到30 億參數。盤古CV 大模型業界最大CV 大模型、首次實現兼顧判別與生成能力、在ImageNet 上小樣本學習能力上的業界第一;盤古氣象大模型提供秒級天氣預報;紫東.太初是全球首個圖、文、音三模態大模型。

對於盤古大模型定位,華為內部團隊確立了三項最關鍵的核心設計原則:一是模型要大,可以吸收海量數據;二是網絡結構要強,能夠真正發揮出模型的性能;三是要具有優秀的泛化能力,可以真正落地到各行各業的工作場景。

根據華為雲高管的演講PPT 信息,目前華為“盤古系列AI 大模型”基礎層主要包括NLP 大模型、CV 大模型、以及科學計算大模型等,上層則是與合作夥伴開發的華為行業大模型。

華為雲官網顯示,盤古大模型由NL P 大模型、CV 大模型、多模態大模型、科學計算大模型等多個大模型構成,通過模型泛化,解決傳統AI 作坊式開發模式下不能解決的AI 規模化、產業化難題,可以支持多種自然語言處理任務,包括文本生成、文本分類、問答系統等等。



具體來看,盤古NLP 大模型首次使用Encoder-Decoder 架構,兼顧NLP 大模型的理解能力和生成能力,保證了模型在不同系統中的嵌入靈活性。下游應用中,僅需少量樣本和可學習參數即可完成千億規模大模型的快速微調和下游適配,這一模型在智能輿論以及智能營銷方面都有不錯的表現。(製造界)