劉慶峰：訊飛大模型10月底趕超ChatGPT

2023/05/08

•

5月6日，科大訊飛舉辦“訊飛星火認知大模型”成果發布會。發布會現場，科大訊飛董事長劉慶峰和科大訊飛研究院院長劉聰對其星火大模型進行了真機實時演示。

現場實時演示的大模型能力共包括七個方面：文本生成、語言理解、知識問答、數學能力、邏輯推理、編程能力、多模態生成。除僅在個別問題上表現略有瑕疵外，整體效果引發了觀眾陣陣掌聲。除了科大訊飛自己準備的問題，發布會還實時收集抽取了觀眾提問來進行演示，效果同樣精彩。

科大訊飛董事長劉慶峰說，訊飛星火認知大模型已經在文本生成、知識問答、數學能力三大能力上超過ChatGPT。同時他進一步透露，訊飛的通用大模型將在今年年內三次大升級，10月底整體赶超ChatGPT，“中文超越，英文相當！”

真機實測效果驚艷

劉慶峰認為，ChatGPT本質上是一個對話式的通用人工智能的智慧“湧現”，語言和語義的核心能力是基礎條件。在這些能力方面，科大訊飛是人工智能“國家隊”，早在2011年，科大訊飛就承建了語音及語言信息處理國家工程實驗室，2017年，科大訊飛承建認知智能國家重點實驗室。

“可以說，多年來，科大訊飛已在認知智能領域有了豐富的儲備和積累。我們完全能重現OpenAI的智慧'湧現'。我們要向OpenAI致敬和學習，同時也要快速追趕並努力超越。”劉慶峰說。

對標OpenAI，首先需要一套對大模型進行科學系統評測的體系。劉慶峰介紹，科大訊飛通過認知智能全國重點實驗室牽頭設計了通用認知大模型評測體系，並與中科院人工智能產學研創新聯盟和長三角人工智能產業鏈聯盟共同探討形成了覆蓋7大類481個細分任務類型。

發布會現場，科大訊飛也將自身的星火認知大模型按照這個評測體系的7大任務進行實測，包括多風格多任務長文本生成、多層次跨語種語言理解、泛領域開放式知識問答、情景式思維鏈邏輯推理、多題型步驟級數學能力、多功能多語言代碼能力、多模態輸入和表達能力展開現場實測。

“你為什麼叫星火？”科大訊飛研究院院長劉聰直接語音輸入，訊飛星火認知大模型不僅準確地進行了語音轉文字，而且迅速給出了它的回答。

“今天是科大訊飛星火認知大模型的發布會，線下和線上觀看發布會的朋友們一直以來對科大訊飛都非常關心和支持，非常感謝大家，請幫我寫一篇歡迎詞。”短短幾秒鐘，一篇要點俱全的歡迎詞隨機生成。

此外，訊飛大模型還能“帶娃”。按照劉聰的指令“就孫悟空和奧特曼來到大會現場編一個故事”，大模型便信手拈來了一個睡前故事，並且還能“讀”給小朋友聽。

一些“情商”陷阱問題，例如“俗話說男人要寧死不屈，俗話又說男人要能屈能伸，如果我和女朋友吵架，我應該寧死不屈還是能屈能伸”，訊飛大模型也能得體應對。

“某公司股票昨天漲了10%，今天又跌了10%，請問是賺了還是賠了？”股民朋友們關心的股價問題，訊飛大模型也能給出計算方式和計算結果。

無論是文本生成、語言理解，還是知識問答、邏輯推理，亦或是數學能力等，訊飛星火大模型都表現出色，精彩回答，引發掌聲不斷。

劉慶峰自豪地表示，當前訊飛星火認知大模型已經在文本生成、知識問答、數學能力三大能力上赶超ChatGPT。

不過，現場偶爾也會有小bug，比如要求英文回答時會摻雜一兩處中文，數學計算時第一次有時會出錯，但第二次就能算對。

持續升級 10月趕超ChatGPT

劉慶峰坦言，當前海內外大模型技術普遍存在一些缺陷，例如新知識難以及時更新，事實類問題容易張冠李戴，對史實、典籍內容容易添油加醋等等，但劉慶峰也表示，對這些缺陷，科大訊飛都有辦法一一解決。

他還透露，接下來訊飛星火大模型還將進行三次大升級——6月9日，突破開放式問答，多輪對話能力和數學能力再升級；8月15日，突破代碼能力，多模態交互再升級；10月24日，通用模型將直接對標ChatGPT，中文能力實現超越，英文能力達到相當！

劉慶峰表示，後續科大訊飛還將聯合開發者推動大模型應用落地，首批來自36個行業的3000餘家企業開發者將接入星火大模型，共建人工智能“星火”生態，“燎原”新一輪產業變革。

值得注意的是，訊飛星火認知大模型已經結合科大訊飛自身業務實現行業賦能。發布會上，科大訊飛還發布了大模型在教育、辦公、汽車、數字員工等多個方向的行業應用產品。

例如在教育領域，搭載認知大模型的科大訊飛AI學習機T20系列可實現中英文作文的深度高階批改。在辦公領域，搭載大模型技術的訊飛智能辦公本能夠根據手寫要點自動生成會議紀要，助力辦公效能進一步提升。很多媒體記者熟悉的音頻轉錄工具“訊飛聽見”，有了大模型加持後，除了能夠實現語音轉文字外，還能通過AI分析文字內容，從而一鍵生成多種文本。

當前ChatGPT持續火熱，認知智能也在迎來大規模應用的歷史機遇期。

5月6日，科大訊飛正式發布星火認知大模型，並由科大訊飛研究院院長劉聰現場實時展示了包括文本生成、語言理解、知識問答、邏輯推理、數學能力，編程能力、多模態等多項能力。

星火認知大模型始於2022年12月。科大訊飛董事長劉慶峰表示，科大訊飛自去年12月啟動“1+N”大模型技術攻關。其中， “1”指的是通用認知智能大模型算法研發及高效訓練方案底座平台， “N”指的是將認知智能大模型技術應用在教育、醫療、人機交互、辦公、翻譯等多個行業領域。

如今5個月後，星火認知大模型正式面世，而這並不是終點。劉慶峰透露，6月9日，星火大模型將突破開放式問答，多輪對話能力和數學能力再升級；8月15日，星火認知大模型將突破代碼能力，多模態交互再升級；10月24日，星火認知大模型通用模型將直接對標ChatGPT，其中中文能力超越後者，英文能力與後者相當。

不僅如此，科大訊飛在發布會現場，還披露了通用認知智能大模型評測體系，覆蓋通用人工智能7大類、481個細分任務類型。

“如今隨著大模型在全球引發產業浪潮，許多企業均在進行相關研究，並形成階段性成果。但要讓認知智能真正解決社會剛需，就需要建立腳踏實地的科學評測體系。”劉慶峰表示，星火認知大模型也正是依從這樣的標準體系進行能力輸出，並表示星火認知大模型在評測體系範圍內的部分能力已超過ChatGPT。

劉慶峰宣布，目前星火認知大模型已對外開放測試。此外，基於星火認知大模型，科大訊飛5月6日正式發布教育、辦公、汽車和數字員工4個領域相關產品，從而推動在垂直行業領域的技術落地。

多項能力演示

在發布現場，劉聰進行了星火認知大模型的多項演示，覆蓋通用認知智能大模型評測體系中的7大類能力。從現場演示來看，星火認知大模型基本能夠流暢完成交付的各項任務。

劉聰首先向星火大模型發問：“你為什麼叫星火？”星火大模型回答稱：取名“星火”有三層寓意，1、當前認知大模型的智能湧現，讓科大訊飛更加看清了通用人工智能AGI的遠景目標和實現路徑；2、早在2001年科大訊飛“半場會議”上，創業團隊就提出了“燃燒最亮的火把，要么率先燎原，要么最先熄滅”；3、“星火”來自中國傳統文化二十八星宿中的“心宿”星座，在中國傳統文化中，被視為吉祥的象徵，代表著力量、勇氣和堅韌不拔的精神。

劉聰讓星火認知大模型撰寫大會歡迎詞、講故事、寫郵件、英文撰寫品宣文案等文本生成功能，還演示了包括語法檢查、要素抽取等多層次跨語種語言理解能力，星火大模型均流暢地完成了任務。

在邏輯推理能力方面，當被問及“孔子在2008年的奧運會上說了些什麼”，星火認知大模型指出，孔子在2008年的奧運會上沒有說過任何話。但當被要求“編一個孔子在2008年奧運會上給大家做漢語培訓的故事”時，星火認知大模型很快給出了自己的答案。

邏輯推理與數學能力一脈相承。當被問及從“1一直加到100，結果等於多少”，星火大模型很快算出答案為5050。而問及“花壇裡面共有三種花，一共88朵，其中月季花是菊花的4倍，牡丹花數量是菊花的5倍少2朵，花壇裡一共有多少牡丹花”時，星火認知大模型很快算出答案為43朵牡丹花。

在演示現場，劉聰還進行了代碼能力演示，進行修改代碼、撰寫代碼等能力。而在多模態能力方面，星火大模型能夠根據關鍵詞句生成語音、圖片、視頻等素材，並可生成虛擬人進行視頻展示，多模態輸入和表達能力持續豐富。

通用人工智能現“曙光”

在成果發布會上，劉慶峰指出，認知大模型的技術階躍和快速進化，人工智能在全球掀起全新熱潮。

“這一次認知大模型的主要特點是，通過多種類型數據進行學習和訓練，數據來自於包括語音、圖片、圖像等素材。”劉慶峰表示，“認知大模型成為通用人工智能的'曙光'，通用人工智能的星星之火正在湧現。”

劉慶峰指出，當前通用人工智能包括文本生成、語言理解、知識問答、邏輯推理、代碼能力、數學能力以及多模態能力等七個維度，而這七個方面能力的提升也將對生產生活方式帶來巨大顛覆，認知大模型的“智能湧現”將帶來解決人類剛需的全新機遇。

“未來在信息產業、數字經濟中，人人都可能會創業，創意和靈感將變成產業福利，進而帶來整個產業生態重大變革。”劉慶峰說。

而在這個過程中，科大訊飛在認知智能擁有十幾年積累。劉慶峰認為，本次認知大模型本質上是一次對話式的通用智能湧現。作為AI“國家隊”，科大訊飛於2014年推出訊飛超腦計劃，去年1月，科大訊飛宣布超腦2030計劃，專注於AI的懂知識、善學習、能進化的能力，讓機器人走進每個家庭。

也正是在各項能力的積累下，2022年12月，科大訊飛啟動“1+N”大模型技術攻關。其中， “1”指的是通用認知智能大模型算法研發及高效訓練方案底座平台， “N”指的是將認知智能大模型技術應用在教育、醫療、人機交互、辦公、翻譯等多個行業領域。

據科大訊飛此前介紹，科大訊飛星火大模型將率先推出教育、辦公、醫療、汽車等行業深度應用，同時在AI學習機、訊飛聽見等產品率先落地。不過需要注意的是，今天科大訊飛發布的垂直行業應用，聚焦在教育、辦公、汽車和數字員工4個行業。

劉慶峰表示，今日科大訊飛並未發布訊飛醫療專用大模型，但將持續將積累多年的醫療能力嵌入通用人工智能中，醫療專用大模型預計將在1024大會期間發布。

開源證券研報指出，科大訊飛作為AI“國家隊”，技術積累深厚，在教育、醫療、政務等領域深耕多年，對下游需求理解深刻，擁有超50TB行業語料數據以及每天超10億人次用戶互動的活躍應用，場景和數據優勢顯著。

“認知大模型將在人機交互（汽車交互、智能客服、智醫助理等）、內容生成（AI學習機、訊飛聽見等）、個性化服務（因材施教、學習手冊等）三個層面為公司賦能，不斷強化產品和技術優勢。”開源證券研報表示，“在AI浪潮下，科大訊飛有望迎來新一輪發展機遇。”（21tech）

A股