明年對標GPT-4！星火3.0高能進化，為AI注入靈魂

2023/10/25

•

【導讀】 5個月前立下「超越ChatGPT」的flag，如今已實現。而且大會現場，董事長劉慶峰再度立下flag－2024上半年，星火4.0要對標GPT-4！

5月，科大訊飛立下超越ChatGPT的flag，如今，這個目標實現了！

科大訊飛1024開發者大會上，科大訊飛星火認知大模型3.0正式發表。

星火3.0的整體表現已經超越ChatGPT，部分能力已經與GPT-4旗鼓相當。

現在，星火3.0已經從七大維度全面提升，並且重磅升級了大模型的程式碼能力。

此外，現場全新推出了醫療大模型與訊飛曉醫APP、科技文獻大模型、AI答疑輔學和Al心理諮詢，以及與業界龍頭共同打造的12個產業大模型。

同時，科大訊飛還會聯合華為，進一步佈置算力底座。在此次大會上，基於昇騰生態的「飛星一號」平台正式發表。

就在飛星一號上，科大訊飛還會繼續訓練對標GPT-4的大模型。

沒錯，科大訊飛已經立下一個flag－2024年上半年，星火4.0要對標GPT-4！

星火3.0實測：全面對標ChatGPT

在2.0版時，科大訊飛董事長劉慶峰曾表示，目前大模型依然存在不少待攻克的技術缺陷。例如，新知識難以及時更新、事實類問答容易「張冠李戴」，以及史實、傳統典籍等容易「編造情節」。

這次，星火3.0在「指令跟隨、深度理解、主動對話、程式碼能力、個人化」方面，又有了進一步的升級。

根據國務院發展研究中心、國研經濟研究院橫評報告，星火大模型的綜合能力已超越了ChatGPT，在教育、醫療、法律產業的表現格外突出。

其中，星火3.0的中文能力客觀評測，已經超越ChatGPT；英文能力在對標ChatGPT的48項任務中，結果相當。

當然了，訊飛的星火認知大模型，目前距離GPT-4還有一些差距。

不過，在醫療、法律領域的中文知識和語言理解能力上，星火3.0還是可以小勝GPT-4的，分別為5.3%和4.1%。

基礎能力大升級

在數學領域，科大訊飛表示，星火認知大模型早在8月15日就已經超越了ChatGPT。

而升級後的星火3.0，目前已經可以透過觀察算式，總結規律了。

在小樣本學習上，如果給出運算規則，星火3.0就能用新規則解決問題。

這也給大模型的發展很多啟發。例如大模型在應用領域中，如果資料量不夠，能不能從小樣本學習？

在程式碼能力方面，星火3.0更是得到了巨大的提升。

例如，在程式碼的專案層級理解能力上，星火3.0可以根據純自然語言提示，用Python畫出要求的心形圖案，並在內部呈現出大大小小五顏六色星星。

在英文寫作上，星火3.0可以走native人設。

多模態能力驚人

訊飛星火認知大模型的多模態能力，首先就體現在大會現場所有操作都是依照語音命令進行的。

這次，星火3.0在指令跟隨和細節表達上又有了顯著提升。

例如告訴星火3.0，畫一隻武俠風的小貓咪，它畫出的小貓，相較於2.0時對武俠風有了更深的理解。

另一個令人印象深刻的演示，就是星火3.0的「有聲繪本創作助手」，讓我們能和孩子共創有聲繪本。

從「一隻充滿好奇心的小兔子開啟太空之旅」開始，星火3.0邊寫故事邊出圖，最後不僅完成了精彩的繪本，還能讀出繪本故事。

上下滑動查看

這個過程，無論是文字故事的脈絡連續性，或是主角的連續性，都依賴大模型的認知能力。

星火3.0的多模態識圖能力真的有這麼驚艷？小編來實測了一把。

果然，3.0一眼就辨識出了中科大的標誌建築圖。

再來一波微軟給GPT-4V的測試題。

老黃拿著新產品的圖，答對了。

麻婆豆腐這題，星火3.0不僅答對了，還給了食材。

多種插件加持

在實測過程中，小編也發現，星火3.0有了諸多插件的加持。

例如，在「PPT產生」外掛程式的加持下，它產生了一份非常精美的年終述職報告PPT模板。

用「Pro cessOn 進程開啟」插件，星火3.0可以繪製出清晰的流程圖。

AI助手－感情、人格終極進化

現在，1200萬星火用戶對認知大模型的更高期待會是什麼？

當然是希望它不僅能回答問題，還要能提出問題；不只要有知識，也要有個性。

現在，AI正向情感、人格演化。

而從知識到個性，AI人設都為訊飛星火注入了「靈魂」。

有了人設、性格之後，星火認知大模型對每個人，都是獨特的AI助手。

例如，讓星火3.0圍繞通用認知大模型，解放生產力，寫一篇發言稿，以教育和工業領域為例。

它的文風是中規中矩的。

而科大訊飛研究院院長劉聰希望能用自己的人設（喜歡講故事、打比方），就可以在「個人化助手」中，上傳自己的講話內容。

這時星火3.0的發言稿，就有了院長本人的風格，不再是一篇泛泛的發言稿，而是有了人情味。

我們甚至可以讓星火3.0用孔夫子的人設，發言以文言文為主。

發現友伴

這次升級，星火3.0也帶來了16種友伴人格，讓聊天更加幽默。

我們可以自訂自己想要的人格。

很多家長會遇到這樣的問題：自己給孩子說話，孩子不聽，但奧特曼說的話，他就聽了。

用星火3.0的友伴功能，就可以教育小朋友聽爸爸媽媽的話。

向諸葛孔明提問：「聽聞星火大模型再次升級，此模型是否能助我們一統三國？」

他回答：「星火大模型之妙，在其智慧之源。吾觀其能助人解惑，助力百業，亦可用於治國安邦。」

在星火3.0的「發現友伴」，有多愁善感的林黛玉，一統天下的秦始皇，稱霸宇宙的威震天，喜歡嘮嗑的居委會馬大姐，還有殖民火星的馬斯克…

問問唐三藏，如何才能看破紅塵？

他回答：並非簡單地拋棄世俗，而是要理解世間一切皆為虛空。

李白的理想是濟蒼生，安社稷。雖一時不遂，仍堅信天生我材必有用，千金散盡還復來。

而「矽谷鋼鐵人」解釋，自己之所以一直執著於殖民火星，是因為人類未來的居住地不僅限於地球，而是多行星的。

而他預測：人類在未來幾十年，就會走向地外星球了。

全新應用，遍地開花

相較於2.0，星火3.0在醫療、教育、工業、代碼、科學研究、辦公室等多個領域，升級了全新的應用功能。

在1024開發者節的主要論壇，訊飛曉醫APP、AI答疑輔學、AI心理諮商、AI同傳、影像產生與編輯、科技文獻服務平台都可以親身體驗。

碼農效率倍增

隨著星火3.0碼能力的升級，智慧編碼助理iFlyCode也獲得了巨大的提升。

它能更好地幫助程式設計師在程式設計過程中快速產生程式碼建議，並提高編碼的效率和準確性。

如果用傳統的開發方式，Windows到Linux跨平台移植20萬行程式碼，需要3個月。

而使用iFlyCode後，僅1個月就能完成了。

科學研究打工人利器

現場，專為科研打工人的設計利器也來了！

科大訊飛和中科院文獻情報中心共同打造了「科技文獻大模型」，學習了80T的大量資料。

全新工具能夠幫助科學研究工作者，進行成果研究、論文研讀、學術寫作。

例如，最近比較火的九章三號量子計算機，若你想了解這方面的研究，輸入「量子計算」。

然後，就得到了57篇與之相關的文獻，並且研究助手在右邊對話框中做了一個總結。

這麼多篇論文，即便是專業的學者，也得需要花幾天的時間完成閱讀。

而現在，「科技文獻大模型」有了綜述生成功能，選擇2021年以來的研究，就可以1分鐘產生概要了。

另外，論文研讀這個功能，能夠幫助你更詳盡地閱讀一篇論文。

舉個例子，拿OpenAI團隊在2022年發表的一篇論文「Training language models to follow instructions with human feedback」測驗。

選取文章後，就會看到左邊是論文原文，右邊頁面是對論文做了主要的總結，包括摘要、方法、概述。

甚至，你還可以對其進行提問，「介紹GPT模型系列發展歷程」，回答中還給出了不包含在論文中的內容GPT-4。

可以看到，借助星火大模型，可以產生沒有包含在文字內容，但也可以涵蓋外部內容的能力。

同時，你也可以要求它根據內容，建立程式碼。

在學術寫作中，對於中國科研打工人最厲害的能力，便是文檔翻譯、英文潤飾了。

首先，你可以上傳一份寫完中文文檔，然後選擇翻譯語種。

借助大模型的能力，更好地理解整個文章上下文，十幾秒鐘就完成了全文翻譯。

對於英文潤色，可以拿一段英文摘要去測試。

然後再與潤飾後的文字做對比，就會發現原來的內容Chinglish的感覺很嚴重，而修改後的語言變得更加道地。

在這個日新月異的時代，有數據統計，光是在AI領域，全球每天大約有84篇文章發表，若是每篇研究耗費10分鐘，就得需要14個小時才能讀完。

而現在，有了大模型的加持，星火科研助手快速把全國最新進展抓取出來，用綜述告訴你。

讓成果研究的效率提升10倍，讓論文研讀效率、學術寫作採納率提升了90%。

全球有350萬高校就讀的研究生博士生。

如果一個在校研究生，因為訊飛星火，能夠節省3個月的時間，可以想像得到，這將大大釋放中國的創造力、想像。

人手一個AI健康助手

前有ChatGPT發現了外國4歲男孩多年疑難雜症的病因，今有智醫助理將患者「疑似妊娠」的診斷修正為「先兆流產」，挽救了一個新生命。

1024大會上，科大訊飛也發表了全新醫療大模型，以及訊飛曉醫APP，希望為健康中國建設盡一份綿薄之力。

對每個人來說，都需要一個健康助手。

當你看病前，需要了解要不要去醫院，應該掛什麼科時；當你用藥時，還在考慮孩子、孕婦能不能吃、兩個藥可以一起吃的時候；還有體檢後，遇到體檢報告看不懂時。

都需要一個健康助手來幫助你。

此刻，訊飛曉醫APP的誕生，能夠為每個人打造專屬「AI健康助理」，為每一位醫生打造專屬的「診療助理」。

它集症狀自查、報告解讀、醫療資訊快速查詢、健康檔案管理等功能於一體，讓醫療流程更智慧化。

目前，它已經通過了中國第一個通過信通院、衛健委醫療大模型標準規範評估。

訊飛曉醫能夠透過預先對話，讓你對病情有一個簡要的了解。

還可以上傳抽血後結果報告圖，曉醫根據圖片資訊給予分析。

對於繼續就診的情況，曉醫會直接告訴你去醫院找專業的醫生看醫生。

又或者當你頭痛病犯了時，手邊有一盒藥，拍照後，透過與曉醫不斷地交流，得到適合治療方案。

要知道，每年幾乎有66億人去藥局，每次平均花費80元，若是針對一些處方用藥，大模型能夠提供諮詢，省了不少麻煩。

一般來說，體檢報告往往是單向的，機器給予的測評，並沒有綜合分析。

你可以發送自己的體檢報告，便能夠得到詳細的分析。包括需要立即就診的疾病風險，以及定期複查、日常關注都給標註了出來。

從性能的比較來看，訊飛星火醫療大模已經實現對GPT-4的超越。

不過，若要說100%準確率，即便頂尖專家也無法實現，只能在人機協作中共同前進。

AI健康助理訊飛曉醫，就是要讓你成為一個更懂自己健康，更有基礎醫學知識的人。

下一步，2024對標GPT-4

這一年，訊飛的超腦2030計劃，又有了最新的進展！

2022年，科大訊飛宣布啟動了「訊飛超腦2030」計劃，旨在讓人工智慧懂知識、善學習、能進化，讓軟硬體一體的機器人走進每個家庭。

對此，科大訊飛也制定了「三步走」策略。

而星火認知大模型不斷迭代升級，直接加速了「訊飛超腦2030」的進程。

這次，在1024大會上，科大訊飛公佈了這項計畫的最新成果——人形機器人首次亮相，是業界首個整合大模型+具身智慧的機器人。

科大訊飛機器人的誕生，是為了以人形機器人為牽引，進而推動「視覺-語言-動作」多模態具身大模型的發展。

它可以在園區運動，可以在虛擬世界中完成模擬。因訊飛的技術，讓機器人的腦力大為升級。

為了把大模型賦能更多生活應用場景，科大訊飛現場也發布了AI掃拖機器人。

它具備領先的家庭環境全場景感知及運動能力，透過多模態交互，精準避障讓掃地機器人在家庭常見的障礙物中靈活穿梭不卡困。

科大訊飛1024開發者大會上，科大訊飛董事長劉慶峰表示，大模型已經在千行百業賦能，是軟硬一體化賦能，是可以主動對話賦能，給定個人人設的賦能。

一直以來，科大訊飛都在強調生態的繁榮，才有人工智慧的大未來。

可以看到，「訊飛星火正日益成為解放生產力工具」。

截至目前，訊飛星火已有1,200萬用戶，為千萬用戶持續創造剛需場景價值。

同時，大模型的突破，讓訊飛開發者生態持續壯大。

自5月6日星火發布以來，訊飛開放平台新增143.4萬名開發者團隊，年增幅331%，匯集553萬AI生態開發者團隊。其中新增大模型開發者17.8萬。

現在，科大訊飛正與10w+企業用戶，用星火共創應用新體驗。

而大模型，也顯著降低了開發者的創業門檻。

另外，科大訊飛也即將發布金融、汽車、營運商、工業、住鍵、物業、法律、科技文獻、傳媒、政務、文旅、水利十二個產業大模型。

現在，大模型時代的序幕才剛拉開，到2026年，80%的企業都會用到生成式AI，而現在，這個比例才只有5%。

產業生態還要持續完善，利用場景還要不斷深化，而科大訊飛，還會不斷為通用人工智慧解放生產力、釋放想像力。（新智元）

從這裡可透過《Google 新聞》追蹤鉅亨號創作者