明年對標GPT-4!星火3.0高能進化,為AI注​​入靈魂

【導讀】 5個月前立下「超越ChatGPT」的flag,如今已實現。而且大會現場,董事長劉慶峰再度立下flag-2024上半年,星火4.0要對標GPT-4!

5月,科大訊飛立下超越ChatGPT的flag,如今,這個目標實現了!

科大訊飛1024開發者大會上,科大訊飛星火認知大模型3.0正式發表。

星火3.0的整體表現已經超越ChatGPT,部分能力已經與GPT-4旗鼓相當。


現在,星火3.0已經從七大維度全面提升,並且重磅升級了大模型的程式碼能力。

此外,現場全新推出了醫療大模型與訊飛曉醫APP、科技文獻大模型、AI答疑輔學和Al心理諮詢,以及與業界龍頭共同打造的12個產業大模型。

同時,科大訊飛還會聯合華為,進一步佈置算力底座。在此次大會上,基於昇騰生態的「飛星一號」平台正式發表。


就在飛星一號上,科大訊飛還會繼續訓練對標GPT-4的大模型。

沒錯,科大訊飛已經立下一個flag-2024年上半年,星火4.0要對標GPT-4!


星火3.0實測:全面對標ChatGPT


在2.0版時,科大訊飛董事長劉慶峰曾表示,目前大模型依然存在不少待攻克的技術缺陷。例如,新知識難以及時更新、事實類問答容易「張冠李戴」,以及史實、傳統典籍等容易「編造情節」。

這次,星火3.0在「指令跟隨、深度理解、主動對話、程式碼能力、個人化」方面,又有了進一步的升級。


根據國務院發展研究中心、國研經濟研究院橫評報告,星火大模型的綜合能力已超越了ChatGPT,在教育、醫療、法律產業的表現格外突出。


其中,星火3.0的中文能力客觀評測,已經超越ChatGPT;英文能力在對標ChatGPT的48項任務中,結果相當。


當然了,訊飛的星火認知大模型,目前距離GPT-4還有一些差距。


不過,在醫療、法律領域的中文知識和語言理解能力上,星火3.0還是可以小勝GPT-4的,分別為5.3%和4.1%。


基礎能力大升級

在數學領域,科大訊飛表示,星火認知大模型早在8月15日就已經超越了ChatGPT。

而升級後的星火3.0,目前已經可以透過觀察算式,總結規律了。


在小樣本學習上,如果給出運算規則,星火3.0就能用新規則解決問題。

這也給大模型的發展很多啟發。例如大模型在應用領域中,如果資料量不夠,能不能從小樣本學習?


在程式碼能力方面,星火3.0更是得到了巨大的提升。


例如,在程式碼的專案層級理解能力上,星火3.0可以根據純自然語言提示,用Python畫出要求的心形圖案,並在內部呈現出大大小小五顏六色星星。


在英文寫作上,星火3.0可以走native人設。


多模態能力驚人

訊飛星火認知大模型的多模態能力,首先就體現在大會現場所有操作都是依照語音命令進行的。

這次,星火3.0在指令跟隨和細節表達上又有了顯著提升。

例如告訴星火3.0,畫一隻武俠風的小貓咪,它畫出的小貓,相較於2.0時對武俠風有了更深的理解。


另一個令人印象深刻的演示,就是星火3.0的「有聲繪本創作助手」,讓我們能和孩子共創有聲繪本。

從「一隻充滿好奇心的小兔子開啟太空之旅」開始,星火3.0邊寫故事邊出圖,最後不僅完成了精彩的繪本,還能讀出繪本故事。







上下滑動查看

這個過程,無論是文字故事的脈絡連續性,或是主角的連續性,都依賴大模型的認知能力。


星火3.0的多模態識圖能力真的有這麼驚艷?小編來實測了一把。

果然,3.0一眼就辨識出了中科大的標誌建築圖。


再來一波微軟給GPT-4V的測試題。

老黃拿著新產品的圖,答對了。


麻婆豆腐這題,星火3.0不僅答對了,還給了食材。


多種插件加持

在實測過程中,小編也發現,星火3.0有了諸多插件的加持。


例如,在「PPT產生」外掛程式的加持下,它產生了一份非常精美的年終述職報告PPT模板。


用「Pro cessOn 進程開啟」插件,星火3.0可以繪製出清晰的流程圖。


AI助手-感情、人格終極進化

現在,1200萬星火用戶對認知大模型的更高期待會是什麼?

當然是希望它不僅能回答問題,還要能提出問題;不只要有知識,也要有個性。


現在,AI正向情感、人格演化。

而從知識到個性,AI人設都為訊飛星火注入了「靈魂」。

有了人設、性格之後,星火認知大模型對每個人,都是獨特的AI助手。


例如,讓星火3.0圍繞通用認知大模型,解放生產力,寫一篇發言稿,以教育和工業領域為例。

它的文風是中規中矩的。


而科大訊飛研究院院長劉聰希望能用自己的人設(喜歡講故事、打比方),就可以在「個人化助手」中,上傳自己的講話內容。


這時星火3.0的發言稿,就有了院長本人的風格,不再是一篇泛泛的發言稿,而是有了人情味。


我們甚至可以讓星火3.0用孔夫子的人設,發言以文言文為主。


發現友伴

這次升級,星火3.0也帶來了16種友伴人格,讓聊天更加幽默。

我們可以自訂自己想要的人格。


很多家長會遇到這樣的問題:自己給孩子說話,孩子不聽,但奧特曼說的話,他就聽了。

用星火3.0的友伴功能,就可以教育小朋友聽爸爸媽媽的話。



向諸葛孔明提問:「聽聞星火大模型再次升級,此模型是否能助我們一統三國?」

他回答:「星火大模型之妙,在其智慧之源。吾觀其能助人解惑,助力百業,亦可用於治國安邦。」



在星火3.0的「發現友伴」,有多愁善感的林黛玉,一統天下的秦始皇,稱霸宇宙的威震天,喜歡嘮嗑的居委會馬大姐,還有殖民火星的馬斯克…


問問唐三藏,如何才能看破紅塵?

他回答:並非簡單地拋棄世俗,而是要理解世間一切皆為虛空。


李白的理想是濟蒼生,安社稷。雖一時不遂,仍堅信天生我材必有用,千金散盡還復來。


而「矽谷鋼鐵人」解釋,自己之所以一直執著於殖民火星,是因為人類未來的居住地不僅限於地球,而是多行星的。

而他預測:人類在未來幾十年,就會走向地外星球了。




全新應用,遍地開花

相較於2.0,星火3.0在醫療、教育、工業、代碼、科學研究、辦公室等多個領域,升級了全新的應用功能。

在1024開發者節的主要論壇,訊飛曉醫APP、AI答疑輔學、AI心理諮商、AI同傳、影像產生與編輯、科技文獻服務平台都可以親身體驗。

碼農效率倍增

隨著星火3.0碼能力的升級,智慧編碼助理iFlyCode也獲得了巨大的提升。

它能更好地幫助程式設計師在程式設計過程中快速產生程式碼建議,並提高編碼的效率和準確性。


如果用傳統的開發方式,Windows到Linux跨平台移植20萬行程式碼,需要3個月。

而使用iFlyCode後,僅1個月就能完成了。


科學研究打工人利器

現場,專為科研打工人的設計利器也來了!

科大訊飛和中科院文獻情報中心共同打造了「科技文獻大模型」,學習了80T的大量資料。

全新工具能夠幫助科學研究工作者,進行成果研究、論文研讀、學術寫作。


例如,最近比較火的九章三號量子計算機,若你想了解這方面的研究,輸入「量子計算」。


然後,就得到了57篇與之相關的文獻,並且研究助手在右邊對話框中做了一個總結。


這麼多篇論文,即便是專業的學者,也得需要花幾天的時間完成閱讀。

而現在,「科技文獻大模型」有了綜述生成功能,選擇2021年以來的研究,就可以1分鐘產生概要了。


另外,論文研讀這個功能,能夠幫助你更詳盡地閱讀一篇論文。

舉個例子,拿OpenAI團隊在2022年發表的一篇論文「Training language models to follow instructions with human feedback」測驗。

選取文章後,就會看到左邊是論文原文,右邊頁面是對論文做了主要的總結,包括摘要、方法、概述。


甚至,你還可以對其進行提問,「介紹GPT模型系列發展歷程」,回答中還給出了不包含在論文中的內容GPT-4。

可以看到,借助星火大模型,可以產生沒有包含在文字內容,但也可以涵蓋外部內容的能力。


同時,你也可以要求它根據內容,建立程式碼。


在學術寫作中,對於中國科研打工人最厲害的能力,便是文檔翻譯、英文潤飾了。

首先,你可以上傳一份寫完中文文檔,然後選擇翻譯語種。

借助大模型的能力,更好地理解整個文章上下文,十幾秒鐘就完成了全文翻譯。


對於英文潤色,可以拿一段英文摘要去測試。

然後再與潤飾後的文字做對比,就會發現原來的內容Chinglish的感覺很嚴重,而修改後的​​語言變得更加道地。

在這個日新月異的時代,有數據統計,光是在AI領域,全球每天大約有84篇文章發表,若是每篇研究耗費10分鐘,就得需要14個小時才能讀完。

而現在,有了大模型的加持,星火科研助手快速把全國最新進展抓取出來,用綜述告訴你。

讓成果研究的效率提升10倍,讓論文研讀效率、學術寫作採納率提升了90%。


全球有350萬高校就讀的研究生博士生。

如果一個在校研究生,因為訊飛星火,能夠節省3個月的時間,可以想像得到,這將大大釋放中國的創造力、想像。


人手一個AI健康助手

前有ChatGPT發現了外國4歲男孩多年疑難雜症的病因,今有智醫助理將患者「疑似妊娠」的診斷修正為「先兆流產」,挽救了一個新生命。

1024大會上,科大訊飛也發表了全新醫療大模型,以及訊飛曉醫APP,希望為健康中國建設盡一份綿薄之力。


對每個人來說,都需要一個健康助手。

當你看病前,需要了解要不要去醫院,應該掛什麼科時;當你用藥時,還在考慮孩子、孕婦能不能吃、兩個藥可以一起吃的時候;還有體檢後,遇到體檢報告看不懂時。

都需要一個健康助手來幫助你。


此刻,訊飛曉醫APP的誕生,能夠為每個人打造專屬「AI健康助理」,為每一位醫生打造專屬的「診療助理」。

它集症狀自查、報告解讀、醫療資訊快速查詢、健康檔案管理等功能於一體,讓醫療流程更智慧化。

目前,它已經通過了中國第一個通過信通院、衛健委醫療大模型標準規範評估。

訊飛曉醫能夠透過預先對話,讓你對病情有一個簡要的了解。


還可以上傳抽血後結果報告圖,曉醫根據圖片資訊給予分析。


對於繼續就診的情況,曉醫會直接告訴你去醫院找專業的醫生看醫生。


又或者當你頭痛病犯了時,手邊有一盒藥,拍照後,透過與曉醫不斷地交流,得到適合治療方案。

要知道,每年幾乎有66億人去藥局,每次平均花費80元,若是針對一些處方用藥,大模型能夠提供諮詢,省了不少麻煩。


一般來說,體檢報告往往是單向的,機器給予的測評,並沒有綜合分析。

你可以發送自己的體檢報告,便能夠得到詳細的分析。包括需要立即就診的疾病風險,以及定期複查、日常關注都給標註了出來。


從性能的比較來看,訊飛星火醫療大模已經實現對GPT-4的超越。

不過,若要說100%準確率,即便頂尖專家也無法實現,只能在人機協作中共同前進。


AI健康助理訊飛曉醫,就是要讓你成為一個更懂自己健康,更有基礎醫學知識的人。




下一步,2024對標GPT-4

這一年,訊飛的超腦2030計劃,又有了最新的進展!

2022年,科大訊飛宣布啟動了「訊飛超腦2030」計劃,旨在讓人工智慧懂知識、善學習、能進化,讓軟硬體一體的機器人走進每個家庭。

對此,科大訊飛也制定了「三步走」策略。


而星火認知大模型不斷迭代升級,直接加速了「訊飛超腦2030」的進程。

這次,在1024大會上,科大訊飛公佈了這項計畫的最新成果——人形機器人首次亮相,是業界首個整合大模型+具身智慧的機器人。


科大訊飛機器人的誕生,是為了以人形機器人為牽引,進而推動「視覺-語言-動作」多模態具身大模型的發展。


它可以在園區運動,可以在虛擬世界中完成模擬。因訊飛的技術,讓機器人的腦力大為升級。


為了把大模型賦能更多生活應用場景,科大訊飛現場也發布了AI掃拖機器人。

它具備領先的家庭環境全場景感知及運動能力,透過多模態交互,精準避障讓掃地機器人在家庭常見的障礙物中靈活穿梭不卡困。


科大訊飛1024開發者大會上,科大訊飛董事長劉慶峰表示,大模型已經在千行百業賦能,是軟硬一體化賦能,是可以主動對話賦能,給定個人人設的賦能。

一直以來,科大訊飛都在強調生態的繁榮,才有人工智慧的大未來。

可以看到,「訊飛星火正日益成為解放生產力工具」。

截至目前,訊飛星火已有1,200萬用戶,為千萬用戶持續創造剛需場景價值。


同時,大模型的突破,讓訊飛開發者生態持續壯大。

自5月6日星火發布以來,訊飛開放平台新增143.4萬名開發者團隊,年增幅331%,匯集553萬AI生態開發者團隊。其中新增大模型開發者17.8萬。

現在,科大訊飛正與10w+企業用戶,用星火共創應用新體驗。


而大模型,也顯著降低了開發者的創業門檻。


另外,科大訊飛也即將發布金融、汽車、營運商、工業、住鍵、物業、法律、科技文獻、傳媒、政務、文旅、水利十二個產業大模型。


現在,大模型時代的序幕才剛拉開,到2026年,80%的企業都會用到生成式AI,而現在,這個比例才只有5%。

產業生態還要持續完善,利用場景還要不斷深化,而科大訊飛,還會不斷為通用人工智慧解放生產力、釋放想像力。(新智元)