3月29日-30日,2025正和島案例共學大課·安徽站在合肥舉辦,本次大會以“贏在AI+,與趨勢共舞”為主題,300餘位企業家齊聚合肥,共同探討企業家如何馭勢而上,企業如何借AI實現價值躍遷。
在大會上,科大訊飛董事長劉慶峰做了分享,“如果今天不讓自己的企業和生命運行在大模型之上,大機率現在所有靠人力和市場的商業模式都會在一兩年內被徹底顛覆掉。”
他從大模型的發展階段出發,提出目前大模型還有很大的增長空間,並分享了科大訊飛作為唯一國產範圍建構的自主可控大模型如今的發展情況,以及未來準備為企業提供的服務。
以下內容為本次演講內容精編,希望對你有所啟發。
口 述:劉慶峰 科大訊飛董事長
編 輯:一釐米
來 源:正和島(ID:zhenghedao)
各位企業家朋友,大家好。我將從兩個角度做個分享。
首先,我們如何看待當前技術發展的趨勢,以及下一步產業可能帶來的變革性影響。其次,企業如何抱團,如何發展AI。
今天的底座大模型實際上還有很大的增長空間。
大家都知道,DeepSeek在春節前出圈,隨後OpenAI o1將其升級為o3-mini,最近又出了GPT-4o的升級版本,對圖片的理解、邏輯推理與創造力都有所提升。
在矽谷,其實還有一個比OpenAI更難進的公司Anthropic,它有很多物理學博士,那些天才們都特別想加入。
它的CEO Dario Amodei發了一篇長文,大膽預言:兩年內,“強大AI”將達到諾獎級智商水平。
目前大家對通用人工智慧發展大致分為幾個階段,雖然各個角度不同,但是基本認知相對一致。
第一步是對話者。通過對話控制人工智慧,只要進行語言提示,就可以激發他們學習、記憶、訓練內容。
第二步是智能行動者,可以完成相關指令的工作。
第三步是智能體,它可以自動聽懂你的指令,並將其分解成相關任務,找到每個任務完成所需的工具,之後再對接內部和外部信源,將它們組合起來完成任務。
第四步是創新者,不僅可以完成既定工作,還可以自己創意和創新。
第五步是組織者,到後期它就具備整合社會要素資源整和調度能力,大致分為這幾個階段。
目前,我們基於大模型,為央國企業做了很多智能體平台。
他們不需要程式設計,只需要理解場景並提出要求,我們會自動幫助他申請相關工具。中國能源通過這種方式已經有50多個非常優秀的智能體工具在全集團內部使用。
其最大意義在於隨著大模型語言理解能力和程式設計能力的提升,我們已經擁有越來越多專項的人工智慧技術。因此,智能體平台在下一個階段對各企業非常關鍵。
在第四個階段中,創新者是什麼概念?前年中央經濟工作會議上明確提出,要將科技、人才、教育三位一體,並在經濟工作中排名第一的是創新。
目前全球範圍內非常清楚的是,AI for science大模型是未來創新的最重要的助推器和底座支撐。去年諾貝爾化學獎和物理學獎分別頒發給了大模型與人工智慧相關的科學家。
我給大家舉個例子,中國科學技術大學生命學院的劉海燕教授團隊,要做蛋白質的結構預測,生成活性蛋白質。原來需要6個月做的實驗,現在借助科研大模型一天就做完了,已經做出48個活性蛋白質,並且在《Nature》上發表文章。
再比如合肥的“人造小太陽”,它通過技術途徑解決能源的問題。原來做模擬實驗時,要把粒子加速到一定速度,產生聚變反應發出能量,達到一定高度可以留存1000秒。
原來做模擬實驗需要10-20天,現在用AI幫它做一次實驗只用一個小時,原來10-20天的實驗成功率93%,現在一個小時成功率97%,極大提升了科研效率。
所以有人說今天如果科研不用新的人工智慧工具,就是原來的農業水平階段。
到工業階段,會將大量優秀的、有創新能力的年輕人從簡單、重複的科研活動中釋放出來,就像我們原來做天體研究一樣,如果發現一個新的行星,那導師招博士時不敢招太多人,因為那有很大的運氣成分,你可能一輩子都沒找到一個,那博士就畢業不了。
現在大模型可以把大海撈針變成茶壺裡倒茶葉,利用人工智慧可以加速現有科研從農業到工業階段。
但這還是用現有的技術,加速科研方式,減少重複性的科研勞動,仍然屬於人工智慧的第二和第三階段。
第四階段就是創新,雖然我不清楚路徑,但是我可以給很多新的關於科研的啟發。這些科研是腦洞大開的,有可能都沒有人做,很多時候是我們自己都沒想到的。
目前我們正在與中國科學院大連物理化學所和中科院非常有名的院士合作,與他們做化工大模型,不僅將現有技術路線明確為相對清晰的科研方向,使研發效率大幅提升,同時幫助他們創造更多可能的創新方法。
最後一個階段就是組織者,現在有一點小苗頭,雖然不能完全替代人類,但是兩個機器人協同工作,能夠組織社會資源,開始組織協同性工作,更複雜地建構整個任務體系。
在這條發展的路上,大模型的天花板仍然被持續打開。所以Anthropic的CEO表示到2026年,有可能達到諾獎級。
從第二個階段的智能者到第四個階段的創新者,正在不斷進步,這個進步並不需要依靠新的不可預知的演算法或者腦機介面、類腦計算等,而是用預訓練和強化學習兩種方法。
強化學習是針對已有的學完的內容,在特定任務中自己相互PK,有的是人參與,有的是完全依靠自己。例如AlphaGo下圍棋,要學幾千萬張棋譜,後來自己與跟自己對弈,一周後就能擊敗所有世界冠軍。
所以通過預訓練和強化訓練兩種方法,大模型的自主進化在未來2-3年內還有巨大的提升空間,天花板非常之高。
去年底有人說今天不用做底座大模型,而是要做行業落地。科大訊飛一直強調我們必須在底座模型上繼續前進,因為它的空間潛力巨大。
在這個底座上,中國的基本架構相當清晰,大概頭部就是幾家公司。
現在最火出圈的是DeepSeek,在工程化上有很多積累,他們專注做語言模型,而且開源,做的確實相當不錯。訊飛主要是在語音、圖片、視訊、多模態上。
國內還有像豆包、騰訊元寶等也都做得很好。
但今天大模型落地實際上已經開始出現了不同的戰略角度,有的專注於娛樂、電商、開源,有的專注於其他領域。
我們在2023年5月6日推出訊飛星火1.0,我們的口號就是解放生產力,釋放生產力,我們是“1+N”,底座模型必須自己掌控,才能不斷地在上面做更好的強化訓練,更好的升級,然後“N”是我們落地的。
我們現在與教育、醫療、司法、央國企、汽車、金融、能源等的落地都是行業第一。
去年我們央國企招標數比前年多了15個億,招標金額多了7.2倍,我們是中標第一,超過第二名到第六名加起來的水平。
為什麼?因為今天主流的全民可下載的通用大模型,除了星火以外,其他全是由輝達的卡訓練的。
2022年美國規定中國的卡要限高限寬,所以美國人用A100,中國只能用閹割後的A800,結果2023年美國的政策更加嚴格,不光中國買不了,可能給中國做中間地帶輸送算力的四十幾個國家業全被堵死了。川普上台以後,可能這些智算的訓練卡全部會被限制。
晶片方面,原來我們可以使用12奈米、16奈米的晶片,例如三星、台積電,生產完成後,可以利用晶片堆疊技術堆到7奈米以下的性能。
目前這條路從今年一二月份開始已經被堵死。
因此在這個背景下,中國是否有自主可控的國產算力支撐大模型訓練非常關鍵。
大模型對算力最重要的兩個地方,一是訓練,二是推理。訓練就像我們學習,學會後參加高考,參加博士考試,然後工作。學的過程中訓練的難度極大,訓練完成後對外提供服務的推理相對簡單。
2023年10月24日,我們在合肥建了中國首個萬卡的國產算力,華為910B,當時對標美國的算力只有百分之二十幾的效率,人家三個月而我們要一年多,所以2023年一年我們在國產算力上發力,把它從對標美國A800做到A100的能力從百分之二十幾提升到90%。
我們去年1月30日推出中國首個用國產算力訓練出來的千億大模型,訊飛星火3.5。
為什麼大家都不願意用國產卡?輝達每一個新的工具出來,在國產上少則一周,多則需要一個半月做各種適配。
其實我們去年10月份就跑通了深度推理和長思維鏈的模式,但是在國產算力上整整花了兩個月把各種工具匹配好,才能夠進行訓練。
2025年1月15日,訊飛星火X1發佈,是首個用國產算力訓練出來的長思維鏈模型,但是R1是671B,我們只有13B,因為時間太短,國產算力剛剛把資料調完。
到了3月3日,我們用70B在數學上已經達到R1的效果,比它低一個數量級,數學跑通了,長思維鏈的邏輯就全通了。
但我想說的是這個事情在國產算力上要把它跑通,有特別多的坑。如果中國沒有一家企業做,我們的大模型又會回到當年和英特爾CPU一樣,龍芯出來了,可是誰都不用,中國芯就永遠發展不起來。
因此在國產戰略上,我們必須認真對待,無論多困難,耗費多大的算力,都必須堅定不移地繼續前進。
在當前的態勢下,我認為大家應該特別關注底座大模型的快速發展。如果現在底座模型達到70分、80分,那麼兩年後可能達到80分、90分,甚至可能達到諾獎等級,在專業領域進行科研。
再到場景定製,在提升5到10個點,達到95分、100分,到時候它就可以獨立完成任務。
原本人機協同需要1萬人完成,現在只要100人就能完成。
但是只靠通用大模型還不夠,幻覺問題解決不了,最近有第三方機構測的,比如大家都知道的DS,我覺得它提升了中國社會各階層對自主創新的自信心。
但是拿DS作為例子來說,V3的幻覺是百分之三點幾,R1是百分之十幾,因為它用強化學習用的訓練資料更少。所以必須要在大模型底座能力上結合專業行業資料,而且能夠外掛企業自己的即時產生的各種資料和支援,才能把幻覺降到能用的門檻,否則沒法使用。
所謂的第一眼驚豔到我們企業的研產供銷服管產品落地,必須要做定製化。
今天的大模型在C端的使用者數量春節前後已經達到2.49億,已經跨越技術規模化應用的鴻溝。
早期創新者的佔比為2.5%,探索型早期嘗鮮者佔比是13.5%,跨越16%後就可以進入規模化爆發階段。
所以2025被稱為全民AI的時代,成為全行業AI應用的拐點。
那麼在這個時候,大家如果不讓自己的企業和生意運行在大模型之上,大機率現在所有靠堆人力和時長的商業模式都會在一兩年內被徹底顛覆掉。
關注這個變化不應該盲目地被焦慮感推動,而是要客觀地分析自己的每一個業務環節,研產供銷服務各個場景,認認真真地去建構平台,因為業界開源越來越多,有非常多的單點的整合的各種工具,大家可以去嘗試。
現在底座模型7大方面已經有1000多個細分的維度,雖然應用場景我們自己的探索不如全行業在開源上做的多,但是科大訊飛今天必須是運行在AI之上的微軟公司。
原來我們給央國企、金融與汽車這些行業龍頭做方案,下一步我們要把這些能力開放給所有人使用,你不用自己建算力,直接租用服務就行。
甚至我們跟工業園區聯合部署大模型,根據大模型成效合作分潤。
所以我覺得我們第一,大家要關注這個業務,找到切入點。第二,我們正在與許多城市合作建構智算生態,例如成都、武漢、無錫、蘇州和溫州。
訊飛是唯一國產算力建構的自主可控大模型,未來中國的城市生態既服務於本地的創業,又服務於本地產業發展,他們都需要建構以算力和底座大模型算力支撐的產業生態。
如果大家利用算力,要借助這些生態,這些城市會發放優惠券並且打折,有公共平台吸引大家。我認為我們可以通過這方面拓展技術賦能和行業經驗,共同站在AI的平台上共同發展。
謝謝大家。 (正和島)