時間撥回到今年5月6日,星火認知大模型剛發佈時,「國產大模型追上chatGPT還要多久」成了一個熱議的話題。當時,科大訊飛董事長劉慶峰向外界展示了這家有著24年歷史的AI龍頭企業在大模型浪潮中清晰的發展時間表——到10 月24 日,也就是昨天,科大訊飛要開發出中文程度超越ChatGPT,英文程度與之相當的大模型應用。
“我們如期兌現了自己給大家的時間表。”
在合肥體育中心內,現場座無虛席,會場兩側都站滿了人。在昨天舉辦的2023科大訊飛全球1024開發者節上,劉慶峰宣布了訊飛星火認知大模型V3.0版本(以下簡稱:星火V3.0),兩個多小時的現場分享中,劉慶峰一如既往地語調洪亮。
星火V3.0在文本生成、語言理解、知識問答、邏輯推理、數學能力、程式碼能力和多模態能力7大方面都有了顯著的提升。根據國務院發展中心國研經濟研究院的橫評報告,星火大模型綜合能力已超越ChatGPT,實現國內領先,國際一流,且在教育、醫療和法律行業表現尤為突出。
半年內完成大模型能力的三次大升級,這是科大訊飛交出的大模型答案。而與華為的合作成為了這場發表會的另一個重要觀點。
在同日的發表會上,劉慶峰官宣了與華為最新的動態,科大訊飛聯合華為打造了基於昇騰生態的自主可控大模型算力底座「飛星一號」平台,訊飛星火大模型將在下一階段開啟對標GPT-4的更大規模訓練。
大半年來,訊飛華為的生態合作,是當下國產大模式加速競爭下的新趨勢。頭部科技企業之間,基於各自生態位的合縱聯橫和強強合作,既能形成技術與業務間的互補,又能加速大模型的商業化與行業化落地。
我們好奇的是,這項聯手合作將對中國大模型的未來有什麼深遠意義?
一個業內的共識是,由ChatGPT引爆的“百模大戰”至今,中國國產大模型已從“卷參數”進入了“卷應用”,紅衫資本在近期的一份研究報告中也指出,當下的大模型競逐進入第二階段,比起技術,更強調產品體驗與應用形態。
一位中國頭部券商傳媒領域分析師曾對財經無忌分析:“中國科技公司最擅長的場景與應用,移動互聯網時代已是存量博弈,大模型時代會更有機會。”
但進入「應用戰」後,橫亙在國產大模型眼前,也有看得見的兩道關卡:
一是,成本難關。在暴漲的算力需求下,隨著AI大模型加速商業化部署,需要高功率、高算力的基礎設施。大模型研發高度依賴高階AI晶片、群聚及生態,不斷攀升的算力成本,讓許多企業只能「望模興嘆」。
二是,應用難關。不同產業場景中企業和開發者,對於大模型的和使用方式有不同的差異,如何進一步降低大模型的使用門檻,讓大模型真正用起來,需要國產大模型廠商找到高頻剛需的應用場景,打造殺手級應用。
而訊飛與華為的攜手,本就是為了紓解上述國產大模型的燃眉之急。
首先,華為有更強的算力基礎。華為此前已宣布,昇騰AI集群規模已從最初的4000卡集群擴展至16000卡,是業界首個萬卡AI集群,擁有更快的訓練速度和30天以上的穩定訓練週期。
其次,科大訊飛也有更強的大模型能力。作為一家人工智慧龍頭企業,一方面,科大訊飛有著強大的演算法優勢與清晰的技術路徑。
另一方面,對場景的理解能力,不同於其他大模型廠商,科大訊飛思考的不只技術,而是前沿技術開發與商業化的並進。
星火認知大模型迭代至V3.0版本,科大訊飛在現場重點展示了星火V3.0在數學能力、小樣本學習、程式碼能力、英語能力和多模態能力的提升。
以英語能力與多模態能力為例,星火能自如地進行更native的英文閱讀、寫作與潤飾。而在多模態能力上,星火現場製作起了兒童繪本,能夠跟隨地根據prompt生成更多細節與故事性的圖案。
正如上文所說,科大訊飛在創業的24年中,已形成了研發與商業化並行的路線。因此,每一次隨星火認知大模型同時能力迭代的,是科大訊飛一系列的產品與產業方案的升級。
在現場,科大訊飛發布了星火V3.0的能力整合與部署進一系列賦能產業與場景的商業化產品中,這之中既包括了一系列落地於教育、辦公、醫療等產業場景的AI原生應用,如全新升級的iFlyCode2.0(智慧程式助理),與中科院文獻情報中心共同打造的星火科研助理、教育領域的AI心理夥伴、醫療領域的曉醫助理等,也包括了直面C端的智慧硬體產品,如具備英語AI答疑輔學的訊飛AI學習機、面向未來的人形機器人等。
這是科大訊飛有別於其他網路大廠的獨到優勢。多年創業路上對人工智慧技術商業化的思考以及服務政企、教育等客戶的經驗,讓科大訊飛具備了更快地將前沿技術結合前端市場需求,進行變現的能力。
科大訊飛很早就提出了「1+N」架構,對於大模型與產業結合,有自己一套清晰可見的佈局。訊飛研究院院長劉聰曾在訪談中表示,大模型與業界的結合,不是單純把大模型的能力API調過去就能用,而是要具體設計產品功能,並且要結合用戶的需求。
當方向正確清晰,路徑與方法論就自然形成,焦慮也就化為了動力。
劉慶峰坦言,在chatGPT橫空出世之時,身邊很多人都十分焦慮:「擔心我們的技術會差。」。
但訊飛華為基於各自優勢領域的互補與協同,從供給與需求兩側,能更務實地解決當前國產大模型所面臨的焦慮。
一方面,在供給側,以華為昇騰AI為核心,軟硬體協同優化,訊飛星火認知大模型在算力層構建了性能更優越、供給更穩定和數據更安全的大模型訓練集群,為大模型的深度應用提供了自主創新的算力底座。
另一方面,在需求側,訊飛星火認知大模型的技術優勢與場景理解能力,本身也能高效適配昇騰AI,進而降低大模型使用門檻,加速產業落地。
而在劉慶峰看來,另一重關鍵意義則是縮短國產大模型與GPT-4之間的差距。
「中國現有的大模型根基實力,與GPT-4仍有差距。」劉慶峰坦言,在複雜知識推理、小樣本快速學習、超長文本處理以及跨模態的統一理解上,國產模型還有不小的差距。
只有正視差距,才能實現超越。這次訊飛與華為攜手,無疑也將為訊飛星火等國產大模型在下一階段對標GPT4,實現超越,做好更長期準備。
從科技的演進與發展史來看,一個顛覆不破的規律是,顛覆性的技術從實驗室走向普惠,強強聯合遠比單打獨鬥效果要好,過去科技巨頭們的經驗已印證了這一觀點。
在PC時代,微軟和英特爾曾為推動個人電腦產業的發展,組成了Wintel聯盟,英特爾的硬體優勢與微軟的軟體生態結合,雙方協同創新,最終拉動了產業的升級,大大促進了個人電腦效能的提升與使用者體驗的升級。
在行動革命掀起時,早期蘋果之所以能重新定義消費性電子產品,背後離不開與晶片設計公司ARM的深度合作。
訊飛與華為所形成的國產AI生態合作,也是如此。超越零和博弈的競爭思維,尋求技術落地的破局點,上述案例已然印證了,「強強聯合」往往能引領一個時代的發展。
大模型的誕生第一次讓人瞥見了通往AGI世界的可能,但大模型能力的進化必須依賴更先進的算力底座,而算力底座從能用到好用,必須依賴成熟大模型廠商的協同,沒有使用,就不能形成規模優勢,形成資料飛輪,就無法均攤算力底座高昂的技術投入。
今年8月中旬,科大訊飛聯合華為推出了大模型算力硬體「星火一體機」。一體機的特點是可以私有化部署大模型,讓所有企業都可以在國產自主創新平台上私有化部署大模型。
1個月後的華為全聯接大會上,劉慶峰在演講中透露了與華為的進一步合作。而在昨天,科大訊飛聯合華為正式推出基於昇騰生態的自主創新大模型算力底座「飛星一號」平台,支持訊飛星火大模型在對標GPT-4之路上,實現更大規模的訓練。
「科大訊飛敢於對標ChatGPT 並超越,讓人們對中國大模型時代快速發展的未來充滿信心」。據華為科技有限公司副董事長、輪值董事長徐直軍透露,發布「飛星一號」平台,讓星火的訓練效果翻倍。
要超越ChatGPT 並不容易,但這是國產大模型必須要走的關鍵一步,也是中國大模型生態演化的關鍵一步。
從更深遠的價值來看,訊飛華為聯手,實則在更加嚴峻的逆全球化趨勢下,為國產大模型發展提供了一條自主創新的路徑,也為全世界的大模型發展提供了第二選擇。
「訊飛華為攜手,不僅是中國企業的相互抱團,更是為世界提供第二選擇。」劉慶峰說。
從先前美國商務部工業安全局多次針對中國算力產業鏈的製裁就能看出,無論是將關鍵企業列入實體清單,或是升級管制規定,本質上都是延緩中國技術的發展速度。
在大模型技術爆發的當下,中美也掀起了新一輪技術軍備競賽,儘管仍舊存在著差距,但在此輪技術升級中,中國科技企業也並非是倉促應戰。
根據財經無忌觀察,中國大模型生態為實現真正的自主創新,主要沿著兩條路徑:一是產業鏈關鍵環節的自研,例如自研晶片、框架、工具鏈等;二是透過擴大生態,國產大模型廠商與自主創新的算力底座結合,共同培育本土產業鏈生態。
後者無疑更有未來,產業意義更大。國際產業鍊錶現所展現的不確定性,倒逼中國企業必須認清現實。一方面,在智算資源部署上,如華為一樣的科技公司將AI算力做精、做實。
另一方面,而在模型具體能力升級上,如科大訊飛一樣的人工智慧企業也在透過不斷的技術投入與躍升的產品能力,加速大模型落地產業。
劉慶峰在現場分享了一個訊飛華為的細節小故事。為了更快地建造算力底座,推出“飛星一號”,華為派遣了員工入駐到訊飛合肥總部,組建“聯合特戰隊”,整個合作過程中,雙方團隊都出了許多心血。
「隨著核心技術的突破,產業生態的持續完善,利用場景的深化,訓練資料的打磨,大模型時代的序幕才剛拉開。」劉慶峰對國產大模型的未來做出這樣的判斷。
毫無疑問,大模型賦能千行百業將是一場硬仗,但只有自主創新才能真正超越。訊飛華為所選的無疑是一條更難的路,但也是一條更廣闊的路。(財經無忌)