打通AI「任督二脈」,中國自研通用大模型「砭石」實力邁向AGI


全球領先AI公司智慧眼發布了自研的通用大模型-砭石,海量代碼文本資料訓練後展現出強大的湧現能力,不僅能實現代碼生成,韻律創作,甚至是多模態AI理解效果驚人。

每一次關鍵技術取得通用化的突破,都會深刻改變生產方式,並顯著提升生產力水平,而「大模型」成為了打通人工智慧技術通用性「任督二脈」的關鍵。智慧眼,作為全球領先的人工智慧企業,最近推出了其創新研發的通用大模型——砭石。

AI正從感知智能、認知智能向決策智能快速迭代演進。

在1.0時代,感知智能中以計算機視覺為代表,即基於深度學習算法,賦能計算機理解數字圖像和視頻,智慧眼正是在這個時候構建了機器視覺大模型,並在IDC的中國人工智能之電腦視覺應用市佔排名中進入前七,榮獲中國智慧科學技術最高獎-吳文俊人工智慧科技進步獎。

2.0階段,認知智能將從認知心理學、腦科學及人類社會史中汲取靈感,並結合跨領域知識圖譜、自然語言處理、因果推理等技術,建立穩定獲取和表達知識的有效機制,智慧眼發布了人工智慧中台和大數據中台產品,實現了從感知智慧到認知智慧的跨越。

到了3.0時代,AI+X成為前沿方向,需要採用海量的高品質通用資料訓練一個基礎的底座,再針對不同的場景,利用少量的專業資料進行微調,實現低成本的AI場景落地。

智慧眼研發了通用大模型砭石,該模型基於嚴格審核過濾的海量多模態資料訓練,透過「預訓練+精調」模式帶來了新的標準化AI研發範式,實現AI模型在更統一、簡單的方式下規模化生產,支援多種任務執行。


大模型產生程式碼,砭石透過對開源程式碼資料集進行多次清洗,得到高品質的程式碼資料集,隨後透過預訓練和CoT訓練等方式,使得大模型具有強大的程式碼生成和推理能力,大大提高了軟體開發的效率和品質。


大模型寫作能力,砭石大模型在更多參數和更複雜的結構基礎上,使用海量的通用文本型數據進行預訓練,學習了大量通用知識和邏輯,表現出了強大湧現能力和學習能力,生成了富有韻律、節奏和情感表達的詩歌。

砭石大模型基於自然對話方式理解和執行任務,提供多種能力包含文字、圖像、視訊、音訊輸入,產生式輸出文字訊息,具備閒聊和知識問答能力,可以為情感陪伴、政策問答、大數據分析等場景賦能。


三大核心技術賦能,新一代大模型順勢而出

大模型的創新,遠不止於模型本身的革新,其更深層地仰賴人工智慧領域中的各項核心技術突破。

在這方面,智慧眼公司擁有顯著的優勢,其在知識圖譜、智慧大模型以及隱私運算等關鍵技術上,都擁有自主研發的核心演算法和獨立的智慧財產權,這為通用大模型創新提供了堅實的基礎。包括:

  • 在知識圖譜方面:公司突破保護隱私的分散式知識遷移和聯邦圖譜推理,接入差異化的大規模行業數據,構建世界一流的高可信高質量的海量數據知識圖譜,為知識圖譜緩解大模型幻覺奠定基礎。
  • 在智慧大模型方面:公司突破了隱私計算條件下的大模型聯邦訓練、基於知識圖譜的大模型知識增強等核心技術,顯著提升大模型在專業領域的資訊產生準確度。
  • 在隱私運算方面:突破了保護隱私的分散式知識遷移和聯邦圖譜推理技術,實現對高價值用戶的敏感隱私資料的脫敏,真正做到資料的「可用不可見」安全應用,實現分散式知識的融合和基於分散式資料的大模型訓練,支撐了用戶資料價值的釋放。


四大基礎模型融合,共同塑造超強通用能力

智慧眼砭石大模型的核心定位是為各行各業注入新的活力,採用完全的分層解耦設計,包括兩層:

  • 第一層為砭石通用大模型層,主要包括機器視覺、自然語言理解、多模態和認知4大基礎模型,為各種應用場景提供相關的AI基礎能力;
  • 第二層為產業大模型,基於一般大模型層,能夠整合產業用戶的自有數據,並訓練客戶的自有專有大模型。

透過這種分層的設計,智慧眼砭石大模型不僅提供了廣泛的通用能力,還能根據各行業的具體情況,實現高度個人化的賦能。

具體來說,基礎模型層麵包含:

  • 機器視覺大模型,「為機器植入眼睛與大腦」。此模型透過在大規模影像資料上進行訓練,可以實現各種視覺任務,能夠進行影像的分割和識別、分析影片等。
  • 自然語言理解大模型,「讓機器理解人類語言」。此模型基於數T Token的高品質語料訓練而成,能夠實現負責的自然語言處理任務。
  • 多模態大模型,「讓機器擁有豐富感官」。此模型透過對文字、圖片、視訊和音訊等不同儲存資訊載體的認知和理解,來模擬人與人之間的互動方式,為創新應用提供了堅實的基礎。
  • 認知大模型,「讓機器思考分析決策」。此模型能夠適應包含各類感測器等不同類型感知資料來源的輸入,實現對環境的理解與分析。

在產業大模型層面,砭石將涵蓋諸如醫療、醫保、金融、保險、政務、養老、教育多個專業領域,這些大模型的核心價值在於為不同產業的發展提供了強大的賦能。

總結來說,基礎大模型致力於攻克技術難題,深入探索通用性與泛化性;而產業大模型則透過深度融合產業資料與知識特性,為特定產業量身打造堅實的基礎。

基礎大模型為產業大模型的建置提供強大支撐,同時,產業大模型能夠結合實際應用場景與真實數據,為基礎大模型的進一步最佳化提供寶貴的回饋與滋養。

大模型堪稱人工智慧領域的重要里程碑。

展望未來,智慧眼將秉承持續創新的精神,引領AI技術發展浪潮,推動大模型技術如高山流水般洶湧澎湃,廣泛覆蓋醫療、醫保、金融、保險、政務、養老、教育等各行各業,從而為社會發展注入全新的、高品質的生產力。(新智元)