#GLM-Image
不到24小時登頂全球第一!首個全程使用華為AI晶片訓練的大模型來了
近日,智譜AI最新發佈的多模態大模型GLM-Image,在開源不到24小時內,力壓群雄,登頂全球最大開源社區Hugging Face的Trending榜單。關鍵的是,這個模型,從訓練到推理,全程都是跑在華為昇騰AI晶片上的。智譜特別指出,GLM-Image實現了基於昇騰Atlas 800T A2裝置和昇思MindSpore AI框架的全流程訓練及推理適配,實際訓練性能足以達到相應計算裝置的匯報性能上限,驗證了在國產算力上訓練出SOTA模型的可行性。大白話來說就是GLM-Image從資料處理、訓練到推理全過程均基於華為國產晶片,主要依託 昇騰Atlas 800T A2伺服器及昇思MindSpore AI框架,從頭到尾都是純國產,沒有使用輝達等國外硬體。昇騰Atlas 800T A2是一整套面向大模型訓練與推理的AI伺服器系統。是基於昇騰910處理器和鯤鵬920 CPU建構的高性能訓練伺服器。單機通常整合8顆AI處理器,能提供高達2.56 PFLOPS的驚人算力。這在處理多模態模型(如圖像+文字)的海量計算任務時,提供了強大的底氣。昇思MindSpore是華為自研的深度學習AI框架,不僅能跑在雲端(訓練伺服器),還能無縫銜接到手機終端、邊緣裝置,實現“一次開發,到處運行”。在多項國際權威測試中,GLM-Image展現了恐怖的統治力。特別是在CVTG-2K(複雜視覺文字生成) 和LongText-Bench(長文字渲染)榜單中,都拿下了開源模型全球第一。最令人驚喜的是它的文字尤其擅長漢字生成任務。 過去,在圖片中精準渲染漢字一直是AI的噩夢。但 GLM-Image在海報設計、長文字排版、甚至複雜的科普示意圖中,都能寫出工整、精準、有設計感的漢字。GLM-Image的登頂不僅是智譜AI的勝利,也是中國AI產業的里程碑:它證明了國產晶片+國產框架的組合也能夠訓練出世界一流的模型。這在全球算力供應緊張的背景下,為中國AI企業提供了一條技術獨立、風險可控的路徑。實現了算力自主。從此,中國大模型研發正式進入了全端自主、自給自足的新紀元。也向世界宣告,離開特定的外部依賴,我們用自己的晶片,也能訓練出世界第一的模型。 (科技圈觀察)