3月31日上午消息,智譜在 2025 中關村論壇上發佈最新 Agent 產品:AutoGLM 沉思。作為首個集深度研究能力和操作能力於一體的 Agent,AutoGLM 沉思能一邊進行複雜思考,一邊執行作。像人類一樣打開並瀏覽網頁,完成從資料檢索、分析到生成報告。“沉思”背後的全端自研智譜CEO張鵬在發佈會上,公佈了沉思智能體背後的兩大核心能力:全端自研模型GLM-Z1-Air和大模型智能體技術框架AuoGLM。前者為“沉思”提供了強大推理能力的基座模型,而後者則是智譜一直積累打磨的智能體技術框架。ps:AutoGLM沉思背後是智譜 GLM 全端自研大模型,包括推理模型GLM-Z1-Air和基座模型GLM-4-Air0414(4月正式開源)。而自研智能體技術框架AutoGLM成為AutoGLM沉思的手腳。推理基座模型,32B,200token/s,秒殺滿血版R1先來看看智譜最強的推理基座模型GLM-Z1-Air。智譜CEO張鵬表示,推理模型GLM-Z1-Air不僅性能比肩DeepSeek-R1,在速度提升最高8倍的同時價格僅需DeepSeek-R1的1/30;可以在消費級顯示卡上進行運行。性能和成本取到了良好的平衡。在AME等一系列基準測試的評估中,Z1-Air表現了強大的數理方面的推理能力,這位更多複雜任務的解決提供了堅實的基座模型的支援。推理速度方面,極速版的 GLM-Z1-Air最高的生成速度可以達到每秒200個 token。一句話:這款模型只有32 B的參數量,能力卻比肩更大參數量的國內外一流的主流的模型。此外,智譜將更新上線 GLM4-FLASH,並推出了對應推理版本,完全免費。Agent 也有 Scaling Law這一agent scaling law背後是我們的自主線上課程強化學習演算法框架。通過設計由易到難的任務序列,逐步引導模型從簡單場景向複雜場景過渡。這種方法模擬模擬了人類學習的過程(由易到難),通過動態調整任務的難度,幫助模型積累基礎能力之後再去挑戰更高難度的任務,有效的避免了直接用複雜問題的資料進行訓練時候的造成的訓練不穩定的現象。在 agent scaling law的基礎之上,智譜還進一步發現了 agent存在的能力湧現。比如在訓練過程當中,團隊沒有給到任何的樣本或者資料教AutoGLM。Auto GLM沉思版能夠自己規劃出一個路徑去順利地訪問過巨潮資訊網這樣的一個很特殊的網站,然而當傳送指令幫使用者收集昨天關於具身智能的相關研報。Auto GLM的動手能力:目前在行業內也是處於領先,包括瀏覽器的使用,手機和電腦在內的工具使用能力全面的處於領先地位。在斯坦福大模型中心 AI指數2024當中智能體代表基準的 agent bench這樣的一個評測集上,AutoGLM系列模型在多個環境上取得超過此前 sota表現的效果。在 Phone use基準 Android lab和Android word上, Auto GLM phone任務的成功率方面,相對過往SOTA提升了超過20%。在Web use的評測基準上, Auto GM web也全面超越了像GPT-4o和Claude3.5、 sonnet等。在 GUI智能體方面, Co-Agent結合了視覺能力之後,在 GUI agent多個榜單上取得了 so的效果。Co-Agent的模型參數僅僅只有9 B。但是它的性能超越了包括 claude computer use等一眾更大規模同類的模型的性能。一個好消息是,智譜將於4月14日開源推理模型GLM-Z1-Air和基座模型GLM-4-Air0414,並於近期陸續上線bigmodel.cn。One More Thing:智譜的國內國際朋友圈智譜這兩年除了研究新品,還在忙啥?張鵬在最後給我們解開了迷惑。張鵬表示,2025年將會是 agent的應用的爆發的元年。智譜也將深度參與並且引領這一浪潮,為更多的應用合作夥伴提供基座模型的能力。我們在大力發展基座模型的同時,也會積極的幫助我們的生態合作夥伴更好的來使用 Agentic GLM的能力,包括:搭建標準化的 mass平台和智能體平台,打造基於行業、地域和場景的 agent應用。在行業生態方面,智譜堅持和行業合作夥伴共創,用自己在大模型研發上的積累幫助行業夥伴來,合力做出成功的大模型應用。目前,智譜已經攜手金融、教育、醫療、政務、企業服務等各個領域的合作夥伴,共同推進 Agentic LLM的應用落地。另外,關注智譜的朋友都知道,智譜在G端方面發展非常成功,包括北京、杭州、上海、成都、珠海在內的地方政府均有合作及支援。比如智譜和珠海的龍頭企業華發集團聯手,聯合搭建首個城市級的 GLM大模型空間,智譜+珠海華發空間將智譜一系列的語言多模態端測的模型部署到智能裝置上。張鵬解釋道,在城市生態方面,自主、安全、低幻覺的 GLM大模型依然是城市在選擇大模型的首選。智譜與當地的龍頭企業合作,推動地方大模型應用生態的建設和落地。作為一家朝向AGI的公司,除了以上這些生態方面的共建,智譜已經跟東歐十國和“一帶一路”沿線國建立了前瞻的合作。會上,張鵬宣佈了與這些國建建立主權AI自主大模型國際共建聯盟,可以說智譜不僅技術底蘊十足,就連生態的肌肉也十分強悍。 (51CTO技術堆疊)