#智譜
大家好,我是承通投顧副總顏逸民。散熱產業雖然因應 AI 時代的高效能運算需求而蓬勃發展,但同時也面臨許多挑戰,這些困難主要來自技術、成本和市場競爭等層面。1. 技術瓶頸與轉型挑戰這是當前散熱產業最核心的難題。過去主流的氣冷散熱技術,已經難以應付AI 晶片等高功耗元件所產生的巨大熱量。當晶片的熱設計功耗(TDP)不斷攀升,氣冷散熱的效率已逼近物理極限。從氣冷轉向液冷、浸沒式散熱:這是一場重大的技術革命。液冷和浸沒式散熱雖然效率更高,但技術門檻也更高,需要大量的研發投入。高昂的轉型成本:資料中心若要從氣冷系統轉換為液冷或浸沒式散熱,需要重新設計機櫃、管線、冷卻系統,甚至需要考慮樓層的承重能力,建置和維護成本都相當高昂。缺乏統一標準:液冷技術目前尚無一套統一的國際標準,這導致不同廠商的產品可能無法相容,增加了客戶的選擇困難和導入成本。2. 成本與供應鏈問題散熱產品的成本直接影響終端產品的競爭力。原物料成本波動:散熱模組的主要原料是銅、鋁等金屬,這些大宗商品的價格波動會直接影響散熱廠商的獲利。技術與研發成本高:開發新一代的散熱技術,例如熱導管、均溫板或液冷系統,都需要投入大量的資金和人力,這對中小企業來說是沉重的負擔。新技術的初期成本高:雖然液冷技術的毛利率較高,但其初始建置成本也遠高於傳統氣冷,這使得許多客戶(尤其是小型資料中心)在導入時會有所猶豫。3.市場競爭與客戶要求散熱市場的競爭激烈,客戶對產品的要求也越來越嚴格。市場競爭白熱化:散熱產業的競爭者眾多,特別是在技術門檻相對較低的氣冷領域,價格戰是常態。客戶對可靠性的要求極高:對於伺服器、電動車等關鍵應用,散熱方案的穩定性和可靠性至關重要。一旦散熱系統失效,可能導致設備損壞或服務中斷,後果不堪設想。供應鏈中的品質要求:大型 AI 伺服器廠商對散熱零組件的品質有嚴格的把控,一旦產品未能達標,供應商很可能被排除在供應鏈之外。譜瑞-KY(4966)譜瑞-KY公司受惠於產品組合優化、高速介面與顯示系統需求回溫,加上對Spectra 7資產併購的策略效益顯現,獲利大幅成長,帶動上半年每股稅後純益(EPS)達17.32元。博智(8155)博智(8155)是金仁寶集團旗下的印刷電路板廠,主要專注於伺服器相關PCB的製造。博智在2025年第一季營收達11.3億元,毛利率15.62%,其主要客戶需求強勁,尤其是在伺服器及AI應用上。鈞興-KY(4571)精密齒輪大廠鈞興-KY 7日公布自結7月及前七月營收,雙雙改寫同期新高。鈞興開發電動輔助自行車(E-bike)中置電機,將裝置國內自行車廠栢馥的城市漫步車、礫石公路車上,第四季起在台灣銷售,未來將成為營運成長新動能。金居(8358)法人指出,金居在全球一般型伺服器市占率50%,伺服器的高頻高速銅箔因認證嚴謹,時間至少要18~24個月,金居已建立產業地位。金居HVLP4產品已通過CCL廠商認證,預期2026年受惠ASIC伺服器拉貨動能,同時,HVLP4加工費高於HVLP2約50%~100%,金居將受惠加工費提升帶動產品組合改善。楠梓電(2316)近年積極轉型,專注於AI相關高階產品,策略效益逐漸浮現。2025年,AI與高速運算等應用需求蓬勃發展,為楠梓電帶來強勁的訂單能見度,法人樂觀看待其全年營運表現。緯穎(6669)緯穎(6669)上半年賺11個股本,成績傲人,7月營收續強是歷年最強7月。外資報告送暖,美系外資喊進,指出匯率因素對緯穎影響有限,重申「加碼」評等,將目標價上調至3500元。緯穎股價大受鼓舞,直奔漲停。龍德造船(6753)龍德造船(6753)在手訂單豐厚,海軍高效能艦艇後續艦(沱江艦)第二批量產5艘案持續依進度進行,是龍德主要營收來源,另有今年接獲的6艘布雷艦約15億的國艦訂單,預期與第二批沱江艦一樣自2026年開始交船。*散熱產業正處於一個關鍵的轉型期,雖然AI 晶片的高功耗帶來了巨大的市場商機,但也對散熱技術提出了前所未有的挑戰,若克服技術瓶頸、降低成本並應對激烈的市場競爭,將是決定散熱廠商未來發展將脫穎而出。川普關稅出招,台積電利空出盡,目前仍是多方控盤,下一輪飆股我已經準備好了。顏老師不畏盤勢震盪,績效依舊維持在高檔,5-6月份會員勝率82%,5-6月份會員獲利率153%,7月份會員勝率90%,7月份會員獲利率216%。7/16南電會員獲利出場44%,7/17欣興會員獲利出場40%,大量會員獲利出場22%,7/18楠梓電會員獲利出場45%,三天獲利151%,請密切追蹤顏老師官方LINE@粉絲團,在不影響會員權益之下,對Line@粉絲團的投資朋友分享會員訊息,更多會員績效邀請您一起來做見證,第一手訊息、布局飆股機會請私訊老師【Line ID】搜尋 @v588168,請密切鎖定LINE@粉絲團注!https://lin.ee/V7lQjOs
【WAIC 2025】被 OpenAI 點名後,智譜剛剛發佈新開源模型:中國最全能,一句話造出搜尋引擎
中國國產大模型廠商的開源浪潮,還在提速。就在剛剛,智譜正式發佈最新旗艦模型 GLM-4.5。按照智譜官方說法,這是一款專為 Agent 應用打造的基礎模型。延續一貫的開源原則,目前這款模型已經在 Hugging Face 與 ModelScope 平台同步開源,模型權重遵循 MIT License。省流版:GLM-4.5 在推理、程式碼、智能體綜合能力達到開源模型 SOTA 水平GLM-4.5 採用混合專家(MoE)架構,3550 億總參數/320 億啟動參數;GLM-4.5-Air:總參數量 1060 億,啟動參數為 120 億兩個版本均已全面開源,支援 MIT License均支援混合推理模式:用於複雜推理和工具使用的思考模式,以及用於即時響應的非思考模式API 呼叫價格輸入 0.8 元/百萬tokens、輸出 2 元/百萬tokens;高速版最高可達 100 tokens/秒GLM-4.5 這次比較大的技術亮點,是首次在單個模型原生融合了推理、編碼和智能體能力。別人家的模型要麼擅長推理,要麼擅長寫程式碼,要麼擅長當助手,而 GLM-4.5 說自己全都要。老規矩,先來看看新模型「跑分」環節。智譜選了 12 個最具代表性的評測基準來「秀肌肉」,包括 MMLU Pro、AIME 24、MATH 500、SciCode、GPQA、HLE 等等,這些也都是我們的「老熟人」了。結果綜合平均分,GLM-4.5 交出了一份全球模型第三、國產模型第一、開源模型第一的成績單。當然,光跑分沒用,還是更實戰的測試才有說服力。為了證明 GLM-4.5 在真實場景 Agent Coding 中的實力,智譜乾脆直接接入了 Claude Code,與 Claude-4-Sonnet、Kimi-K2、Qwen3-Coder 等模型一較高下。測試方案相當硬核:總共 52個程式設計開發任務,涵蓋六大開發領域,全部在獨立容器環境中進行多輪互動測試,主打一個真刀真槍地干。結果顯示,雖然在面對 Claude-4-Sonnet 時仍有較大的提升空間,但 GLM-4.5 在工具呼叫可靠性和任務完成度方面的表現還是相當突出。甚至智譜還把測試題目和 Agent 軌跡全部公開了(https://huggingface.co/datasets/zai-org/CC-Bench-trajectories),給我一種歡迎同行來「打假」的即視感。再來看看幾個比較有說服力的 Demo,含金量也不低。在 z.ai 官方網站簡單輸入提示詞「做一個 Google 搜尋網站。」,GLM-4.5 真就能一句話生成一個真的能用的搜尋引擎。由 GLM-4.5 打造的量子功能箱各項功能齊全,充分展示了模型的綜合能力。更複雜一點的,還能讓它生成一個可點選縮放的 3D 地球頁面。使用者可以點選地點查看詳情,並伴有平滑的縮放動畫。提示詞:Build a webpage using Three.js and JavaScript that creates a 3D world displaying places I've visited, based on an array. Clicking markers on the 3D globe will animate a zoom effect and open detailed trip information with photos.與傳統 AI PPT 工具使用範本填充資訊不同,GLM-4.5 會自主搜尋資料、尋找配圖,根據實際材料直接以 HTML 形式編寫圖文。除了常規的 16:9 比例,還能靈活支援社媒封面、長圖、甚至個人簡歷。開發者體驗這塊,國產廠商也開始「捲起來」了。比如 GLM-4.5 就相容 Claude Code、Cline、Roo Code 等主流程式碼智能體。完整使用指南看這裡:中國使用者:https://docs.bigmodel.cn/cn/guide/develop/claude海外使用者:https://docs.z.ai/scenario-example/develop-tools/claude如果說前面都是「面子」,那技術核心才是 GLM-4.5 真正的「裡子」。冷知識,GLM-4.5 的參數量僅為 DeepSeek-R1 的 1/2、Kimi-K2 的 1/3,但性能卻不打折,而這背後正是歸功於 GLM 模型更高的參數效率。尤其是 GLM-4.5-Air,用 106B 總參數 / 12B 啟動參數,在推理評測中已經逼近 Gemini 2.5 Flash 與 Claude 4 Sonnet。在 SWE-bench Verified 榜單上,它還位列性能/參數比的帕累托前沿——換句話說,用更少的體量,跑出了更優的性價比。性能提升的背後,則離不開訓練過程的「大力出奇蹟」。GLM-4.5 和 GLM-4.5-Air 使用了相似的訓練流程:首先在 15 兆 token 的通用資料上進行了預訓練。接著在程式碼、推理、Agent 等領域的 8 兆 token 資料上進行了針對性訓練,最後通過強化學習進一步增強了模型的推理、程式碼與智能體能力。有錢有資源,確實可以為所欲為。此外,GLM-4.5 在成本和效率上的突破可能更具殺傷力。API 呼叫價格低至輸入 0.8 元/百萬 tokens,輸出 2 元/百萬 tokens,同時,高速版本實測生成速度最高可至 100 tokens/秒,支援低延遲、高並行的實際部署需求,真·價格屠夫。目前,API 已上線開放平台 BigModel.cn,一鍵相容 Claude Code 框架。普通使用者也可以上智譜清言 (chatglm.cn) 和 Z.ai 體驗滿血版 GLM-4.5。值得一提的是,上個月,OpenAI 在旗下的 Global Affairs 帳號發表的報告中,也是直接點名智譜,稱其在全球 AI 競賽中取得了顯著進展,語氣可以說是罕見直白。回過頭來看,智譜算是增長勢頭比較穩定的廠商。節奏一直沒亂,模型迭代跟得上、開源尺度放得開,方向感也不飄。這麼看來,它能成為「AI 六小龍」中第一個啟動 IPO 的玩家,也就不那麼意外了。 (APPSO)
智譜發佈免費的超級 Agent:像 Manus 一樣幹活,像 DeepSeek 一樣思考
首個免費、具備深度研究和操作能力的 AI Agent。在 AI 智能體領域,智譜再次有所動作。今天,智譜在中關村論壇上正式發佈 AutoGLM 沉思,這一全新智能體不僅具備深度研究能力(Deep Research),還能實現實際操作(Operator),真正推動 AI Agent 進入「邊想邊干」的階段。AutoGLM 沉思能夠回應開放式的複雜問題,通過一邊推理,一邊搜尋,瀏覽數十甚至上百個網頁,總結出調理清晰的長文報告,並提供所有引用來源,讓 AI 輸出的內容切實可查。目前,AutoGLM 沉思已在智譜清言PC客戶端上線,這個在 ChatGPT 上要花 200 美元的功能,在智譜清言上可以免費不限量體驗。AutoGLM沉思的技術演進路徑包括:GLM-4 基座模型 → GLM-Z1 推理模型 → GLM-Z1-Rumination 沉思模型 → AutoGLM 模型。其中核心鏈路的模型和技術,將於 4 月 14 日正式開源,以推動行業生態發展。「讓機器像人一樣思考」,智譜始終專注於 AGI 的基座模型研發,目前已經探索到 L3-Agentic LLM 階段。01 什麼是 AutoGLM 沉思?智譜將 AutoGLM 沉思定位為一個能探究開放式問題,並根據結果執行操作的自主智能體(AI Agent),它能夠模擬人類的思維過程,完成從資料檢索、分析到生成報告。核心在於三大能力:深度思考、感知世界和工具使用。無論是模擬人類面對複雜問題的推理過程,還是像人一樣理解環境、呼叫工具完成任務,AutoGLM 沉思都能遊刃有餘。動手能力是 AutoGLM 沉思與 Deep Research 最大的區別。與 OpenAI 的 Deep Research 不同,它不僅能深入研究,還能真正執行任務,推動 AI Agent 從單純的思考者,進化為能交付結果的智能執行者。它能夠像人類一樣自動操作和瀏覽網頁,查看如知網、小紅書、公眾號等優質但不對外開放 API 的信源,同時具有多模態理解能力,能夠理解網頁上的圖文資訊,使研究更充分。為什麼叫 AutoGLM 沉思?這是因為 AutoGLM 沉思背後的模型,是智譜新推出的 Agent 大腦——沉思模型,可以通過強化學習,讓模型學會自我批評、反思、甚至沉思,並通過更長的深度思考時間換取更優的效果。目前,AutoGLM 沉思在智譜清言 PC 客戶端上線,使用者可免費體驗其研究能力和操作能力。此次發佈的為 preview 版本,核心支援 research 場景;在未來兩周,智譜還將進一步擴展更多智能體執行能力。包括推出“虛擬機器”版本。筆者打開智譜清言客戶端實測了一下,正好2025年中關村論壇到尾聲了,就順手輸入了下面這個要求:「線上搜尋 2025 年中關村論壇中的關鍵資訊,並生成一份 500 字的總結。」好傢伙,在呼叫了 8 次函數,沉思了 3 分 17 秒之後,智譜清言輸出了總結:2025 年中關村論壇關鍵資訊與成果總結引言2025 年中關村論壇年會於 3 月 27 日至 31 日在北京成功舉辦,主題為"新質生產力與全球科技合作"。作為中國科技創新領域的重要年度盛會,本屆論壇吸引了來自 100 多個國家和地區的 1000 多名演講嘉賓,為全球科技界提供了交流思想、展示成果和深化合作的重要平台。本報告將對論壇的關鍵資訊進行總結,涵蓋重大科技成果發佈、論壇主題與議題、科技合作成果等方面。論壇概況舉辦背景與規模2025 年中關村論壇年會經國務院批准,於 3 月 27 日至 31 日在北京舉辦。3 月 20 日,國務院新聞辦舉行了新聞發佈會介紹論壇相關情況 [3]。論壇以"新質生產力與全球科技合作"為主題,旨在搭建科技成果交流和技術交易的國際合作平台 [4]。本屆論壇的舉辦地點包括中關村國際創新中心、首鋼園等,涵蓋了開幕式、全體會議、平行論壇、技術交易大會等多種形式的活動,為全球科學家、企業家和投資人提供了廣泛的交流機會。論壇組織架構中關村論壇作為中國科技創新領域的重要平台,由多個部分組成:論壇會議:圍繞人工智慧、空間科學、生命健康、碳達峰碳中和、未來產業等科技前沿和熱點議題,舉辦多場品牌性論壇和創新性論壇。技術交易:中關村國際技術交易大會是論壇的重要組成部分,旨在打造代表國家、面向全球的技術成果轉化平台。成果發佈:凝聚全球科技界、產業界創新合作共識,發佈具有引領性的創新成果、科技政策、研究報告、科研指數等。前沿大賽:中關村國際前沿科技大賽是論壇的賽事類股,自 2017 年啟動以來,已吸引海內外 10000 多個前沿科技項目報名參加,600 多個優秀初創企業和創業團隊脫穎而出,累計帶動社會融資 1500 億元。配套活動:包括企業專場、考察對接、文藝活動等,為企業家、投資人、科學家搭建促進合作的平台 [5]。重大科技成果發佈十項重大科技成果在 2025 年中關村論壇年會開幕式上,發佈了十項重大科技成果,涵蓋了能源、材料、生物、資訊等多個領域,展示了中國在科技領域的最新進展 [6][7]:EAST 首次實現千秒量級高約束模電漿體運行:中國科學院和中國科學技術大學在核聚變研究領域取得重大突破,為未來能源發展提供了重要技術支援。高能同步輻射光源成功發射第一束光:國家重大科技基礎設施——高能同步輻射光源(HEPS)正式啟動帶光聯調,標誌著中國在大科學裝置建設方面取得重要進展 [19]。"夢想"號大洋鑽探船建成入列:中國自主設計建造的首艘大洋鑽探船正式交付使用,將顯著提升中國海洋科學研究能力。60MW/100MWh 先進壓縮空氣儲能系統:該項目在張家口完成,是中國能源儲存領域的重要里程碑,為可再生能源的大規模應用提供了技術支撐。中國首個實用化量子電腦"量子虎鯨"誕生:這一成果標誌著中國在量子計算領域取得重要進展,為量子資訊技術的實用化奠定了基礎。中國首個自主可控的量子化學計算軟體"量子化學 1.0"發佈:該軟體的發佈將促進量子化學研究的發展,為新材料設計和藥物研發提供重要工具。中國首個自主可控的區塊鏈底層平台"長安鏈"發佈:這一平台的推出將推動中國區塊鏈技術的自主創新發展,為數字經濟提供底層技術支援。中國首個商用化碳捕獲與封存(CCUS)項目在陝西啟動:該項目的啟動對於實現"雙碳"目標、推動綠色低碳發展具有重要意義。中國首個自主可控的航空發動機控制系統在瀋陽通過驗收:這一成果填補了中國在航空發動機控制系統領域的技術空白,提升了國產航空發動機的自主創新能力。中國首個 500 千伏柔性直流輸電工程在山東投運:這一工程的投運標誌著中國在柔性直流輸電技術領域達到國際先進水平,為建構新型電力系統提供了重要支撐。這些重大科技成果的發佈,不僅展示了中國在各科技領域的最新進展,也為全球科技創新合作提供了重要參考。論壇主題與議題主題設定與討論焦點2025 年中關村論壇年會圍繞"新質生產力與全球科技合作"這一主題,設定了多個主題論壇和專題討論,重點關注以下領域:人工智慧與未來產業:包括 6G 技術與產業創新論壇、未來網際網路產業發展論壇等,探討人工智慧、6G 等前沿技術的發展趨勢及其對產業變革的影響。量子科技與前沿科學:如量子科技創新發展論壇,聚焦量子計算、量子通訊等前沿領域的最新研究成果。綠色低碳與可持續發展:如碳達峰碳中和科技論壇、雙碳戰略與綠色金融論壇等,探討科技在實現"雙碳"目標中的作用。生命健康與醫療創新:如監管科學與生物醫藥高品質發展論壇、醫學 AI 創新與發展論壇等,關注生物醫藥、醫療 AI 等領域的創新成果。國際合作與區域協同:如世界領先科技園區發展論壇、京津冀協同創新與高品質發展論壇等,探討科技園區發展、區域創新協同等議題。科技賦能社會:如科技助殘論壇、科技賦能城市可持續發展大會等,關注科技在改善民生、提升城市可持續發展能力方面的應用。代表性論壇活動論壇期間舉辦了多場平行論壇和專題活動,以下是幾場具有代表性的論壇活動:6G 技術與產業創新論壇:以"探索技術趨勢,引領產業創新"為主題,匯聚國內外 6G 產學研用權威專家與行業領袖,聚焦語義通訊、6G 與 AI 深度融合、多樣化場景網路架構、星地融合等前沿話題 [24]。企業發現與發明論壇:由國務院國資委副主任苟坪、北京市副市長靳偉致詞,探討企業創新與發明的重要性和實踐路徑 [23]。科技助殘平行論壇:由中國殘聯主席程凱出席,論壇聚焦科技在殘疾人賦權和無障礙環境建設中的應用,探討如何通過科技創新提升殘疾人的生活質量 [26]。未來網際網路產業發展論壇:論壇以一場科技與人文交融的特別環節拉開帷幕,在主旨演講環節,鄔賀銓院士就《以 AI 加持網路重構和模式》進行了深入探討 [27]。這些論壇活動不僅展示了各領域的最新研究成果,也為全球科技界提供了深入交流與合作的平台。科技合作成果全球科技合作2025 年中關村論壇年會強調了全球科技合作的重要性,論壇期間舉辦了多場國際科技合作相關的活動:世界領先科技園區發展論壇:探討全球科技園區的發展趨勢和創新模式,促進國際科技園區間的合作與交流。中韓科技創新合作論壇:加強中韓兩國在科技創新領域的合作,共同應對全球性挑戰。中國北歐可持續發展與創新論壇:在中關村國際創新中心和航星科技園舉辦了兩場活動,探討可持續發展與創新的路徑與方法。國際科技組織發展研討會:匯聚國際科技組織代表,探討科技組織在促進全球科技創新合作中的作用。這些國際科技合作活動的舉辦,為全球科技創新合作提供了重要平台,推動了國際科技界的交流與合作。區域創新協同論壇還特別關注區域創新協同,舉辦了多場相關論壇:京津冀協同創新與高品質發展論壇:探討京津冀地區在科技創新領域的協同機制和合作模式,推動區域創新一體化發展。京港科技創新論壇:加強北京與香港在科技創新領域的合作,促進兩地科技創新資源的共享與互補。千校萬企協同創新大會:促進高校與企業之間的協同創新,推動產學研深度融合,提升科技創新的轉化效率。這些區域創新協同活動的舉辦,為推動區域創新一體化發展提供了重要平台,促進了科技創新資源的最佳化組態和高效利用。論壇影響與意義科技創新引領作用2025 年中關村論壇年會通過展示中國在各科技領域的最新成果,發揮了科技創新引領作用:展示中國科技創新成就:論壇發佈的十項重大科技成果,展示了中國在核聚變、量子計算、人工智慧等前沿領域的最新進展,彰顯了中國在科技創新方面的實力和潛力。促進科技成果轉化:通過中關村國際技術交易大會等平台,促進了科技成果的轉化和應用,推動了科技與經濟的深度融合。引領科技發展方向:論壇討論的前沿技術趨勢和未來產業發展方向,為全球科技創新提供了重要參考,引領了科技發展的新趨勢。全球科技合作平台中關村論壇作為全球科技合作的重要平台,發揮了以下作用:搭建國際交流橋樑:論壇為全球科學家、企業家和投資人提供了交流思想、分享成果的平台,促進了國際科技界的交流與合作。推動全球科技治理:通過科學與外交國際論壇等活動,探討了全球科技治理的新模式和新路徑,推動了全球科技治理的完善與發展。應對全球性挑戰:論壇關注氣候變化、公共衛生等全球性挑戰,探討了科技在應對這些挑戰中的作用和路徑,為全球性問題的解決提供了科技視角。科技賦能社會論壇還關注科技賦能社會的多個方面:科技助力民生改善:通過科技助殘論壇等活動,探討了科技在提升殘疾人生活質量、促進社會包容發展方面的作用。科技賦能城市可持續發展:通過科技賦能城市可持續發展大會等活動,探討了科技在提升城市可持續發展能力、建設智慧城市方面的應用。科技促進教育公平:通過 AI 賦能教育等活動,探討了科技在促進教育公平、提升教育質量方面的潛力。這些科技賦能社會的討論和實踐,展示了科技在改善人類生活、促進社會可持續發展方面的巨大潛力。結論2025 年中關村論壇年會作為中國科技創新領域的重要年度盛會,通過展示重大科技成果、舉辦多場主題論壇和活動,成功搭建了全球科技交流與合作的重要平台。論壇發佈的十項重大科技成果,展示了中國在各科技領域的最新進展;論壇設定的主題和議題,涵蓋了人工智慧、量子科技、綠色低碳等多個領域,反映了當前科技發展的前沿趨勢;論壇舉辦的國際科技合作和區域創新協同活動,促進了全球科技界的交流與合作,為應對全球性挑戰提供了科技視角。隨著全球科技創新合作的不斷深入和科技對社會影響的日益擴大,中關村論壇將繼續發揮其作為全球科技交流與合作平台的重要作用,為推動全球科技創新發展、應對全球性挑戰、促進人類福祉作出更大貢獻。可以看到,AutoGLM 沉思模型的運作可概括為「感知-決策-驗證-執行」四步閉環:動態感知:通過即時聯網搜尋(如抓取中關村論壇官網、新聞源)獲取最新資訊,突破訓練資料時效限制;多路徑決策:基於 GLM-Z1 的反思能力生成多種分析框架(如科技成果分類、論壇議題關聯性分析),避免單一思維偏差;邏輯驗證:呼叫 GLM-Z1-Rumination 的自我糾偏機制,交叉核驗資訊可信度(如對比新華網、清華大學等多源報導確認十大科技成果);自主執行:通過 AutoGLM 自動生成結構化報告,並最佳化輸出形式(如按「成果發佈-平行論壇-國際合作」邏輯組織 500 字總結)。整個過程體現了 AI 的自主性——從原始資訊採集到最終成果交付,無需人工干預流程設計。但是呢,我只要它給我輸出 500 字,它給我整了足足 3733 字……在發佈會現場,智譜 CEO 張鵬還展示了花 14 天時間,用「沉思」孵化了一個五千粉小紅書知識帳號。短短兩周內,這個自媒體帳號已成功接到商業合作訂單了。這一成績得益於「沉思」的 Agent 能力。它能夠自主在小紅書、知乎等平台上搜尋和整合資訊,針對指定話題進行深度查詢。使用者只需輸入想要討論的話題,例如如何選擇咖啡壺、化妝品成分對比等,「沉思」即可從數百個信源中提取核心內容,生成詳盡的分析報告。即使是對某一領域完全陌生的人,也能借助「沉思」快速變身為專業的知識博主,輸出高品質的原創內容。做小紅書博主,AI 真學會自己接單賺錢了。圖片來源:智譜02 從 GLM-4 到沉思模型的全端進化支撐 AutoGLM 沉思的,是智譜自研的 GLM 系列模型矩陣。其技術路徑很清晰:從通用基座模型 GLM-4,到推理能力大幅提升的 GLM-Z1,再到引入「沉思」能力的 GLM-Z1-Rumination,最終融合成 AutoGLM 的執行力。智譜全新打造的 GLM-4-Air-0414 是一款擁有 320 億參數的基座模型。通過在預訓練階段融入更多程式碼和推理資料,並針對智能體任務進行最佳化,該模型在工具呼叫、聯網搜尋和程式碼生成等領域的表現大幅提升。32 億參數的規模看似不算最大,但其設計卻精準適配了智能體多輪複雜互動的需求,能夠快速響應並執行任務。這種「高效率+高能力」的組合,讓 GLM-4-Air-0414 成為 AI 智能體大規模落地的核心支撐。基於 GLM-4-Air-0414,智譜推出了深度思考模型 GLM-Z1-Air。通過引入更多推理資料並最佳化通用能力,該模型在數學推理和複雜問題求解上展現出實力。在 AIME 24/25、LiveCodeBench 和 GPQA 等權威基準測試中,GLM-Z1-Air 的性能可媲美 DeepSeek-R1(671 億參數,啟動 37 億),但推理速度提升了 8 倍,成本卻低至原來的 1/30。此外,它還能在消費級顯示卡上運行,極大降低了硬體門檻,為開發者提供了更多可能性。與此同時,智譜還將免費模型 GLM-4-Flash 升級為 GLM-4-Flash-0414,並推出輕量化推理版本 GLM-Z1-Flash。這兩款模型在保持高效性能的同時,完全免費開放,適用於更廣泛的應用場景。基於 GLM-Z1,智譜通過擴展強化學習訓練,提升了模型結合工具使用完成長程推理能力,訓練出沉思模型 GLM-Z1-Rumination。GLM-Z1-Rumination 是智譜對 AI 自主性的全新探索。通過強化學習訓練,這款沉思模型突破了傳統 AI 僅依賴內部知識的侷限,融合即時聯網搜尋、動態工具呼叫和自我驗證能力,建構了一個完整的自主研究閉環。它能主動理解使用者需求,通過多角度分析和反覆修正假設,產出更可靠的研究成果。這種從「高智商」到「高智商+高自主」的轉變,讓 GLM-Z1-Rumination 在複雜任務中展現出潛力。這些模型將於 4 月 14 日開源,並陸續上 MaaS 平台(bigmodel.cn),為全球開發者提供。在行業生態的建構上,智譜選擇了一條務實的道路。作為模型提供商,智譜致力於讓 GLM 系列成為合作夥伴成功的基石。目前,智譜已與金融、教育、醫療、政務和企業服務等多個領域的頭部企業建立合作,共同探索 Agentic LLM 的落地應用。例如,在金融領域,智能體可以最佳化風險評估與客戶服務;在教育領域,則能提供個性化的學習助手。這些跨行業的實踐,不僅驗證了 GLM 模型的通用性,也為 AI 智能體的商業化開闢了廣闊空間。與此同時,智譜的觸角延伸至區域合作。前段時間,智譜接連拿下杭州、珠海、成都三地國資,並且也已經與北京、杭州、上海、成都、珠海等城市達成戰略夥伴關係,攜手當地龍頭企業,推動區域大模型應用生態的繁榮。這種「技術+地域」的模式,不僅加速了智能體在中國的普及,也為地方經濟注入了新的科技活力。同時,智譜還積極推動中國原創大模型技術出海,助力「一帶一路」沿線國家建構自主、可控的 AI 能力。智譜主導成立了「自主大模型國際共建聯盟」,聯合東盟十國及「一帶一路」沿線的 10 個國家,共同打造無幻覺、可信賴的 AI 基礎設施。AI 智能體的崛起標誌著下一代應用範式的到來,而智譜正以全方位的投入迎接這一變革。隨著 Agentic GLM 的持續迭代和生態網路的不斷擴展,智譜或許將為我們帶來更多驚喜。 (極客公園)
巨頭與新勢力重兵雲集 AI Agent為何如此重要?
AI Agent之所以能夠引發熱議,其之於人類的意義在於,這項技術給人類提供的價值正從資訊轉向行動,這也就預示著生產力創新的新浪潮。開啟收費試水商業化、接洽融資估值暴漲......發佈僅3周,AI Agent產品Manus在近日再度席捲AI界的注意力。而3個星期前,當中國團隊Monica發佈全球首個通用型自主智能體Manus時,這款產品就立刻刷屏,這也讓智能體(AI Agent)市場被極大關注。如果說ChatGPT引領了本輪AI的產品開端,進入到2025年,AI Agent則成了倍受關注的下一代AI產品形態。一個很明顯的現像是,今年,大模型的戰火轉移到了AI Agent上,微軟、Google、阿里等科技巨頭紛紛佈局卡位,OpenAI、智譜、Monica等初創公司們也爭相推出各自的“Agent”產品且已嶄露頭角。資本市場則直接用真金白銀投票。在3月6日Manus發佈當天,A股AI智能體概念,超150隻概念股漲停。而當智能體成為玩家們競逐的對象,在這場巨頭與新勢力的卡位賽中,AI Agent最終的格局是百花齊放,還是如同基座大模型那樣收斂?▍一個能力邊界持續擴張的“自主打工人”當使用者對Manus說出“幫我安排一次北京出差”,這台AI會自主完成機票比價、酒店篩選、行程規劃,甚至根據過往偏好推薦餐廳;此前,智譜發佈的AutoGLM,也支援跨APP操作,AutoGLM這個AI Agent還發出了人類歷史上第一個紅包。——注意,上述兩個指令,整個過程均沒有人類介入,這種“任務閉環”能力,被認為是AI Agent與傳統聊天機器人,甚至是通用大模型的本質區別。對於AI Agent,Google在最新發佈的白皮書將其定義為:一種能夠觀察世界、利用工具並採取行動以實現特定目標的大模型應用,不僅具備自主性,更能主動推理出下一步的行動策略,從而實現最終目標。AI Agent之所以能夠引發熱議,其之於人類的意義在於,這項技術給人類提供的價值正從資訊轉向行動,這也就預示著生產力和創新的新浪潮。《科創板日報》記者此前曾報導,第四範式在近期進行了戰略升級,新近成立了範式集團。目的就是將AI Agent能力賦能更多的領域,按照範式集團創始人戴文淵的想法,是利用AI Agent來理解人的需求,搭配上能解決問題的世界模型的能力,便可實現AGI的目標。在接受《科創板日報》記者採訪時,範式集團創始人戴文淵表示,第四範式在2023年就已提出AIGS的理念,最終的目標是讓員工可以自然語言與AI溝通完成複雜的任務,這與如今的AI Agent理念不謀而合。此前,第四範式也正在多個場合演示過其Agent在企業場景下的應用:比如通過一張草圖,Agent即可在幾十萬的零部件中自動尋找出相似零部件,並給出不同地自動化裝配方案,以進一步最佳化產品設計;還能根據即時的水文資料及氣象資料,對可能出現的災害區域、災害類別、災害等級進行預測,並自動給出安置方案。不難發現,AI Agent的能力邊界遠比我們想像的大得多,並不是簡單地替代人類工作,更是會深刻改變我們的工作方式、流程,甚至是公司營運模式。▍巨頭卡位,AI入口之爭業內普遍認為,2025年將是Agent爆發之年。Gartner預測,到2028年,至少15%的日常工作決策將通過Al Agent完成。 銀河證券預測2028年中國AI Agent市場規模達8520億元(CAGR 72.7%),全球市場超5000億美元。千億市場規模的吸引力和AI技術演進紛紛吸引了蘋果、Google、微軟、OpenAI等全球科技巨頭的積極佈局,但這可能只是表象,更深層的意義,其實是“入口權”之爭。正如瀏覽器曾是PC網際網路入口、APP主導移動時代,Agent將成為AI時代的核心互動入口——人們不再需要進入不同的APP去下達不同的任務,而是統一對Agent下達命令,由Agent調取不同的軟體及模型,完成具體的任務,滿足具體的需求。可以想像,未來在生活中,當AI Agent存在於汽車、AR眼鏡、甚至是家電中,手機以及各類五花八門的APP,將不再是你獲取和查詢資訊的唯一入口;在工作中,當AI Agent與你的各類辦公工具和企業軟體深度結合後,你工作的模式將從低效的“不斷往復的軟體操作”轉變為高效的“一個指令輕鬆搞定”。圍繞AI Agent,不管是科技巨頭還是初創企業,今年各廠商的競賽還在加速。《科創板日報》記者瞭解到,字節跳動的Dev Infra 團隊,在近期開發了一款功能類似Manus的產品,叫做Dev Agent。該Agent通過整合內部網路知識庫和多種內部工具實現調研、開發、資料分析等任務。不過,該項目處於實驗階段,僅面向Dev Infra 團隊員工進行內測,屬於內部工具,不支援外部使用者使用。阿里巴巴也在近期推出AI旗艦應用新夸克,新夸克基於阿里通義領先的推理及多模態大模型,全面升級為一個無邊界的“AI超級框”。阿里巴巴稱,新夸克將告別傳統搜尋,升級為一個All in One的“AI超級框”,滿足使用者工作、學習、生活的各類AI需求。目前市場主流的AI產品形態是Chatbot,夸克則希望更進一步,將AI對話、深度思考、深度搜尋、深度研究、深度執行整合到一起,以一個極簡的“AI超級框”,滿足使用者所有需求。▍百花齊放還是贏家通吃?兩年前的“百模大戰”讓大模型市場“戰火紛飛”,當下的AI Agent,頗有彼時的滋味。只是如今來看,基座大模型的競爭格局已經明朗,基於開源,收斂至幾家巨頭獨大。那麼未來一兩年內,AI Agent的市場格局將會如何,會形成同等勢態麼?在出門問問CEO李志飛看來,由於Agent並非能實現通用,Agent並非一家獨大,而是將形成一個非常長尾的供應商格局。市場上將會有很多Agent,每一個Agent都由不同的公司營運。如果從大模型落地這個更宏大的敘事視角來看,AI Agent更像是落地‘殺手鐧’般的存在,在落地性質上,目前各廠商的Agent路徑已有了很明顯的分化——面向企業和面向個人的,前者用於變革企業經營模式;後者更像是個人助手。比如Manus、OpenAI專業領域代理的方向更指向個人市場;第四範式等廠商則更多指向企業市場。在行業人士看來,更為顯而易見的是,面向企業的Agent應用這條路更加困難。從技術複雜度上看,這需要的不僅僅是通用的Agent能力,更需要是基於對企業營運的深度理解,能實現資料整合、任務理解、任務分發、多模態、決策自動化等綜合AI能力的體現。與此同時,企業的場景更加嚴肅、容錯率低,工程化難度更大,如果把C端使用者使用Agent比作是剛畢業的大學生,那企業端使用的Agent更像是工作多年的專家,專家在某些垂直領域的能力、經驗和執行力要更為專業。正如Salesforce CEO 炮轟微軟AI時所述:“微軟只是把ChatGPT包裝成Copilot售賣給企業,無法為使用者創造真正的價值。”戴文淵告訴《科創板日報》記者,第四範式一直深耕企業服務領域,因此公司的解法是為企業提供企業級的Agent開發平台,把企業所需所有能力給到企業,企業可以快速搭建具備認知、決策、執行能力的專業 AI Agent 應用。據《科創板日報》記者瞭解,近期,第四範式還完成了對“科創板協同管理領域第一股”致遠互聯的投資,雙方將以“資本捆綁+戰略合作”的方式深度佈局企業端AI Agent應用。最近,第四範式也將企業端Agent能力延伸到了消費電子領域,成立Phancy業務,與原先的企業服務業務(4Paradigm)均成為範式集團的核心子業務。戴文淵告訴《科創板日報》記者,第四範式現在採取To B+To C兩條腿走路的方式。此前的企業服務類股,已沉澱出深度場景認知能力,新開拓的消費電子業務業務,更加to C,通過模組實現在消費電子產品中實現 AI Agent 能力,具體涵蓋AI成品/半成品、AI Agent智能體模組、PCBA定製開發、軟體配套開發和AI雲服務等。 (財聯社AI daily)
剛剛,智譜發佈秒殺DeepSeekR1的“沉思”,基座模型Z1吐字速度高達200token/s,價格只有R1的1/30,下月開源
3月31日上午消息,智譜在 2025 中關村論壇上發佈最新 Agent 產品:AutoGLM 沉思。作為首個集深度研究能力和操作能力於一體的 Agent,AutoGLM 沉思能一邊進行複雜思考,一邊執行作。像人類一樣打開並瀏覽網頁,完成從資料檢索、分析到生成報告。“沉思”背後的全端自研智譜CEO張鵬在發佈會上,公佈了沉思智能體背後的兩大核心能力:全端自研模型GLM-Z1-Air和大模型智能體技術框架AuoGLM。前者為“沉思”提供了強大推理能力的基座模型,而後者則是智譜一直積累打磨的智能體技術框架。ps:AutoGLM沉思背後是智譜 GLM 全端自研大模型,包括推理模型GLM-Z1-Air和基座模型GLM-4-Air0414(4月正式開源)。而自研智能體技術框架AutoGLM成為AutoGLM沉思的手腳。推理基座模型,32B,200token/s,秒殺滿血版R1先來看看智譜最強的推理基座模型GLM-Z1-Air。智譜CEO張鵬表示,推理模型GLM-Z1-Air不僅性能比肩DeepSeek-R1,在速度提升最高8倍的同時價格僅需DeepSeek-R1的1/30;可以在消費級顯示卡上進行運行。性能和成本取到了良好的平衡。在AME等一系列基準測試的評估中,Z1-Air表現了強大的數理方面的推理能力,這位更多複雜任務的解決提供了堅實的基座模型的支援。推理速度方面,極速版的 GLM-Z1-Air最高的生成速度可以達到每秒200個 token。一句話:這款模型只有32 B的參數量,能力卻比肩更大參數量的國內外一流的主流的模型。此外,智譜將更新上線 GLM4-FLASH,並推出了對應推理版本,完全免費。Agent 也有 Scaling Law這一agent scaling law背後是我們的自主線上課程強化學習演算法框架。通過設計由易到難的任務序列,逐步引導模型從簡單場景向複雜場景過渡。這種方法模擬模擬了人類學習的過程(由易到難),通過動態調整任務的難度,幫助模型積累基礎能力之後再去挑戰更高難度的任務,有效的避免了直接用複雜問題的資料進行訓練時候的造成的訓練不穩定的現象。在 agent scaling law的基礎之上,智譜還進一步發現了 agent存在的能力湧現。比如在訓練過程當中,團隊沒有給到任何的樣本或者資料教AutoGLM。Auto GLM沉思版能夠自己規劃出一個路徑去順利地訪問過巨潮資訊網這樣的一個很特殊的網站,然而當傳送指令幫使用者收集昨天關於具身智能的相關研報。Auto GLM的動手能力:目前在行業內也是處於領先,包括瀏覽器的使用,手機和電腦在內的工具使用能力全面的處於領先地位。在斯坦福大模型中心 AI指數2024當中智能體代表基準的 agent bench這樣的一個評測集上,AutoGLM系列模型在多個環境上取得超過此前 sota表現的效果。在 Phone use基準 Android lab和Android word上, Auto GLM phone任務的成功率方面,相對過往SOTA提升了超過20%。在Web use的評測基準上, Auto GM web也全面超越了像GPT-4o和Claude3.5、 sonnet等。在 GUI智能體方面, Co-Agent結合了視覺能力之後,在 GUI agent多個榜單上取得了 so的效果。Co-Agent的模型參數僅僅只有9 B。但是它的性能超越了包括 claude computer use等一眾更大規模同類的模型的性能。一個好消息是,智譜將於4月14日開源推理模型GLM-Z1-Air和基座模型GLM-4-Air0414,並於近期陸續上線bigmodel.cn。One More Thing:智譜的國內國際朋友圈智譜這兩年除了研究新品,還在忙啥?張鵬在最後給我們解開了迷惑。張鵬表示,2025年將會是 agent的應用的爆發的元年。智譜也將深度參與並且引領這一浪潮,為更多的應用合作夥伴提供基座模型的能力。我們在大力發展基座模型的同時,也會積極的幫助我們的生態合作夥伴更好的來使用 Agentic GLM的能力,包括:搭建標準化的 mass平台和智能體平台,打造基於行業、地域和場景的 agent應用。在行業生態方面,智譜堅持和行業合作夥伴共創,用自己在大模型研發上的積累幫助行業夥伴來,合力做出成功的大模型應用。目前,智譜已經攜手金融、教育、醫療、政務、企業服務等各個領域的合作夥伴,共同推進 Agentic LLM的應用落地。另外,關注智譜的朋友都知道,智譜在G端方面發展非常成功,包括北京、杭州、上海、成都、珠海在內的地方政府均有合作及支援。比如智譜和珠海的龍頭企業華發集團聯手,聯合搭建首個城市級的 GLM大模型空間,智譜+珠海華發空間將智譜一系列的語言多模態端測的模型部署到智能裝置上。張鵬解釋道,在城市生態方面,自主、安全、低幻覺的 GLM大模型依然是城市在選擇大模型的首選。智譜與當地的龍頭企業合作,推動地方大模型應用生態的建設和落地。作為一家朝向AGI的公司,除了以上這些生態方面的共建,智譜已經跟東歐十國和“一帶一路”沿線國建立了前瞻的合作。會上,張鵬宣佈了與這些國建建立主權AI自主大模型國際共建聯盟,可以說智譜不僅技術底蘊十足,就連生態的肌肉也十分強悍。 (51CTO技術堆疊)
後DeepSeek時代:六小虎向左,BAT向右
DeepSeek給AI大模型行業,免費贈送了一波國民等級的市場教育,卻也平等地在先行者們頭上,懸起了一把達摩克利斯之劍。其中,AI“六小虎”之中的智譜就是一個縮影,智譜脫胎於清華大學知識工程研究室,素來有“國家隊”之稱。然而就在最近開始頻頻出現融資動作,10天之內補充彈藥達15億人民幣;可與此同時,組織震盪頗有加劇之勢,從一線團隊到高管大牛皆有波及。冰火兩重天的態勢,可謂是目前除了DeepSeek之外,大多數大模型從業者們,真實寫照的一個縮影。2024年底,智譜曾以200億元的估值,完成一輪30億元人民幣的融資,在這之後,包括杭州城投、上乘資本、華發集團等國資背景的資方快馬加鞭地趕到為其注資。不過,也有風投人士對「新熵」分析,DeepSeek的橫空出世還是對智譜的估值造成了一定負面影響,快速拿錢也可能是為了搶下已經出現上漲瓶頸的相對高價。與大開現金糧倉之門形成反差的是,智譜在團隊規模和對外投資上呈現出收縮之勢。高峰期階段的一千餘人團隊,在交付和銷售類股持續進行一定比例的淘汰;高管隊伍中,則有應用AI與合作副總裁李惠子、首席戰略官張闊,以及副總裁曲滕等先後退出。智譜之外,其他“六小虎”成員也都各自或默默或高調地消化著DeepSeek引起的利弊影響,BAT、字節等網際網路大廠同樣出現了路線選擇上的分化,讓這個春天也隱含了一絲返冬的味道。後DeepSeek時代來了DeepSeek猶如一顆投入平靜湖面的巨石,在AI行業掀起了滔天的波瀾,甚至可以誇張點說,其直接改寫了國內大模型的競爭規則。開源大模型DeepSeek-R1以性能比肩GPT-4o、成本僅為十分之一的優勢,迅速成為行業基準線,進而產生出兩個連鎖反應——技術門檻崩塌與B端客戶分流。不少企業開始獨立部署,以及中小硬體廠商抓住機會,快速推出“DeepSeek一體機”,直接衝擊了以智譜為代表的大模型To B私有化部署市場。智譜目前的業務方向雖然對於B端和C端各有側重,但作為CEO的張鵬曾堅定地偏向前者,他坦言稱推C端產品的主要目的,就是為了向B端客戶展示能力。為此,智譜刻意模仿雲廠商建立了一支以區域劃分的銷售團隊,並且挖來了前字節跳動旗下飛書的首席商業官吳瑋傑。另外,擔任副總裁的陳雪松,憑藉過去在AI“四小龍”之一的曠視科技任職經歷,帶動了一大批銷售人才無縫銜接到智譜團隊。在藍海市場的耕耘,使得智譜MaaS平台積累下70萬企業和開發者使用者,2024年的整體商業化收入超過100%;據不完全統計,全年的To B及To G項目的中標數量達32個,披露金額約1.3億元,僅次於科大訊飛和百度。然而,DeepSeek帶來的AI平權,猝不及防地殺到。從深圳市福田區推出70名基於DeepSeek大模型的“AI數智員工”,到上海交通大學宣佈在國產晶片組成的算力叢集上,完成了DeepSeek全系列模型的本地部署,首當其衝被這場AI浪潮席捲的就是政企單位。有統計資料顯示,截至今年2月底,國內98家央企中的45%,皆已經完成了DeepSeek模型的部署。沖在瘋搶政企大模型訂單一線的,不是智譜等大模型先行者,而是更傳統的資料裝置商、算力服務商,以及IT整合商,諸如聯想、中興、浪潮、神州等等。甚至有深圳華強北的中小商家,也開始躍躍欲試。「新熵」從行業人士處瞭解到,部分政企訂單已明確要求“支援DeepSeek介面”。相比BAT等大廠可以卸下心理包袱,選擇自研與開源兩條腿走路的路線,以智譜為代表的“六小虎”們,則必須押注在自家大模型的底層技術能力上。一旦被DeepSeek甩開太多,將失去核心競爭優勢,這也是為什麼資本市場已經開始重新審視閉源大模型的價值。AI六小虎的分化AI行業的競爭異常激烈,本就是一個日新月異的賽道,DeepSeek的強勢登場則進一步加劇了業內的危機意識。“六小虎”中的智譜尚處於前列,一些落後企業受到的衝擊則遠大於行業紅利,逐漸呈現出明顯的分化態勢。據統計,除了與智譜並稱為“北智譜,南階躍”的階越星辰,目前尚未傳出高管離職的消息,其他“六小虎”近一年內都已經有多位高層變動,尤其在進入後DeepSeek時代,離職潮隱隱有著加速的趨勢。比如,百川智能的聯合創始人焦可近期已正式離職,另一位聯合創始人陳煒鵬也即將離開,目前正在辦理相關手續。有消息稱,兩人均已投身AI創業賽道。MiniMax的副總裁、開放平台負責人魏偉,曾在騰訊雲擁有豐富的企業服務經驗,也於年初離職,暫未有更進一步的確認消息。人才隊伍的調整,往往伴隨著業務方向的變化。百川智能如今選擇轉向垂類醫療領域,或許正是基於對自身技術優勢與市場需求的深度挖掘,試圖在特定細分領域深耕細作,以避開與DeepSeek等強大對手的正面競爭。然而,這也意味著其在通用AI大模型市場的競爭力會進一步減弱,市場份額面臨被侵佔的風險。同樣被逼推倒業務模式的還有零一萬物。CEO李開復此前無奈宣佈放棄訓練超大模型,“仰望星空追尋 AGI 需要充足甚至不計代價的彈藥儲備,腳踏實地來看,我們現階段的最高優先順序是先鞏固拿到彈藥的實力。”目前,零一萬物正通過拆分業務“造血”,李開復的態度是“先去找投資人聊,看有沒有人願意投”。不過,在大模型技術快速迭代的背景下,過度專注於應用層的變現,即使是融資困境下的自我救贖,仍不可避免會在技術核心競爭力上與行業領先者逐漸拉開差距,多少有些飲鴆止渴的意思。去年的行業明星月之暗面,也被認為是這波受影響較大的大模型企業。相比於去年在全網管道為Kimi進行的大規模投流,目前被爆出已調整投流戰略,包括暫停多個Android管道的投放,將APP榜首的讓給了近期瘋狂投流的元寶。另一邊,由DeepSeek掀起的開源浪潮中,智譜、MinMax和階躍星辰皆有不同程度的開源基礎,更有跟上腳步的優勢。但是,從DeepSeek公開的程式碼庫內容可以發現,其出於硬體型號上的選擇,更適配輝達的CUDA框架。而從綜合因素考量,未來極大機率會出現一波國產晶片的替代潮,因此在開源這條路上,“六小虎”們並非沒有一點機會。大廠開啟自救行動隨著百度、阿里巴巴、騰訊的最新財報陸續發佈和業績電話會議的召開,AI成為網際網路巨頭們恨不得貼滿全身的標籤。曾經在入局大模型的起跑線上慢人一步的騰訊,成為第一個放下矜持全線接入DeepSeek的代表。除了元寶承接了DeepSeek官網伺服器容量不足外溢出的流量外,騰訊旗下的微信、騰訊文件、QQ瀏覽、騰訊音樂器等C端產品,都迅速地倒戈,絲毫不顧及自家混元大模型的感受。以雲服務為代表的大廠B端業務,更適合接受DeepSeek的“改造”。除了騰訊雲,還有百度雲、阿里雲、華為雲和字節跳動的火山引擎,均在春節假期裡加班加點上線了接入DeepSeek的版本。不過,在“借鑑”了多模型最佳化的演算法實現全面降本增效後,大廠之間的雲戰爭必然會再度加大價格戰力度。國泰君安證券的研報顯示,訓練Deepseek V3(671B參數滿血版)的成本為557.6萬美元(約合4070萬人民幣),僅為Meta公司的大語言模型Llama 3的7%,而OpenAI訓練ChatGPT-4o所花費的成本高達7800萬美元甚至是1億美元,並且還需要上萬張H100晶片。而Deepseek-V3訓練時使用的是性能被閹割過的特供AI晶片——輝達H800。有雲端運算服務商的銷售人員對「新熵」透露,去年全行業掀起的價格戰,明面上都以為是字節、阿里幾個大廠在打頭陣,實際上從下半年開始,DeepSeek在小範圍內釋放出的超低價,更讓大家不能放鬆喘氣。另外,值得注意的是,在由國外AI巨頭曾經倡導的高舉高打邏輯破滅後,大廠們也逐漸回歸到DeepSeek所帶來的彎道超車路線。不管是老巨頭BAT,還是新貴字節,躋身大廠之列就說明已然在一方業務地盤上佔據絕對的優勢,充分利用這一高地再向AI山頭髮起衝鋒,顯然更能事半功倍。比如背靠抖音流量的豆包,就相當有自信地一直堅持未與DeepSeek融合。並且即便如此,也沒有丟掉太多使用者,據QuestMobile資料顯示,截至2025年2月9日,豆包的周日均活躍使用者數為1845萬,僅次於DeepSeek,高於BAT旗下的主力AI應用。對於大廠們來說,開源還是閉源,免費還是收費,在成本側都不會造成太大的負擔,兩邊全都要或者選擇勝率較大的押注即可。而智譜的一邊開源一邊“過冬”,或許會成為國內AI大模型賽道從狂熱走向理性的標誌。DeepSeek的鯰魚效應迫使全行業重新校準技術、資本與市場之間的三角關係。開源不再是理想主義的口號,而是生存的必需品;商業化也不能僅依賴政府訂單或資本泡沫,而需紮根真實場景。當熬過了冬天,春天就不會遠了。 (新浪科技)