春節期間國產大模型的使用情況可謂如火如荼。OpenRouter最新周度資料顯示,平台前十模型總token量約8.7兆,中國模型獨佔5.3兆,佔比61%。
當周token呼叫量前三模型均為國產大模型,分別為Minimax M2.5、Kimi K2.5、GLM-5,呼叫量環比上周分別變動增加197%、下降20%、增加158%。其中,MiniMax M2.5以2.45兆token空降榜首,Kimi K2.5以1.21兆緊隨其後,智譜GLM 5和DeepSeek V3.2分列第三、第五。
OpenRouter是全球最大的大模型API聚合平台,可為開發者提供統一API介面,以訪問全球數百種大語言模型。其核心功能包括多模型呼叫、智能路由最佳化和透明的性能排行榜,旨在解決多模型整合複雜和廠商封鎖問題。
從該平台提供的資料看,程式設計(Coding)和智能體(Agent)正成為大模型的兩大核心比拚點。
OpenRouter整體呼叫量近期大幅攀升。官方確認,M2.5帶動了100K至1M長文字區間的增量呼叫需求,這個區間正是智能體工作流的典型消耗場景。
論token呼叫量,在此平台排名前三的國產大模型都聚焦於提升程式設計能力和智能體(Agent)任務的自動化水平,是2026年初國產大模型在應用層面的重要突破。
稀宇科技(MiniMax)於2月13日發佈MiniMax M2.5,稱該模型為全球首個為智能體場景原生設計的生產級旗艦模型。其發佈後七天的呼叫量即突破3.07T tokens,憑藉在程式設計和Agent工作流中的卓越性能與極低的成本,成為開發者首選。
月之暗面(Moonshot AI)於1月27日發佈KimiK2.5,該模型採用原生多模態架構,能通過調度多達100個“Agent分身”平行工作,將複雜任務效率提升3到10倍。該模型在多個細分榜單(如程式設計、工具呼叫)中均排名第一,其呼叫量遠超Gemini 3和Claude模型。據澎湃新聞報導,該大模型發佈不到一個月,Kimi近20天累計收入已超過2025年全年總收入,增長主要受全球付費使用者及API呼叫量大漲共同推動,其中海外付費使用者數快速增長。
智譜於2月12日發佈GLM-5,該模型參數規模進一步擴展,採用了稀疏注意力機制,是其專為複雜系統工程與長程Agent任務設計的旗艦模型。憑藉免費、200K上下文窗口等優勢,該模型發佈後使用者迎來高速增長,智譜對Coding Plan先後進行了限售、漲價等動作,除夕當天官宣全網尋找“算力合夥人”。
隨著AI模型應用場景深化,使用者從簡單問答轉向複雜工作流,如讓模型重構程式碼、改寫檔案、生成文件等,以及智能體模式普及,當前token消耗呈現明顯的“通膨”趨勢。
性能提升的同時,國產模型仍以性價比優勢出圈。如MiniMax M2.5和智譜GLM-5相比Claude Opus 4.6具備顯著的成本優勢:在輸入環節,MiniMax M2.5與GLM-5的價格均為0.3美元/百萬token,而Claude Opus 4.6則高達5美元/百萬token,是前兩者的約16.7倍;在輸出環節,MiniMax M2.5的價格為1.1美元/百萬token,GLM-5為2.55美元/百萬token,而Claude Opus 4.6的輸出價格達25美元/百萬token,分別是MiniMax M2.5的約22.7倍和GLM-5的約9.8倍。
上述國產模型並不能完全反映國內模型廠商的token呼叫量情況。據海通國際證券,資料顯示,火山引擎的大模型日均token呼叫量已從2024年底的2兆增長至2025年底的63兆;阿里雲外部客戶2025年日均token呼叫也已接近5兆,2026年目標至少15-20兆,內部業務日均呼叫則計畫從16-17兆拉到100兆。從全行業看,中國整體日均token消耗2024年初為1000億,2025年中突破30兆,2026年2月主流大模型合計日均token消耗已到180兆等級。
東莞證券最新研報表示,隨著國產模型的程式設計、智能體能力提升,其呼叫量大幅增加,國產大模型在程式設計、智能體領域對標全球頭部模型,有望進一步加快應用落地,加速token消耗量上漲。
長江證券此前表示,隨著程式設計和多模態模型和產品的逐步成熟,下游應用場景有望被真正打開,帶來大量的高品質token需求。參照海外AI產業發展規律,從資本開支投入到token需求爆發存在約兩年的滯後期。國內大廠的AI資本開支周期較海外滯後約一年,於2024年下半年開啟。因此,國內雲廠商收入已開始兌現增長,而token數量的真正爆發預計將在2026年到來。 (科創板日報)