#MiniMax
來自MiniMax M2.5的震撼 :小尺寸幾乎打平opus4.6,巨便宜,巨能幹活,速度巨快
MiniMax M2.5 正式發佈了,可以說這是一個相當優秀的國產模型,國產模型每一家都有自己的聚焦,MiniMax在進行的是極致最佳化,沒有過多花哨的技術實驗,專注於推出的是一款極其方便部署,價格具實惠,能幹活,性能對標世界頂尖的模型,咱也不尬吹,資料好看不代表真實體驗就好,但至少M2.5的確是在向真實生產環境可用和體驗在努力我先放兩張圖大家感受一下MiniMax的進化,看一下MiniMax M系列的來時路:尺寸對比,這就有意思了,感覺具有極高的可用性,非常適合家庭實驗室部署,據說推理服務提供商或許能在這個模型上挖掘出驚人的每秒token生成速度我們來看看MiniMax M 2.5 做到了什麼以及如何做到的MiniMax M 2.5做到了什麼首先看硬指標,它在各項SOTA性能上表現搶眼:MiniMax 測試了Agent工作流程中最重要的三項基準測試:SWE-Bench(它能否真正修復真實程式碼庫中的真實錯誤)、BrowseComp(能否搜尋網路並找到正確的資訊)和 BFCL(能否可靠地呼叫工具)。測試結果分別為 80.2%、76.3% 和 76.8%針對複雜任務,M2.5進行了執行效率的最佳化,速度提升了37%,速度提升聽起來似乎只是錦上添花,但當你運行一個Agent循環,模型在每個任務中呼叫自身 50 次以上時,速度的提升就顯得至關重要了每秒100token運行,每小時成本僅需1美元,這讓長周期Agent的無限擴展在經濟上成為了可能。具體來看,M2.5在以下幾個維度實現了突破。像架構師一樣思考的程式碼能力在程式設計評估中,M2.5相比前代產品有了顯著提升,達到了SOTA水平,尤其是在多語言程式設計任務中表現突出。與以往最大的不同在於,M2.5展現出了軟體架構師的思維與規劃能力。在訓練過程中,模型湧現出了編寫規格說明書的傾向:在敲下第一行程式碼前,它會主動從資深架構師的視角出發,對項目的功能、結構和UI設計進行拆解與規劃。在超過20萬個真實世界環境中,針對Go、Rust、Python、Java等10多種程式語言進行了訓練。這使得M2.5的能力遠超簡單的程式碼修復,而是覆蓋了複雜系統的完整開發生命周期:從0到1的系統設計與環境搭建,到1到10的開發,再到後續的功能迭代、程式碼審查和系統測試。它能處理跨Web、Android、iOS和Windows的全端項目,涵蓋伺服器端API、業務邏輯和資料庫,而不僅僅是前端網頁的演示。在更複雜的VIBE-Pro基準測試中,M2.5的表現與Opus 4.5持平。在SWE-Bench Verified評估集的Droid和OpenCode不同程式碼代理框架下,M2.5的得分分別為79.7和76.1,均超越了Opus 4.6。更精準的搜尋與工具呼叫為了應對更複雜的任務,高效的工具呼叫和搜尋能力是必選項。在BrowseComp和Wide Search等基準測試中,M2.5均取得了業界領先的成績。即便面對不熟悉的腳手架環境,它的表現也更加穩定。針對現實中專業人士不僅僅是使用搜尋引擎,而是需要在資訊密集的網頁中進行深度探索的特點,MiniMax建構了RISE評估體系。結果顯示,M2.5在真實場景下的專家級搜尋任務中表現優異。更重要的是決策效率的提升。相比前代M2.1,M2.5在解決同類任務時使用的輪次減少了約20%。這意味著模型不再僅僅是找對答案,而是在用更高效的路徑進行推理。真正的辦公場景交付M2.5在訓練之初就確立了產出可交付成果的目標。通過與金融、法律和社會科學領域的資深專家深度合作,將行業隱性知識注入模型訓練流程。這使得M2.5在Word、PowerPoint和Excel金融建模等高價值工作場景中能力顯著提升。在內部建構的Cowork Agent評估框架GDPval-MM中,通過對交付物質量和代理軌跡專業性的雙重評估,M2.5在與主流模型的對比中取得了59.0%的平均勝率。極致的效率與成本控制現實世界充滿各種deadline,速度即正義,現在模型都太貴了,我們急需要一款能打的便宜的模型M2.5的原生服務速度達到每秒100 token,幾乎是其他前沿模型的兩倍。加上強化學習對高效推理的激勵,其在複雜任務上的時間節省效果明顯。以運行SWE-Bench Verified為例,M2.5完成每個任務平均消耗352萬token,端到端執行階段間從31.3分鐘縮短至22.8分鐘,速度提升37%。這一速度與Claude Opus 4.6相當,但單任務總成本僅為後者的十分之一。為了實現智能不僅強大而且便宜到無需計費的願景,M2.5推出了兩個版本:M2.5-Lightning:穩定吞吐量每秒100 token,每百萬輸入token 0.3美元,輸出2.4美元。M2.5:吞吐量每秒50 token,價格減半。這意味著,以每秒100 token的速度連續運行一小時僅需1美元。如果以每秒50 token運行,價格降至0.3美元。換算下來,只需1萬美元,就可以讓4個M2.5實例連續運行一整年。從去年10月下旬至今,M2系列經歷了三次迭代,改進速度超出了預期,特別是在SWE-Bench Verified基準上,進步速度明顯快於Claude、GPT和Gemini系列。MiniMax M 2.5如何做到的這一切進步的核心驅動力來自於強化學習的規模化。MiniMax將公司內部的任務和工作空間轉化為RL訓練環境,目前已有數十萬個此類環境。為了支援這種規模的訓練,團隊自研了代理原生RL框架Forge。該框架引入中間層,將底層訓練推理引擎與代理完全解耦,支援任意代理整合,並最佳化了模型在不同腳手架和工具間的泛化能力。通過最佳化非同步調度策略和樹狀結構的樣本合併策略,訓練速度提升了約40倍。在演算法層面,沿用了CISPO演算法以確保MoE模型在大規模訓練中的穩定性,並引入過程獎勵機制來解決長上下文中的信用分配難題。M2.5的實戰演練目前,M2.5已全面部署在MiniMax Agent中。通過將核心資訊處理能力提煉為標準化的Office技能,當處理Word格式化、PPT編輯和Excel計算等任務時,Agent會自動載入相應技能。使用者還可以結合特定領域的行業SOP與Office技能,建構針對特定場景的專家。例如在行業研究中,Agent可以嚴格遵循成熟的研究框架SOP,配合Word技能,自動抓取資料、梳理邏輯並輸出格式規範的研究報告,而非簡單的文字堆砌。在MiniMax公司內部,M2.5已經承擔了日常營運中30%的任務,覆蓋研發、產品、銷售、HR和財務等部門。在編碼場景中,M2.5生成的程式碼更是佔到了新提交程式碼量的80%。 (AI寒武紀)
1美金時薪雇個全端替身,MiniMax M2.5讓打工人也能體驗當老闆的感覺
春節檔模型大戰,又殺出一匹黑馬。今天,MiniMax正式官宣了已經提前兩天開跑的新模型M2.5,依然主打智能體和Vibe Coding,性能比肩Claude Opus 4.6。它不挑食,PC端、手機App、React Native、Flutter全能寫,而且是前後端帶資料庫的真全端。以前的模型頂多給你畫個皮(前端),M2.5是連皮帶骨頭(前端+後端+資料儲存)都能給你交付。它還是為智能體生態而生的,配合OpenClaw這種腳手架,能把你的自然語言直接變成電腦上的具體操作。你只需要懂業務邏輯,剩下的全端程式碼實現,它能以100TPS的速度秒回交付給你,而且每小時成本只要1美金。10B啟動參數躋身第一梯隊M2.5這次在寫程式碼和跑任務這兩個硬指標上,直接和Claude Opus 4.6站在了同一條水平線上。比如在程式設計最硬核的SWE-Bench Verified榜單上,它拿到了80.2%的高分,在多語言任務Multi-SWE-Bench上更是拿到了第一。而且它在Vibe Coding模式下能通吃全端,能從介面一路寫到後端邏輯和資料庫設計,一次性交付整套能用的程式碼。比如面對一個“豪華貓咪隧道電商網站”的需求,不僅要極簡風、視差滾動效果,後台還得帶個3D配置器。M2.5跑出來的結果能直接呈現出大片級的自動播放視訊效果,連那種可以點著玩的3D配置器也跑得有模有樣,出來的網站整體感覺非常高級,而且是個真正能直接運行的完整項目。這種底氣來自於它進化出了“原生Spec行為”——在動手寫程式碼前,它會像架構師一樣主動拆解功能結構和UI設計。而且能全端通吃,是因為它是在Go、Rust、Python等10多種程式語言和幾十萬個真實環境中鍛鍊出來的。在處理長鏈路任務時,M2.5也是專門最佳化過的,不管是主流框架還是自己寫的指令碼,它都能順暢配合。這裡它引入了Process Reward(過程獎勵) 機制,能全鏈路監控完成質量,解決了長任務容易“跑偏”的難題。這種機制帶來的邏輯能力在處理繁瑣、重複性高的活時特別明顯,比如統計福布斯富豪榜,就需要去抓取淨資產、年齡和財富來源。M2.5生成的表格非常老練,它會自動建好Cover、BillionairesData和Sources三個Sheet,把封面、資料來源和詳細資料分得清清楚楚,格式規整得像個強迫症員工做的。能幹這麼重的活,M2.5的啟動參數量其實只有10B,是第一梯隊裡體型最小的旗艦模型。配合上深度最佳化的思考鏈路,它的推理吞吐量飆到了100TPS,這個速度是主流旗艦模型的2倍,跑大規模資料清洗或者改程式碼Bug任務時,也能體驗到那種瞬間刷屏的快感。文能編寫全端程式碼,武能操縱本地系統前面兩個線上DEMO,只是開胃小菜,接下來就把M2.5帶到真刀真槍的智能體環境當中拉練一番。按MiniMax的說法,適配各種不同的智能體框架,是M2.5的一大優勢能力。既然說到智能體框架,那不得不提的就是爆火的OpenClaw了,所以乾脆就在我的電腦上安裝一個,然後把M2.5接入進去試試。由於M2.5剛出,OpenClaw的安裝嚮導裡還沒有這個選項,因此安裝的過程手動折騰了一番,這裡也就不詳述了,總之最後是成功接入了進來。不過,通過後台看板和OpenClaw對話實在是太麻煩了,所以我打算把它接到我的飛書裡。拳腳已經給M2.5搭建好,接下來就看這個大腦怎麼發揮了。我用Python生成了一個裝了100個亂七八糟財務檔案的資料夾丟在桌面,然後給OpenClaw一個非常直接的任務:先把所有檔案名稱清洗一遍,統一改成“日期+供應商+金額”的格式。當然這還不算完,它得把這些資料吃透,按支出分類整理好,最後直接生成一份帶圖表的月度財務分析PPT,不僅要圖文並茂還得看著美觀。先看一下,整理之前的檔案長這樣:接下來呢,我們就通過飛書把任務佈置給M2.5正在操縱的OpenClaw。chua的一下,整個資料夾裡的檔案齊刷刷改了名字,變成了我們要求的格式。同時在飛書裡,OpenClaw也匯報了它的工作進度,總結了這個月的支出情況。至於PPT,顯然我懶得去資料夾裡翻找,所以直接通過飛書讓OpenClaw給我發了過來。激動人心的驗收時刻馬上就要到了。M2.5指揮的OpenClaw,自己選了個很有科技感的深色主題,藍綠配色看著就很舒服。而且它不是光把資料填進去就完事了,還真的看懂了那些帳單。比如在餅圖裡,它一眼就揪出來“雲端運算服務”佔了快90%的大頭,還在核心指標頁裡特意標註了第2周支出最高。在最後一頁它還提出了改進建議,發現在“星云云計算”上花錢太多,直接建議去談個年度合同降本。這種能從資料裡挖出業務洞察的能力,已經超越了單純的圖表製作。可以看出在智能體環境中,M2.5的確是一個合格的大腦,讓我體驗到了一種當老闆的感覺✨(⌐■_■)✨。除了智能體之外,還有一項讓MiniMax引以為傲的技能,就是Vibe Coding。這裡我們用VSCode,通過Cline進行連接,看M2.5能不能一勺燴地搞定後端、前端、通訊、部署偵錯這套完整的開發流程。我讓它用Java Spring Boot寫一個多人即時協作的待辦清單系統。功能上其實不簡單,得用WebSocket做多端的即時同步,還得卡死權限,誰建的任務誰才能改。另外對介面美觀度也有要求,必須得呈現出科技感,給人一種駭客終端的感覺。接到任務之後,M2.5先從pom.xml和application.yml兩個文件開始寫起。這倆檔案是Java Spring Boot項目的“心臟”和“大腦”。pom.xml相當於給建構工具(Maven)看的購物清單。也就是你要做這個“待辦清單”項目,需要用到那些現成的零件(依賴包)。application.yml(運行說明書)則是給程序看的設定面板。軟體啟動後具體怎麼跑,都在這裡定規矩。這兩個清單列好之後,就開始寫主體和各個模組的JAVA程式碼,還有前端HTML,另外還建立了一個資料庫檔案。這一切都寫好之後,M2.5驅動的Cline會自動對程序進行編譯運行,並且如果在這個過程當中遇到了報錯,還會讀取錯誤資訊,自動對程式碼進行修改。一番折騰之後,後台程序終於開始運行,前端頁面也在8080連接埠跑起來了,確實介面既簡潔又具有我剛才要求的科技感。簡單測試一下任務的新增、刪除和進度調整,還有暱稱的修改,都沒有問題。但是,這裡看到的效果並不能證明真的是後端服務正常運行,因為這樣的效果純靠前端也能實現。所以接下來還得拿出“照妖鏡”,通過多端同步這項技術要求,看一下是不是真的有後端在工作。這裡我把手機(通過區域網路訪問部署在電腦端的頁面)的螢幕都投到了電腦上,然後分別在兩端對任務進行增、刪、改,觀察另外一台裝置的即時變化。結果所有的操作,都即時同步到了另一端,說明後端正在工作,M2.5是真的把這個系統的前後端全給跑通了。嗯,M2.5宣傳的全端工程能力,確實已經比只會在前端搞一些花拳繡腿的模型高出一個level了。總之,還是我們常說的那句話,測試這些案例只是拋磚引玉,更多新奇的玩法,還等待著你的後續探索。AI大爆發即將到來這一波M2.5的出現,給我們帶來了一個明確的訊號——AI應用的大爆發,已經就在眼前了。在過去100多天裡,M2系列在程式碼能力上的進步速度直接拉出了一條陡峭的陽線,保持著行業最快的迭代節奏。這說明現在的模型,在“腦子好使”這件事上已經準備好了。而且它還解決了“貴”和“慢”這兩個最硬的攔路虎,把推理速度幹到了100TPS,還帶來了1美金就能讓智能體連續工作一小時的“白菜價”。它展現出的那種全端一肩挑的能力,使得它在MiniMax內部,已經接管了30%的真實業務,從寫程式碼到做財務報表什麼都干。它能一口氣把事辦成,開發者不用再天天盯著細節改Bug,能放心大膽地讓AI去跑那些長鏈路的業務。以前我們總說AI是Copilot,但在M2.5這種能獨立扛事的模型面前,它已經成為你的生產力引擎了。接下來,你只需要負責踩油門(下達目標),至於引擎蓋底下怎麼轉,就是AI的事了。 (量子位)
被低估的科大訊飛:賺錢的AI公司,反而更便宜?
港股近期,正接連上演兩場AI資本盛宴。智譜AI於2026年1月8日登陸港交所,發行價116.2港元。這家2024年全年營收僅3.124億元的公司,從2022年到2025年上半年已累計虧損超62億元,卻在資本市場一路狂飆。截至2月12日,其股價一舉沖上402港元,單日大漲28.68%,市值達到1792億港元。另一邊,MiniMax緊隨其後在1月9日掛牌,發行價165港元,首日收盤便衝到345港元,漲幅高達109.09%。它2025年前三季度營收約3.76億元,2022年至 2025年9月累計虧損13.19億美元,同樣是典型的高速燒錢模式,截至2月12日市值已達1844億港元。兩家港股AI新貴,一家全年營收剛過3億,一家前三季度不足4億,都還在虧損、都未跑通穩定盈利模型,市場卻慷慨給出了近兩千億港元的天價估值。再把目光移回A股,科大訊飛2024年營收233.4億元,2025年業績預告確認全年營收繼續正向增長,歸母淨利潤7.85億到9.5億元,是已實現盈利的AI企業。那市值呢?截至2月12日,公司股價57.84元,總市值約1337億元人民幣。由此看來,兩家還在虧損的AI公司,市值各自逼近1800億港元;一家已經盈利的,反而不到1400億人民幣。就在這個時間窗口,科大訊飛40億定增方案已於2月12日獲深交所稽核中心稽核通過,後續待證監會註冊。而這筆定增裡最值得玩味的部分,不是40億本身,而是董事長劉慶峰的個人選擇。01. 用自己的錢投票根據公告,科大訊飛此次募資總額不超過40億元,發行股數不超過1億股,佔總股本4.33%。錢怎麼花:24億投向算力底座平台建設,8億用於教育領域AI應用落地,剩下8億補充流動資金。發行對象不超過35名特定投資者,定價方式是發行期首日前20個交易日均價的80%。條款中規中矩,沒什麼特別值得說的;值得說的是劉慶峰自己的動作。認購主體是言知科技,劉慶峰持有其69.52%股權,是實際控制人。認購金額2.5億到3.5億元,資金來源寫得很明確:自有資金。不是公司出錢,不是質押融資,不是通過任何結構化安排讓風險轉嫁出去,是他自己口袋裡的錢。自有資金,不挑價格,18個月不能動。很少能看到一家A股公司的實控人,用這種方式參與自己公司的定增。對於任何一家上市公司來說,拿企業的錢去做戰略投資,和拿自己的錢下注,是兩種完全不同的心理狀態。前者即使失敗了也不過是報表上的一筆減值,後者虧了就是真虧了,沒有任何緩衝墊。劉慶峰的言知科技願意把2.5億到3.5億的資金放進來,這筆錢對任何人來說都不是小數目。再看定價方式,他不參與競價。A股定增市場上,控股股東或關聯方參與認購時,通常會在定價環節爭取一些有利安排,畢竟鎖定期內股價波動的風險是真實存在的,能在價格上拿到一點折扣就多一層安全邊際;可劉慶峰選擇接受市場定價,其他投資者競出什麼價格,他就跟什麼價格。然後是鎖定期,這可能是整個方案中最耐人尋味的細節。A股定增的標準鎖定期是6個月,這是監管最低要求。很多定增項目股價在解禁日前後出現劇烈波動,本質上就是參與者在兌現退出。劉慶峰給自己定了18個月,是標準鎖定期的3倍。18個月意味著什麼?意味著從定增落地到他可以動這筆股份,中間要經歷至少六個季度的業績週期。這段時間內如果公司業績低於預期、股價下跌,他沒有任何手段對這部分投入止損。劉慶峰選在這個節點入場,18個月鎖定期從定增落地算起,到期大致是2027年中。這段時間剛好覆蓋幾個關鍵節點:2025年報正式發佈、2026年上半年業績驗證等等。一個季度的利潤改善可以被市場歸為偶然,兩個季度可以被解釋為基數效應。但如果從2025年開始,利潤持續兌現、現金流持續改善、大模型收入從中標轉化為持續合同——這條鏈條每多一個季度的驗證,市場就越難繼續用現在的估值體系去定義科大訊飛。02. 利潤拐點已至智譜1792億港元、MiniMax1850億港元——這兩個數字至少證明了一件事:市場願意為AI故事掏大錢。訊飛的故事被忽略了,不是因為它不夠好,是因為它可能太早開始賺錢了,反而被塞進了傳統軟體公司的估值框架裡。虧損公司有想像空間,盈利公司只有PE倍數,這是市場的定價框架失誤,並非公司自身的基本面有什麼毛病。根據業績預告,2025年科大訊飛歸母淨利潤7.85億到9.5億元,同比增長40%到70%。扣非淨利潤2.45億到3.01億元,同比增長30%到60%。歸母和扣非同時在漲,這個細節很關鍵——把政府補貼、資產處置這些一次性收益剝乾淨之後,主營業務本身的賺錢能力還是在變強。而且營收仍在正向增長,利潤不是靠縮表省出來的。另外,看現金流,科大訊飛2025年經營活動現金流淨額超過30億元,歷史新高;銷售回款總額超過270億元,同樣創下歷史新高。這兩個歷史新高值得多說兩句。A股市場上增收不增利的公司一抓一大把,增利不增現金流的公司也不少——利潤表好看但錢收不回來,應收賬款越堆越高,這種故事大家見得太多了。尤其是To B和To G業務佔比高的公司,賬期長、回款慢幾乎是行業通病,很多公司的利潤增長最後都卡在了“錢收不回來”這一關。訊飛的業務結構裡To B和To G這兩塊佔比不小,但270億的銷售回款和30億的經營現金流,意味著公司的經營狀況相當穩健和健康。翻看這份業績預告,還有一些相當正面的商業化數字。2025年,科大訊飛大模型相關項目中標金額23.16億元,根據智能超參數發佈的《中國大模型中標項目監測與洞察報告(2025)》,這個數字超過行業第二名到第六名的總和。更重要的是,這些合同在未來幾個季度會逐步轉化為確認收入,構成2026年乃至更長時間維度的業績支撐。C端同樣在跑,AI學習機連續三年拿下品類銷冠——京東天貓618、雙11學習機品類全週期銷額第一。學習機這個品類的特殊之處在於,家長的購買決策極度依賴口碑和效果驗證——不是靠低價補貼能砸出來的,在這一領域,能做到連續三年品類第一的產品,屈指可數。開放平台的資料也值得拉出來看,開發者總數突破1000萬,其中:有127萬大模型新增開發者,在2025年選擇訊飛平台來做大模型開發的人,比絕大多數AI公司的全部開發者基數都大;56.4萬海外開發者,證明訊飛的平台吸引力不止於國內市場;最後,則是42.7億的終端覆蓋量級,意味著開發者在這個平台上做出來的應用,天然就有一個巨大的分發網路在等著。B端23億中標,C端三年品類銷冠,開發者1000萬,覆蓋終端42.7億,這張成績單對應的市值是1314億元人民幣。在對比港股那幾家漲到飛起的AI公司,幾組數字放在一起,已經無需多言了。03. 結語市場有時候會犯一種錯——把“已經盈利”當成利空,把“還在虧錢”當成利好。虧損公司被冠以“想像空間”四個字,於是估值可以天馬行空;盈利公司有了真實的財務報表,反而被拿著放大鏡挑毛病,被框進PE、PEG這些傳統估值模型裡,壓得死死的。這種分類方式聽起來荒謬,但它確實在主導資金的流向。投資者追捧虧損公司的邏輯是“現在不賺錢沒關係,未來賺大錢”,但對已經開始賺錢的公司,盈利反而成了被質疑的起點,而非被獎勵的終點。AI行業走到今天,真正的分水嶺不是誰的發佈會更炫、誰的benchmark跑分更高,而是誰先把“技術→產品→收入→利潤”這條完整閉環走通。這條鏈條上,每一個箭頭都是一道篩選——有技術的不一定能做出產品,有產品的不一定能賣出收入,有收入的不一定能轉化為利潤。絕大多數AI公司還停留在前兩個箭頭的位置,市場給它們的估值,賭的是後面的箭頭也能走通。而訊飛已經站在最後一個箭頭的右邊了。市場給還在虧損的AI公司1800億港元的定價,給已經走完閉環的訊飛1337億元人民幣——這中間的價差,是單純的認知滯後。訊飛可能不是最性感的AI標的,它沒有那種“從零到一改變世界”的敘事光環。但對於一個營收利潤在增長、現金流創歷史新高、大模型中標金額甩開所有對手的公司,市值比兩家還在燒錢的初創公司都低,那它就可能是當下最被低估的AI公司。這個定價,遲早會被修正。 (躺平指數)
你追我趕!國產大模型春節檔密集上新
國產AI大模型春節檔密集發佈。在智譜正式推出新一代旗艦模型GLM-5,Minimax亦上線Minimax 2.5。同時,DeepSeek已在網頁及App端進行模型的版本更新,上下文窗口由原有的128K直接提升至1M(百萬Token)等級,能夠單次完成處理一部長篇小說。《科創板日報》記者獲悉,阿里千問的Qwen 3.5、字節跳動的豆包大模型2.0預計也將在春節期間發佈。從已發佈的模型來看,程式設計和智能體能力成為重點。但隨著智能體任務複雜度提升,單次任務的token消耗在急劇增加。若無法進一步降低成本,將影響未來AI的規模化落地。▌MiniMax、智譜瞄準AI程式設計2月12日,MiniMax正式上線最新旗艦程式設計模型MiniMax M2.5。作為全球首個為Agent場景原生設計的生產級模型,其程式設計與智能體性能 (Coding & Agentic)比肩國際頂尖模型,直接對標 Claude Opus 4.6,支援PC、App、跨端應用的全端程式設計開發,尤其在Excel高階處理、深度調研、PPT等Office核心生產力場景中均處於行業領先(SOTA)地位。M2.5模型啟動參數量僅10B,在視訊記憶體佔用和推理能效比上優勢明顯,支援 100 TPS超高吞吐量,推理速度遠超國際頂尖模型。而智譜在前一日推出的旗艦模型GLM-5,同樣主攻程式設計與智能體能力。GLM-5參數規模由上一代的355B擴展至744B,啟動參數從32B提升至40B。內部評估顯示,GLM-5在前端、後端、長程任務等程式設計開發場景中,平均性能較上一代提升超20%,真實程式設計體驗逼近Claude Opus 4.5水平。由於GLM-5的超強表現,智譜在港股近四個交易日實現翻倍,從203港元今日最高漲至443港元,收盤價已經逼近Minimax。過去一年,AI程式設計發展迅猛。Anthropic此前發佈的《2026年智能體編碼趨勢報告》中指出,傳統軟體開發的遊戲規則正在被徹底改寫。一個曾預計需要4到8個月的項目,使用Claude大模型後僅用兩周就完成。《報告》明確指出,程式設計師這一職業並不會消失,但那些“只會寫程式碼”的程式設計師將逐漸被市場淘汰。Anthropic的CEO達里歐·阿莫代伊在一年前就曾預言:“未來3~6個月,AI將編寫90%的軟體程式碼。”如今,這一預言正逐步轉化為現實。這或將對傳統軟體行業帶來影響。業內分析認為,AI智能體可以直接呼叫軟體底層系統,這動搖了傳統軟體“按人頭訂閱”的盈利邏輯,推動行業向“按使用計費”的模式轉型。▌智能體成為最核心的競爭主線CIC灼識諮詢TMT行業相關分析師對《科創板日報》記者表示,國產大模型競爭已從單純的參數規模競賽,全面轉向以技術差異化、應用場景深耕與成本效率為核心的新階段。春節期間及近期,各廠商的發佈與迭代均圍繞此主線展開。除了騰訊元寶和阿里千問等推出的行銷活動帶動市場對生態側的關注,近期字節跳動發佈的Seedance2.0、DeepSeek的V4模型和MiniMax上線的Agent平台等,從技術細節來看,無論是基座模型還是Agent的更新,都反映出智能體工程(Agentic Engineering)成為技術路線的重要競技場,AI企業對於模型的推理效率和長期任務表現更加注重,從大模型廠商當下模型設計的實際來看,產品形態也越來越Agent導向。圖片由AI生成灼識諮詢分析師表示,通用大模型在複雜業務邏輯和專業知識場景中表現有限。智能體通過整合領域知識、工具呼叫、工作流編排等能力,能夠深入垂直場景,提供專業化、自動化的解決方案,真正實現生產力變革。經歷近幾年的發展,市場普遍對於AI在實際場景中能夠帶來的真實價值更加關注,智能體是連結模型與使用者場景的關鍵一步,自然也是競爭的焦點。IDC中國研究經理孫振亞認為,大模型的能力正在從純粹的生成式輸出向智能體能力進化。“可以看到,各家模型廠商都在程式碼、多模態、長上下文和工具呼叫能力上做針對性的最佳化。程式碼和工具呼叫能力讓模型能夠進行執行和操作,多模態能力讓模型的感知從文字擴展至圖文音視訊,長上下文讓模型能處理更多的環境和記憶資訊。這些能力是模型能不能在更多場景中幹活並產出價值的基礎,也是智能體能力的重要組成部分。”▌AI規模化落地仍要過成本關談及AI規模應用的挑戰,CIC灼識諮詢TMT行業相關分析師表示,國內AI生態在晶片、框架、模型、應用層仍存在一些碎片化問題,需要進一步統一。在成本方面,他指出,從B端(企業端)來看,儘管API呼叫成本下降,但企業若追求私有化本地部署,一次性硬體投入和長期維運成本依然高昂且需要明確的業務價值閉環來證明投資回報,企業端部署的投入產出比(ROI)仍舊需要進一步驗證。孫振亞也表示成本是一大挑戰。隨著智能體任務複雜度提升,模型需要處理的上下文越來越長,呼叫鏈路越來越深,單次任務的token消耗在急劇增加。成本降不下來,智能體就只能停留在高價值場景,很難真正普及。另外,可靠性也是瓶頸。灼識諮詢分析師稱,一些行業對於可靠性要求極高,當前技術未能完全消除幻覺。孫振亞同樣指出,當前AI在執行複雜任務時的穩定性還不夠,模型依然存在的幻覺問題,使得複雜場景下多步執行非常容易出現錯誤累積。如果沒有可靠性,就談不上規模化落地。而在治理與信任方面,孫振亞表示,隨著AI從輔助工具走向自主執行,權限管理、審計追溯、責任界定這些治理能力必須跟上。“企業敢不敢讓AI去做決策、出了問題誰來負責、AI的操作過程能不能被審計。這些解決了,AI才會真正在各行業大規模落地。”灼識諮詢分析師還指出,在敏感領域,資料出域安全、模型訓練資料的合規性與質量、以及智能體互動中的資料隱私保護,也是規模化落地的主要障礙之一。 (科創板日報)
春節檔國產AI模型混戰開打,MiniMax-M2.5上線,隨手做“蘋果系統”
一句話做“黃金礦工”遊戲、生成精美公司網站。春節將至,國產AI大模型之戰愈發火爆。短短1天多時間,DeepSeek、智譜、字節等多家廠商模型密集更新,MiniMax-M2.5正式上線,其重點提升了Agent和程式設計能力。▲MiniMax-M2.5已可選MiniMax AI相關負責人在X平台上發文稱,他想盡快發佈M2.5,已經迫不及待想回家過年了,但隨著他們投入的訓練計算增多,模型效果也越來越好,這是一個痛並快樂著的問題。▲MiniMax AI工程負責人Skyler Miao在X平台發文智東西第一時間體驗了MiniMax-M2.5在定時任務、網頁製作、調研報告撰寫、視訊生成、PPT製作等任務執行上的能力。從結果來看,網頁製作是其強項,尤其在可視化表達方面,網頁的視覺呈現效果較好,比如我可以一句話讓它生成一家公司的投資分析儀表盤。▲關於蘋果公司的可視化儀表盤分析網頁做一個“黃金礦工”網頁版遊戲,MiniMax-M2.5也可以給出不錯的結果。▲網頁版黃金礦工小遊戲定時任務方面,其可以按照要求按時完成任務,但不同任務呈現的結果質量有一定差異。此外,不論是PPT製作還是調研報告生成,其生成結果的詳實程度都較好,輸出篇幅較長。有X平台使用者提前三天拿到了內測資格,他發文稱,MiniMax-M2.5提升明顯,和Opus 4.6打的有來有回,其模型體積小,據傳Mac mini也能部署。他還曬出了MiniMax-M2.5製作的網頁版“macOS系統”。▲X平台使用者評價截至2月12日港股收盤,MiniMax股價漲幅14.62%,總市值1622億人民幣,其股價盤中曾一度漲幅超23.5%。根據官網資訊,MiniMax將於3月2日公佈全年業績。▲截至2月12日收盤,MiniMax港股股價情況01.網頁設計是強項一句話做“黃金礦工”小遊戲首先,在考察程式設計能力的網頁製作環節,我們讓模型建立一個網頁儀表盤,對蘋果公司進行可視化分析,內容必須涵蓋財務健康狀況、技術面/市場情緒、競爭對手比較以及戰略估值(SWOT/內在價值),以提供明確的投資建議。從結果來看,需求中提到的基本指標都有較好覆蓋,SWOT分析給出的較為具體,整體網頁設計比較簡潔、美觀,基本的動效都已做好,資料展示較為直觀,滑鼠懸停在統計圖表上會有對應資料呈現。接著,我們讓模型為一家AI創業公司設計官方網站,融入太空主題元素,使用黑、白、灰作為主色調,營造出酷炫、精緻且充滿科技感的氛圍,特別要有一個能讓使用者感到震撼的精美地球動畫。從結果來看,網頁焦點處確實有地球動畫效果呈現,且地球本身可以跟隨滑鼠進行一定程度的運動。但網頁本身並沒有實現主色調的要求,對於精緻、科技感的要求沒有明確呈現,地球動畫本身帶有一些類似“粒子光效”的表現,但整體感覺並未達到“震撼”的水平。網頁遊戲製作令我們印象比較深刻,雖然第一次的生成效果“翻車”,遊戲無法互動遊玩。▲初次生成的版本無法遊玩,僅有首頁封面基本的遊戲模式、遊戲說明、遊戲關卡、遊戲操作都按照要求完成了,並且確實可以遊玩,遊戲過程還配合了對應的音效。02.專業報告一鍵生成PPT製作學會用比喻潤色此外,我們通過幾個任務測試了模型生成專業研究報告的能力,比如全面梳理AI開源推理生態、分析應用場景、對應方案並分析原因。從結果來看,其輸出內容邏輯清晰,在展示不同框架異同時用了表格進行對比,內容較多比較詳實,約6000字。▲AI開源推理生態相關研究報告生成對於“計畫開發一款針對初學者的AI 3D建模工具”這一需求,我們讓模型分析目標使用者畫像和使用者在主要場景下的核心痛點,並推匯出對應的潛在功能需求,寫出MVP需求文件和初期營運增長路徑。▲AI 3D建模工具產品MVP需求文件從結果來看,所有需求要點都有比較準確的對應資訊,需求文件和營運增長路徑都有多個表格呈現梳理的內容,路徑規劃較為具體。▲AI 3D建模工具初期營運增長路徑PPT製作環節,我們要求PPT“讓學生真的能聽進去”,舉的例子能讓他們產生共鳴,對於這一需求,模型在PPT製作中用了很多“比喻”,融入了一些當代元素,比如“唐朝朋友圈”、將長安城比作“北上廣深”、將杜甫比作關注民生的“新聞記者”。不過模型在PPT製作的美觀程度和細節嚴謹程度方面還有待提升。03.新聞報告成“舊聞彙總”視訊生成仍有最佳化空間Agent能力方面,我們還測試了兩個定時任務,包括每日科技要聞摘要和TikTok熱門趨勢周度分析。雖然需求強調了是24小時內新聞,但給出的8個新聞全部為“過時消息”,基本均為2025年舊聞。這樣即便總結的新聞內容較為準確,但已經失去了最根本的“新聞”屬性。▲每日科技新聞摘要同時,對於檢索來源的標註只標明了媒體名稱,並未帶上對應的網頁連結。在TikTok熱門趨勢周度分析任務中,模型首先總結了核心趨勢動向,接著對熱門挑戰、熱門音訊、熱門話題標籤、重要創作者等部分進行了分析總結,最後按照要求給出了內容創作建議。▲TikTok熱門趨勢分析報告最後,我們簡單嘗試了視訊生成,從結果來看,模型並沒有對需求中狗的品種有精準呈現,不過畫面的氛圍、主物體動作、背景元素都有精準還原。提示詞:結果:04.結語:程式設計和Agent能力仍是模型競賽焦點雖然MiniMax-M2.5尚未官宣發佈,但從實際體驗和公開評價來看,其提升的重點仍然是Agent能力和程式設計能力,這也是當前主流大模型競爭的焦點。從生成結果來看,“拿來即用”仍然存在一定距離,大部分結果仍然需要修改校對,對需求的精準呈現仍然存在最佳化空間。 (智東西)
摩根大通:中國AI大戰,“百模大戰”已結束,最大的利潤池歸屬大廠,智譜和MiniMax如何突圍?
中國AI行業的“百模大戰”正在落幕,真正的玩家已縮減至10家。最刺耳的結論是,最大利潤池將歸掌控分發的騰訊、阿里等大廠,而非模型公司。獨立廠商中,智譜靠本地化部署守住59%高毛利,MiniMax則靠73%的海外收入和全模態產品突圍。當模型不再稀缺,變現才是王道。當模型不再稀缺,真正稀缺的,是能把模型變成現金流的能力。2月9日,摩根大通證券(中國)發佈研究報告《中國人工智慧行業:全球佈局與模型創新驅動新一代領軍者》,首次覆蓋中國獨立大模型廠商智譜與MiniMax。報告開宗明義:中國人工智慧行業正從“百模大戰”階段,邁向以商業化落地能力、模型創新實力及全球化佈局為決定成敗之關鍵的階段。中國AI市場正在迅速整合,“具備實力且資金充足的模型開發商數量已從超200家縮減至不足10家。”摩根大通犀利指出,國內AI行業最大的利潤池恐將流向掌握分發的平台巨頭;而獨立廠商的突圍,則取決於誰能通過“結構性中立”找到生存縫隙——智譜向內深耕高合規的本地化部署,MiniMax向外拓展高溢價的全球市場。這一判斷的背景並不複雜。報告指出,隨著模型訓練成本、算力獲取門檻和商業化難度持續上升,資本與算力的硬約束開始主導行業結構。換句話說,行業已經不再獎勵“能不能做模型”,而是獎勵“能不能長期活下來”。在摩根大通看來,這一階段的核心變化在於:模型能力逐步趨同;資金消耗呈指數級上升;客戶開始更關注“交付能力、穩定性與可持續性”。這意味著,大模型競爭的主線,正在從技術競賽,轉向商業系統的建構能力。最“刺耳”的結論:利潤池可能不在模型公司在整份報告中,最容易引發市場討論的,並不是對智譜或 MiniMax 的財務預測,而是摩根大通對利潤歸屬的判斷。報告在“中國生成式AI行業的長期利潤池”一節中明確指出:生成式AI的持久利潤池,可能高度集中於大型網際網路平台。“我們仍認為國內生成式 AI 的持久利潤池將高度集中於大型網際網路平台,尤其是騰訊和阿里巴巴,因為它們掌控著全國範圍層級的分發、變現通道以及高頻消費和商戶事務流。摩根大通給出的理由非常直接。第一,平台掌控分發。報告指出,大型網際網路公司天然擁有高頻使用者觸點和成熟應用場景,AI能力更容易被“內化為功能”,而不是作為獨立產品售賣。第二,平台掌控變現路徑。無論是廣告、電商、遊戲、內容付費還是企業服務,平台已經具備成熟的收費機制,AI更多是提升ARPU與轉化率的工具。第三,平台掌控高頻交易與消費流。報告強調,“高頻使用場景決定了推理呼叫量,也決定了規模效應是否成立。”報告用平台觸達舉例:“微信處於日常消費活動的中心,月活使用者合計約 14 億。”騰訊將聊天機器人“元寶”嵌入微信,“使用者可以將其加入為聯絡人進行互動,無需下載單獨應用”。阿里巴巴則把AI變成交易漏斗的一部分:“阿里巴巴升級了旗下千問(Qwen)AI 應用…全面接入淘寶、支付寶、飛豬和高德地圖…AI 壓縮了從瀏覽到支付的漏斗,從而支撐更高的轉化,並有望提高廣告收益率及抽佣率。”在這一框架下,模型能力本身並不必然對應利潤能力。在中國市場,把AI能力送到使用者面前、並把錢收回來,或許往往比模型本身更重要。這也是摩根大通反覆強調的一句話:“模型能力本身並不必然轉化為盈利能力,分發和變現路徑在中國市場尤為關鍵。”獨立模型公司還有沒有機會?既然平台巨頭如此強勢,獨立模型廠商如智譜、MiniMax的生存空間在那裡?摩根大通並未否認獨立模型公司的價值,但其判斷明顯更為現實。報告將行業玩家分為雙軌競爭格局:一類是擁有全端生態的綜合型科技巨頭,另一類是在特定維度具備領先性的獨立模型開發商。在摩根大通看來,獨立模型公司的機會,不在於與平台正面競爭,而在於提供一種“結構性中立”的選擇。報告提及,獨立模型開發商的激勵結構,與平台型公司存在本質差異,其目標是賦能客戶應用,而非與客戶形成競爭關係。“獨立提供商通常通過API、企業授權或私有化部署……直接將模型變現。這些管道服務於同一個根本目標——最大化模型採用及利用——而不要求客戶繫結單一基礎設施或軟體生態。”對於大型企業而言,引入平台模型,往往意味著潛在的戰略依賴風險;而獨立模型商更容易被視為“工具型夥伴”。摩根大通強調:“獨立模型提供商通過結構性中立來緩解這種擔憂。他們的業務激勵依賴於賦能客戶應用,而非與客戶競爭,從而降低感知到的戰略和執行風險。”智譜:用私有化部署守住現金流在摩根大通的分析框架下,智譜被定義為“以結構性持久的本地化業務為錨點,並迎來能力導向型API業務拐點”的典型代表。1. 財務真相:本地化部署才是當前的利潤支柱智譜的商業模式清晰地分為兩部分:本地化部署(On-premise)和雲端部署(Cloud-based)。資料顯示,智譜目前的收入重心在“高合規”需求上:“2025財年上半年,公司總收入的85%來自本地化部署,該業務類股毛利率達到可觀的59.1%,而云端部署毛利率為-0.4%。”摩根大通分析稱,在中國受監管行業(如政府、金融、央國企),本地化部署是通常要求。這不僅僅是一次性買賣。報告指出:“隨著基礎模型的迭代,這一安裝基數有可能演變為升級驅動型、經常性經濟利益。”因為一旦模型嵌入關鍵工作流,切換成本巨大,連續的模型迭代會將本地化部署轉變為一種類SaaS的經常性經濟利益。2. 增長拐點:雲端API蓄勢待發雖然本地化部署賺取了高毛利,但規模化的未來在於雲端API。摩根大通認為,智譜正處於一個重要拐點。隨著GLM-4.7的發佈,智譜戰略重心明顯向智能體系統和工具增強推理傾斜。報告指出:“我們預計隨著GLM-4.7在全球開發者社群(尤其是在高付費意願和使用強度的程式設計工作流領域)中獲得認可,其採用率將加速提升。”摩根大通預測,隨著規模效應顯現,“我們預計2025年下半年起雲端部署的收入和利潤率將雙雙爬坡。”3. 估值與預測基於其穩固的本地化基本盤和高增長的API潛力,摩根大通給予智譜“增持”評級,目標價400港元。增長預測: 預計2026-2030年營收年複合增長率(CAGR)高達127%。盈利時間表: 預計公司將於2029年實現盈利,2030年的正常化調整後淨利潤率將達到20%。融資需求: 預計公司可能需要在2026年和2027年進行外部融資,預計每年的融資金額為50億元人民幣。MiniMax:用全球化ToC跑出能力邊界如果說智譜是深耕國內B端的典範,MiniMax則被摩根大通描述為“擁有可擴展增長引擎的全譜系AI企業”,其核心標籤是“天生全球化”和“全模態”。1. 收入結構:海外佔比超七成,業務“三分天下”MiniMax展現出了與國內其他廠商截然不同的收入畫像。報告披露了一個驚人的資料:“2025年前九個月,公司73%的總收入來自中國以外的市場,已在200多個國家和地區進行部署。”這種全球化佈局帶來了極大的經濟靈活性。摩根大通指出:“在推理成本高企、國內競爭激烈的行業背景下,進入國際市場、多元化的客戶群和差異化的定價環境,為公司提供了結構性優勢。”在業務構成上,MiniMax極好地平衡了風險:“2025年前三季度,開放平台、生成式媒體和AI陪伴業務的營收佔比各約三分之一。”AI陪伴(Talkie/星野): 貢獻35%收入。摩根大通預計到2030年,該業務付費率將達到18%(對標騰訊音樂2023年水平),年度ARPU達到31美元。生成式媒體(海螺AI): 貢獻33%收入。為內容創作者提供視訊工具,年度ARPU高達75美元。開放平台(API): 貢獻29%收入。服務13.2萬名開發者,付費使用者年化ARPU達8200美元。2. 技術策略:技術即產品MiniMax的技術策略被總結為“全端”和“全模態”。報告指出,MiniMax採用混合專家(MoE)架構,迭代速度極快:“兩月一次的模型迭代(速度快於3-4個月的行業平均水平)。”這種速度得益於其獨特的“雙引擎”策略:將消費者應用作為技術的驗證器。“與許多先建構模型、後搜尋用例的AI實驗室不同,MiniMax同時開發模型和消費者產品……隨著每天有數百萬使用者與Talkie互動,MiniMax會收到即時反饋……這種專有的互動資料被反饋到研發流程中,用於微調模型。”3. 估值與預測鑑於其稀缺的全球化能力,摩根大通給予MiniMax“增持”評級,目標價700港元。增長預測: 預計2026-2030年營收CAGR高達138%。盈利時間表: 預計公司將於2029年起實現盈利,2030年調整後淨利潤率將正常化至24%。融資需求: 預計集團將需要在2026年和2027年進行外部融資,預計每年金額為7億美元。一個決定勝負的變數:推理成本在對兩家公司的深入分析中,摩根大通揭示了一個行業共性的財務拐點,這對理解AI公司的長期價值至關重要:算力成本結構將從“訓練驅動”徹底切換為“推理驅動”。報告指出,雖然總算力消耗將持續擴大,但“訓練與推理的增長曲線和成本驅動因素將與2022-25年的擴張階段出現顯著差異”。1. 訓練成本:走向“正常化”隨著基礎模型架構的確立,前沿擴展預訓練將變得更具選擇性。摩根大通預測:智譜: 訓練成本佔算力總成本的百分比將從2025年的93%大幅下降至2030年的32%。MiniMax: 同期佔比將從80%下降至28%。這意味著,過去那種為了追求參數規模而不計成本的“軍備競賽”式支出將告一段落,研發支出將進入更理性的“正常化階段”。2. 推理成本:成為支出的絕對大頭未來的競爭,是推理效率的競爭。摩根大通預測:智譜: 推理相關算力成本佔比將從2025年的7%激增至2030年的68%。MiniMax: 同期佔比將從20%激增至72%。這一變化對財務模型有深遠影響:算力支出將逐漸從“研發費用”(R&D)轉移到“營收成本”(COGS)。這也解釋了為什麼摩根大通如此強調API定價、推理效率(單次呼叫GPU時長)以及利用率對毛利率的決定性作用。這意味著,未來競爭的核心不再是“誰能訓更大的模型”,而是:誰的推理更便宜;誰的利用率更高;誰能掌握定價權。在摩根大通看來,智譜與 MiniMax 的價值,不在於挑戰平台,而在於佔據平台之外但不可或缺的位置。 (invest wallstreet)
大漲!MiniMax Music 2.5來了
受益於近日市場多重利多,港股AI概念股表現活躍,其中MiniMax盤中一度漲超20%。截至發稿,MINIMAX-WP(00100.HK)漲15.98%、微盟集團(02013.HK)漲7.02%、智譜(02513.HK)漲6.40%。此輪行情由MiniMax重磅技術發佈直接催化,併疊加國產大模型商業化處理程序加速的行業共識,市場對垂直場景落地能力的關注度顯著提升。MiniMax今日正式推出Music 2.5音樂生成模型,在“段落級精準控制”與“物理級高保真還原”兩大維度實現關鍵突破。該模型支援Intro、Bridge、Hook等14類音樂結構標籤的全流程定製,創作者可預先設定情緒曲線、高潮節點與樂器編排邏輯,大幅降低試錯成本。音質層面,通過人聲合成演算法最佳化,實現轉音細膩度、顫音自然度及胸腔/頭腔共鳴的靈活切換;在男女對唱場景中,聲部協同與和聲層次顯著增強。模型深度適配華語音樂生態,覆蓋慢歌、說唱、中英混搭等多元風格,並擴充至百余種樂器音色庫,結合智能聲場分離技術,有效解決AI音樂常見的聲部混疊問題。目前,該模型已對接影視配樂、遊戲動態音效、品牌聲效等專業工作流,官方宣稱可滿足錄音室級成品交付標準,為B端內容生產提供工業化解決方案。在更早些時間,1月20日,智譜AI開源輕量級大語言模型GLM-4.7-Flash,強化企業端部署靈活性;同日,MiniMax推出AI原生工作台Agent 2.0,以Desktop App與Expert Agents雙模組建構任務自動化閉環。值得關注的是,海外開發者Peter Steinberger主導的AI助手ClawdBot引發全球技術社區熱議,其公開表示項目近乎全程由AI生成,並特別指出MiniMax 2.1為當前最具“Agentic”能力的國產大模型,目前已在Mac Studio實現穩定本地部署,側面印證國產模型在複雜智能體應用中的工程化實力。機構稱AI應用有望於影視、遊戲等行業實現B端規模化變現廣發證券研報深度指出,隨著AI輔助工具在研發提效、資料分析及業務流程自動化等場景的商業價值被廣泛驗證,企業付費意願正進入實質性提升通道。以MiniMax Music 2.5為代表的垂直領域模型,憑藉專業場景適配能力與交付標準,有望率先在影視、遊戲、廣告等行業實現B端規模化變現。券商進一步強調,國產大模型競爭已從參數規模轉向“技術-場景-商業”三位一體的落地能力比拚,具備垂直深耕與工程化優勢的企業將加速收穫商業化紅利,行業估值邏輯正由概念驅動向業績兌現過渡。微盟集團等SaaS服務商的聯動上漲,反映市場對“AI+企業服務”融合前景的積極預期。 (財聯社AI daily)
馬斯克點贊、黃仁勳約見,總理座談會上的那個年輕人是誰?
2026年1月19日,總理座談會在北京召開。這場會議匯聚了多個領域的專家和企業家,其中一個年輕人引起了很多人的關注。他叫閆俊傑,36歲,看上去有著與年齡不相符的成熟。● 閆俊傑出席總理座談會閆俊傑創辦的MiniMax(稀宇科技),是中國AI大模型的頭部企業之一,成立不到四年,已服務全球200多個國家和地區,超70%的營收來自海外。馬斯克為他的產品點贊,黃仁勳也單獨約見閆俊傑,與他進行兩個小時的閉門會談。而就在不久前,閆俊傑帶領MiniMax在港交所上市,首日股價大漲109%,同時刷新了全球AI企業從成立到上市的最快紀錄。有業內人士指出,閆俊傑出席總理座談會,很大程度釋放了一個明確的訊號:人工智慧正超越純粹的技術範疇,成為改變全球競爭格局的關鍵力量。讓“電影小白”拍出“質感大片”先來看一段視訊,如果沒有提前告訴你,你會相信這是AI做的嗎?該視訊由海外創作者使用海螺AI製作,從場景到人物,效果驚豔宛如好萊塢大片,就連馬斯克都忍不住點贊。而海螺AI正是MiniMax旗下的產品。海螺AI於2024年上線,推出後迅速火遍海外,長達半年時間佔據視訊生成模型賽道全球第一的位置,吸引了大批專業人士如電影導演、數字藝術家、遊戲開發者的關注。並且,其無論是使用介面、提示詞指示還是運鏡,使用門檻都很低,主打一個讓小白也能拍大片。這大概也是其在全球範圍內受追捧的原因之一。● 海螺視訊截圖除了海螺AI之外,MiniMax還自主研發了一系列多模態通用大模型和AI原生產品,涵蓋文字、視訊、語音等核心領域,相關模型均居國際第一梯隊——語言模型全球第一、視訊模型全球第二、文字模型全球前五。●在國際權威的人工智慧模型評測榜單Artificial Analysis上,MiniMax語言模型Speech-02-HD力壓OpenAI、ElevenLabs,拿下全球第一。資料來源:MiniMax招股書這些產品現已服務全球200多個國家和地區,觸達2.12億個人使用者和13萬企業客戶。最關鍵的是,MiniMax的團隊很年輕,385名員工,73.8%是研發人員,平均年齡還不到29歲。這種創作活力,成了MiniMax在全球市場最具競爭力的資本。36歲的掌舵人閆俊傑,在這些90後、00後面前,已經算得上是“老資格”了。“在最壞的條件下尋找最優解”閆俊傑的出身很普通,完全是靠讀書改寫了命運。他1989年出生於河南商丘,本科就讀於東南大學數學學院,系統學習了基礎數學理論,為日後研究人工智慧演算法打下了基礎。本科畢業後,閆俊傑考入中科院自動化研究所,進行碩博連讀,之後進入商湯科技,一幹就是7年。他從實習生做起,一步步做到研究院副院長、副總裁,帶領700多人的團隊,將臉部辨識演算法精準率提升至行業第一,成功應用於安防、智慧城市等場景,為商湯科技的發展立下了汗馬功勞。但就在事業風生水起的時候,閆俊傑做出了一個讓周圍所有人驚訝的決定:辭職。● 閆俊傑在談到這段經歷時,閆俊傑說:“我作為一個做技術的,有一天突然發現,每天AI領域的論文我已經看不完了,這對我觸動非常大。我們都相信人工智慧會讓人類的技術進步更快,但事實上,我們做的很多事並沒有直接促成它。可能是我們的技術路線不對,也可能是,我們關注的問題不是人工智慧應該真正去解決的問題。”到底什麼是人工智慧應該真正去解決的問題?閆俊傑想了很久,直到外公的一句話,讓他恍然明悟。一次回老家,外公告訴閆俊傑說想寫一本回憶錄,把自己過去的經歷都記錄下來,可惜自己文化不高不會打字。一個人一輩子的故事就這樣從世界上消失了,閆俊傑一下子被戳中了軟肋,他突然意識到,人工智慧不應該只是精英們的玩具,它應該更多地去幫助和服務那些最普通的人。於是在2022年初,33歲的閆俊傑辭掉職務,創辦了MiniMax。“MiniMax”這一名稱源自現代電腦之父馮·諾依曼提出的博弈論演算法,即“在最壞的條件下尋找最優解”,這一理念也貫穿了公司發展的始終。開著“面包車”追“超跑”創業的過程比閆俊傑預想的更要艱難。AI是一個極度燒錢的行業,AI領域的競爭,很大程度上是一場算力的較量,而中國在高端晶片、先進製程半導體裝置等方面,面臨著卡脖子的局面。閆俊傑曾在一次公開訪談中坦言,中國企業在算力投入上,可能比美國巨頭少了整整1到2個數量級。什麼概念?舉個例子,就好比對手駕駛著超跑在賽道上風馳電掣,而你卻只擁有一輛改裝過的面包車——這樣的硬體差距,該如何競爭?● 閆俊傑展示他當年寫下的創業計畫。圖片來源:第一財經但閆俊傑沒有放棄,在這場看似懸殊的較量中,他帶領團隊,上演了一場精彩的逆襲:既然硬體拼不過,那就拼架構、拼腦子。他們沒有像其他大廠那樣盲目堆砌參數,而是另闢蹊徑,死磕一種叫做MoE(混合專家模型)的技術。簡單來說,就是將大模型變成一個專家會診團,解決物理問題時就喊物理專家,處理數學問題時就找數學專家,這樣就能以更少的算力資源,實現更高效的運算結果,從而在資源受限的條件下展現出強大的競爭力。以MiniMax旗下M1模型為例,整個強化學習階段僅需512塊H800 GPU訓練三周,訓練成本不過53.74萬美元,僅相當於OpenAI同等參數模型的零頭。用美國科技巨頭1%的成本,實現95%的性能效果,閆俊傑和團隊創造了一個奇蹟。而這種“低成本+高性能+商業化”的路線,也讓MiniMax在全球AI軍備競賽中成功突圍而出。在談到為何能取得如此顯著的成果時,閆俊傑並不居功。他說:出現這一現象的核心原因是,中國的人才隊伍非常優秀,我們把這些優秀的年輕人組合在了一起,這是比較關鍵的。從資源夾縫中突圍MiniMax的成功,讓閆俊傑在業內一戰成名。此後,MiniMax又自主研發了文字模型M2.1、視訊模型Hailuo2.3、語音模型Speech2.6、音樂模型Music2.0等;並推出了一系列AI原生產品,如海螺AI、星野、MiniMax Audio等,在全球範圍內頗受好評。2025年7月,輝達掌門人黃仁勳來華訪問期間,專程約見閆俊傑,兩人進行了兩個小時的深入交流,分享了對中美AI行業當下與未來的看法。閆俊傑也成為黃仁勳此次中國行唯一單獨約見的中國AI創業公司創始人,在圈內引起了熱議。● 黃仁勳(左)和閆俊傑2026年1月7日,韓國總統李在明訪華並出席在上海國際會議中心舉行的“中韓創新創業論壇”。閆俊傑作為MiniMax創始人,也受邀出席,當時就坐在李在明的左手邊。閆俊傑在會上發表講話,他說:“AI沒有國界,MiniMax旗下產品在韓國使用者數量超過200萬人。”並表示,希望能繼續賦能韓國人工智慧、智能硬體等領域,幫助韓國創業者向全球開拓市場。● 1月7日,李在明出席中韓創新創業論壇,右一為閆俊傑而1月19日召開的總理座談會,則讓閆俊傑成了總理的座上賓。閆俊傑代表AI大模型行業登上國家級座談會,這背後離不開MiniMax跨越式發展交出的亮眼成績單。當美國用晶片禁令構築壁壘,以閆俊傑為代表的中國AI創業者,正用另一種方式破局——不是複製“美國模式”,而是用“路徑創新”重構規則。這也是中國工程師的智慧——在資源受限的夾縫中,優秀的中國年輕人總能找到突圍的辦法。這支95後團隊,正憑藉技術敏感度、全球化視野和商業化能力,從巨頭的圍堵中撕開一條路。AI不是替代人類,而是讓人類過得更輕鬆如今的MiniMax市值已達1179億港元(截至2026年1月23日),如此龐大的體量,讓人很難相信這是一家成立不到4年、僅有300多名的員工的初創公司,展現了極大的市場熱度和行業潛力。正如當年MiniMax-M1發佈後,閆俊傑在朋友圈滿懷激情寫下的那句話:第一次感覺到大山不是不能翻越。這句話既是對MiniMax技術突破的總結,也是對中國AI行業征戰全球的期許。● 閆俊傑(中)帶領MiniMax在港交所上市值得一提的是,MiniMax已將核心模型開源,這意味著它將變得越來越有影響力。在閆俊傑看來,無論是AI大模型還是AGI(通用人工智慧),都不應只屬於單獨一家公司,而應屬於AI公司和它的使用者。他願意與所有參與者共享技術紅利,共同推動行業的進步。“這是一個服務大眾的事兒,AI一定會變得越來越普惠。”從小城青年到AI領軍,閆俊傑正以“與所有人共創智能”為信念,在全球AI產業化的處理程序中貢獻自己的力量。AI的價值從不在於替代人類,而在於讓人類更輕鬆地生活和工作。讓創新帶著溫度落地,讓技術真正服務於普通人的需求,這才是企業贏得信任、長遠發展的經營之道。 (最華人)