留給MiniMax找回初心的時間不多了

六一兒童節這一天,沉寂了一段時間的MiniMax氣勢如虹地發佈了全新一代模型MiniMax M3。在官方那篇堪稱完美的萬字技術通告裡,M3被塑造成了一個無所不能的“六邊形戰士”。

它手握著MiniMax最新的技術結晶MSA(MiniMax Sparse Attention)稀疏注意力架構,輕輕鬆鬆拿捏1M超長上下文,能原生處理多模態,甚至能自主運行12個小時獨立復現ICLR 2025的獲獎論文。更令人驚訝的是,官方宣稱M3在權威評測中超越了GPT-5.5和Gemini 3.1 Pro兩款全球頂級模型。

“M3是國內第一個齊備這些要素的模型,也是目前唯一的開源模型”。官方通稿裡的這句斷言,彷彿已經提前宣告了勝利。

然而,兒童節還沒過完,各式各樣的負面消息便接踵而來。歷時三天,狂歡的泡沫還沒有浮出就已經被徹底戳破。無論是官方的推文還是宣發視訊,探討技術突破的聲音門可羅雀,取而代之的是滿天飛的退款需求。

在這個戲劇性的轉折背後,暴露出的是MiniMax在商業操盤上的傲慢與算計。當褪去技術報告上華麗的跑分外衣,M3在真實的能力和價格上,一頭撞上了DeepSeek和小米上個月聯手設下的無情斬殺線。

01

“謎之自信”的定價

撕開M3華麗外衣的第一道口子,就是極其違和的定價策略。

首先來看技術報告,官方花了大量篇幅吹噓算力成本上的極致最佳化:在100萬上下文的基礎上,M3每token的計算量僅為上一代模型的1/20,在decoding階段也有超過15倍的加速優勢。

按照正常的商業邏輯,若是能讓計算成本呈指數級下降,那麼理應帶來更具性價比的定價,從而在國內第二次大模型價格戰中提前搶佔生態位。然而,MiniMax反其道而行之,不僅實際使用成本比上一代模型更高,還來了一手讓國內開發者徹底寒心的“中外雙標”。


圖源:https://linux.do/t/topic/2286885

就在發佈的當晚,MiniMax中英文官網上的定價差異就被公開於眾。論單價,國內訂閱8.5元/億tokens,海外訂閱6.6元/億tokens;論Token Plan,國內需要多花28%的錢,但只能換來額外的2個Agent並行運行和2條視訊生成次數。

也就是說,國內使用者在自己的地盤上,要為同一套國產AI服務多花28%的智商稅。這是一種十分反常的現象,畢竟包括其競爭對手智譜在內的主流國產大模型廠商,在定價策略上都是海外訂閱要明顯更貴。

在這個DeepSeek和小米已經把API價格達到白菜價,而國外使用者有OpenAI、Anthropic和Google提供諸多首選方案的大環境下,MiniMax這種雙標操作瞬間敗光了國內開發者的好感。

然而,這還只是這場風暴的開胃菜。

02

悄悄溜走的權益

這一套操作在國內開發者看來應該並不陌生了,因為這與兩個月前智譜的操作可謂是如出一轍。對於這些大模型初創公司來說,願意掏出真金白銀、按年訂閱千百元高階套餐的開發者使用者正是核心資產之一。這些開發者可能分佈在各大企業,作為Minimax的忠實使用者不斷擴大模型的應用範圍。然而,本該是被最悉心呵護的基本盤,在這次M3的發佈中變成了被收割得最慘的群體。

遲來的道歉和補償公告,並沒能用漂亮話把這件事掩蓋過去。技術社區的開發者們用嚴密的測試指令碼和資料報表讓官方所謂“無損遷移與豐厚補償”背後的真相水落石出:這是一場極其精密的文字遊戲和帳本算計。

第一重算計,是明升暗降的計費維度。

首先要承認的是,Token Plan這種字面意義上的計費方式是合理的。原本的老套餐採取“按API呼叫次數收費”,會讓很多經常需要進行長文字處理任務(如複雜程式設計項目、沉浸式翻譯等)的使用者覺得物超所值。

而藉著這次M3發佈的契機,官方也強制將計費模式修改為“按token計費”,類似於手機按流量收費的模式。這本該讓收費更加透明、讓使用者更方便監控用量,然而在使用者實測中,雖然套餐中包含十幾億的token額度,但M3的消耗速度卻遠比上一代模型M2.7要快,原本能用一個月的高階套餐,如今可能只能撐住幾天。從技術角度來看,M3的快取命中率和工具呼叫可能都存在一定問題。

第二重算計,是鳩佔鵲巢的多模態池。

這是最容易被忽視,也是最致命的一擊。在老套餐中,文字模型與多模態模型的額度是獨立計算的。然而,新版的Token Plan卻將圖片生成、TTS語音生成和視訊生成這些多模態功能全都塞進了一個不透明的共享消耗池之中。

顯而易見,實現多模態功能的消耗遠比文字模型要多,使用者讓系統生成幾張圖片或是一段視訊,消耗的token可能足以支撐一小時的程式設計任務。

最難以解釋的,是名義token額度與實際token額度之間的差距。

圖源:https://linux.do/t/topic/2283892

一位使用者展示出了自己5小時使用期間M3消耗的token。按照比例轉換,上限大約是每5小時1000萬token。若資料真實,周限制不會超過8000萬token,月限制也不會超過4億token。對於那些MiniMax忠實的老使用者,這就是“花最多的錢,挨最毒的打”,實際可用權益出現了斷崖式的縮水。

一個主打AI生產力的工具,若是連帳本都開始和使用者算計到一分一毫,那麼信任的崩塌只在朝夕之間。

03

“災難”等級的公關

隨著各種實際評測和算帳帖子在各大社區發酵,退款的呼聲也一浪高過一浪。被逼到牆角的MiniMax官方,終於在半夜憋出了一份致歉公告。

不得不說,這篇公告堪稱反面教材,開篇第一句赫然寫著“六一兒童節的尾巴還是開心點吧~”

面對一群剛剛被強制遷移套餐、暗改計費額度、被莫名其妙剝奪原有權益的開發者們,官方選擇了這種嬉皮笑臉、陰陽怪氣的開場。

拋開言語中透露出的傲慢不提,公告的內容也同樣令人難以順理成章地接受,它完美避開了所有核心矛盾:對國內外雙標的定價隻字不提、對token計費導致總額度縮水裝聾作啞。取而代之的,是官方提出的補償方案:

甚至在這份火急火燎提出的補償方案中,還有對訂閱時間不同的老使用者的區別對待。評論區中,不乏開發者辛辣的諷刺:“官方把我的油箱抽乾了一大半,然後道歉說,作為補償,我允許你今天把油門踩到底。這有什麼用?”

事到如今,評論數最多的小紅書帖子下,官方回覆的評論只有一句來自使用者的誇獎“M3比M2.7強很多!”,而其他使用者的疑問,似乎都已經石沉大海。

一系列操作引發了資深使用者的憤怒自然不必多說,一位Linux.do論壇名為@mozilong的使用者在MiniMax官方飛書群裡據理力爭。面對質疑,官方給出的最終解決方案是,直接將該使用者踢出群聊。

解決不了問題,就解決提出問題的人。這套邏輯,在重視契約精神的開發者圈子行不通;而這些操作,無異於自掘墳墓。

那麼,究竟是什麼力量,讓官方連夜修改規則、發佈致歉、推出補償,甚至馬上設計退款通道呢?

恐怕不是良心發現,而是資本的毒打。

6月1日當天的港股市場,MiniMax在開盤短暫停留後,直接化身一隻斷線的風箏,迎來了瀑布式的崩盤。股價從898的區間一路下滑,最低砸到707,盤中跌幅逼近20%,K線圖上也留下了一根慘烈的大陰線。

這次新模型發佈股價不漲反跌的反常現象,就是市場最真實的投票。

04

近在咫尺的“斬殺線”

如果說商業操盤的反向操作只是加速了口碑的崩塌,那麼發佈後3天出爐的第三方評測,則是直接否定了MiniMax M3的技術敘事。

6月4日,AI評估機構Artificial Analysis發佈了最新的榜單資料。這份原本應該是MiniMax寄予厚望、用來證明其模型能力超過國產競品的成績單,反而成了一記響亮的耳光。

MiniMax M3的測評資料顯得十分詭異:在智力水平和代理能力排行榜上,它雖然無法與國際頂尖模型水平抗衡,但在國內模型中均排名第一;然而,在程式設計能力排行榜上,M3的表現堪稱災難。

且不說OpenAI、Anthropic和Google這“御三家”的模型,MiniMax的得分竟然比更早推出的Qwen3.7 Max、DeepSeek V4 Pro、Kimi K2.6和MiMo-V2.5-Pro還要低,勉強與競爭對手智譜的GLM-5.1打平,相比前代模型M2.7的提升也只在毫釐之間。

我們知道,考察一個模型的智力是高是低,離不開程式設計領域的測試。而程式設計能力的強弱,決定了它是否適合成為智能體的大腦。

因此,敏銳的使用者早早察覺到了這個榜單中暴露出來的一個違反AI科學常識的悖論:MiniMax M3的程式碼能力落後,但它非常聰明,而且智能體代理能力極其出色。

這就好比一個數學符號都認不清的學生,卻在國際數學競賽奪得了獎項。換句話說,這份榜單和“主=6”一樣藏著貓膩:定向刷榜。

在AI行業,這已經是一個半公開的秘密。一個模型如果在訓練階段針對某些Agent評測及進行了高強度的“應試教育”特訓,模型自然能在面對特定的考題時給出完美答案。

但智能體代理所需的,是強大的程式碼生成、邏輯推理和複雜環境規劃的能力。一旦脫離了固定的基準測試題庫,進入真實的生產環境,缺乏底層程式設計能力製成的智能體,註定無法發揮任何商業價值。

如此一來,官方公告中寫道“程式設計頂尖水平”卻只列出SWE-Bench-Pro分數超越GPT-5.5、24小時無人干預完成1959次工具呼叫,在評測展示出來的基礎程式碼能力面前,反倒像是一場精心編排的樣板戲。

面對這樣的成績單,使用者有理由質疑:在DeepSeek憑藉紮實的底層推理能力和極致的性價比,在行業裡設下了一條嚴格的斬殺線時,MiniMax憑什麼讓使用者為M3買單?

05

結語

從6月1日的萬眾矚目,到6月4日的一地雞毛。短短72小時之間發生的轉變,給國產大模型行業敲響了一次警鐘:那個靠一篇技術報告和幾項基準測試跑分就能得到使用者認可的時代,已經一去不復返了。

競爭的下半場,極致內卷的主題早已確定。以DeepSeek為代表的技術主義者,仍然行走在用底層創新壓榨出極致性價比的道路上。而緊隨其後的小米,與DeepSeek共同設下了一條價格和性能交織在一起的斬殺線。

而在這條線之下,試圖在帳本上玩弄使用者、用明升暗降收割基本盤、用捂嘴掩蓋產品缺陷的小聰明全都無可遁形。

DeepSeek已經證明,人們願意包容一家國產AI公司在技術上的暫時落後,也願意與它一起Debug成長。

而對於MiniMax,信任的建立需要幾年日復一日的迭代,但大廈的崩塌只需要不到72小時。

留給MiniMax找回初心的時間,恐怕不多了。 (錦緞)