阿里雲在2025雲棲大會上擲出一枚技術“核彈”,Qwen3-Max以兆參數和36兆訓練token數,在全球AI競賽中重新洗牌。01 阿里Qwen3-Max突破全球AI三強9月24日,阿里巴巴通過“通義千問Qwen”微信公眾號正式宣佈推出Qwen3-Max——該公司迄今為止“規模最大、能力最強的模型”。該模型的預覽版在權威的LMArena文字排行榜上位列全球第三,超越了OpenAI的GPT-5-Chat。Qwen3-Max-Instrurct測評分數這不僅是一次技術迭代,更是中國AI企業首次在通用大模型核心評測中躋身全球頂尖陣營。Qwen3-Max的正式版本在程式碼能力和智能體能力方面進一步提升,在涵蓋知識、推理、程式設計、指令遵循的全面基準測試中均達到業界領先水平。Qwen3-Max作為阿里通義千問家族的旗艦模型,展現了令人矚目的技術規格。模型總參數超過1T(兆),預訓練資料量達到36T tokens。Qwen3-Max-Thinking-Heavy 測評分數這一參數規模使Qwen3-Max穩穩站在全球大模型的第一梯隊。在模型架構上,Qwen3-Max採用了MoE(混合專家)架構。這種設計允許模型根據不同任務啟動不同的專家網路,既保證了模型的能力,又提高了計算效率。與傳統的密集模型相比,MoE架構在大規模擴展時具有明顯優勢。Qwen3-Max還支援1M tokens的上下文長度,這一指標對於處理長文件、複雜程式碼庫和延展對話至關重要。超長上下文支援意味著模型可以理解和處理更為複雜的資訊結構,為高級推理任務奠定基礎。在訓練效率方面,Qwen3-Max實現了30%的MFU(模型浮點運算利用率)提升,表明阿里在訓練超大規模模型方面已經積累了深厚的技術經驗。02 性能表現 全面超越國際頂尖模型的實測資料Qwen3-Max在多項國際權威基準測試中展現出卓越實力。在專注於解決現實程式設計挑戰的SWE-Bench Verified測試中,Qwen3-Max-Instruct版本取得了69.6分的優異成績,穩居全球第一梯隊。在評估智能體工具呼叫能力的Tau2-Bench測試中,Qwen3-Max更是實現了突破性表現,以74.8分超越Claude Opus 4與DeepSeek-V3.1。數學推理能力上,Qwen3-Max的推理增強版本Qwen3-Max-Thinking展現出非凡性能,在AIME 25和HMMT等高難度數學推理測試中均取得滿分100分的成績,這是國內大模型首次在此類測試中獲得滿分。該模型在解數學題時懂得調動工具,能夠寫程式碼做題,同時增加測試時的計算資源也讓模型表現進一步提升。在涵蓋知識、推理、程式設計、指令遵循、人類偏好對齊、智能體任務和多語言理解的全面基準測試中,Qwen3-Max-Instruct版本均達到業界領先水平,展現出全面而均衡的能力圖譜。03 戰略意義 中國大模型技術的里程碑突破Qwen3-Max的發佈標誌著中國在大模型領域正式躋身全球第一梯隊。這一成就對國內AI產業發展具有深遠戰略意義。大模型預訓練的Scaling Law(規模化法則)認為,持續增長資料和參數規模是通向AGI的可能路徑之一。面對自然資料數量有限的挑戰,有學者認為預訓練的Scaling Law即將逼近上限,但Qwen3-Max的性能突破顯示,繼續增巨量資料、模型參數,依然能鍛造出更強的模型。阿里雲已建構起從0.5B到超兆參數的全尺寸模型覆蓋,包含三百多個大模型,可滿足不同場景的需求。這種全端式佈局為AI技術在各行業的應用落地奠定了堅實基礎。Qwen3-Max的成功驗證了“算力投入—模型提升—應用落地”的正向閉環模式,預計將推動國內AI產業在2025年第四季度迎來應用商業化的加速期。Qwen3-Max的發佈不僅代表技術突破,更具有深遠的產業影響。阿里巴巴集團CEO吳泳銘在雲棲大會上表示,大模型是下一代作業系統,而AI雲是下一代電腦。公司計畫三年內投入超過3800億元用於AI模型與基礎設施建設,彰顯了對AI技術的長期承諾。資本市場對這一突破反應積極。模型發佈當日,阿里巴巴港股漲幅擴大至逾4.5%,創近4年來新高;美股夜盤漲超5%。值得注意的是,美國"女股神"凱西·伍德(Cathie Wood)重新開倉買入阿里巴巴股份,為四年來首次,顯示國際資本對中國AI技術的認可。04 全球競爭格局的重塑Qwen3-Max的成功標誌著全球AI競爭格局正在重塑。當前LMArena排行榜前三名分別是Google的Gemini-2.5-Pro、Anthropic的Claude-Opus-4.1和OpenAI的GPT-O3。Qwen3-Max的崛起使中國首次在頂級大模型競爭中躋身第一梯隊,改變了由美國科技巨頭主導的競爭格局。從技術路線來看,Qwen3-Max採用了與GPT-5-Chat不同的發展路徑。GPT-5-Chat是OpenAI專門為企業級對話設計的獨立模型,支援多模態輸入、上下文感知和自然語言理解。而Qwen3-Max更注重通用能力與專業能力的平衡,在保持強大對話能力的同時,在程式碼生成、邏輯推理等專業領域表現突出。隨著Qwen3-Max-Thinking推理版本的正式發佈臨近,阿里雲有望在高端企業市場與國際廠商展開直接競爭,重塑全球AI大模型市場格局。05 編輯點評 從追隨者到規則制定者Qwen3-Max的里程碑意義遠超技術本身:它標誌著中國大模型首次在核心能力標準(程式設計、數學、工具呼叫)上主導話語權。當GPT-5因忽視使用者體驗跌落神壇,阿里以“頂級性能+場景深耕”的組合拳打開新局。隨著Thinking版本即將發佈,中國AI的“算力投入—模型提升—應用落地”閉環正加速形成——大模型的競爭,終於迎來東方時間。 (壹零社)