#Qwen3-Max | 熱門關鍵字 | 鉅亨號

阿里雲在2025雲棲大會上擲出一枚技術“核彈”，Qwen3-Max以兆參數和36兆訓練token數，在全球AI競賽中重新洗牌。01 阿里Qwen3-Max突破全球AI三強9月24日，阿里巴巴通過“通義千問Qwen”微信公眾號正式宣佈推出Qwen3-Max——該公司迄今為止“規模最大、能力最強的模型”。該模型的預覽版在權威的LMArena文字排行榜上位列全球第三，超越了OpenAI的GPT-5-Chat。Qwen3-Max-Instrurct測評分數這不僅是一次技術迭代，更是中國AI企業首次在通用大模型核心評測中躋身全球頂尖陣營。Qwen3-Max的正式版本在程式碼能力和智能體能力方面進一步提升，在涵蓋知識、推理、程式設計、指令遵循的全面基準測試中均達到業界領先水平。Qwen3-Max作為阿里通義千問家族的旗艦模型，展現了令人矚目的技術規格。模型總參數超過1T（兆），預訓練資料量達到36T tokens。Qwen3-Max-Thinking-Heavy 測評分數這一參數規模使Qwen3-Max穩穩站在全球大模型的第一梯隊。在模型架構上，Qwen3-Max採用了MoE（混合專家）架構。這種設計允許模型根據不同任務啟動不同的專家網路，既保證了模型的能力，又提高了計算效率。與傳統的密集模型相比，MoE架構在大規模擴展時具有明顯優勢。Qwen3-Max還支援1M tokens的上下文長度，這一指標對於處理長文件、複雜程式碼庫和延展對話至關重要。超長上下文支援意味著模型可以理解和處理更為複雜的資訊結構，為高級推理任務奠定基礎。在訓練效率方面，Qwen3-Max實現了30%的MFU（模型浮點運算利用率）提升，表明阿里在訓練超大規模模型方面已經積累了深厚的技術經驗。02 性能表現全面超越國際頂尖模型的實測資料Qwen3-Max在多項國際權威基準測試中展現出卓越實力。在專注於解決現實程式設計挑戰的SWE-Bench Verified測試中，Qwen3-Max-Instruct版本取得了69.6分的優異成績，穩居全球第一梯隊。在評估智能體工具呼叫能力的Tau2-Bench測試中，Qwen3-Max更是實現了突破性表現，以74.8分超越Claude Opus 4與DeepSeek-V3.1。數學推理能力上，Qwen3-Max的推理增強版本Qwen3-Max-Thinking展現出非凡性能，在AIME 25和HMMT等高難度數學推理測試中均取得滿分100分的成績，這是國內大模型首次在此類測試中獲得滿分。該模型在解數學題時懂得調動工具，能夠寫程式碼做題，同時增加測試時的計算資源也讓模型表現進一步提升。在涵蓋知識、推理、程式設計、指令遵循、人類偏好對齊、智能體任務和多語言理解的全面基準測試中，Qwen3-Max-Instruct版本均達到業界領先水平，展現出全面而均衡的能力圖譜。03 戰略意義中國大模型技術的里程碑突破Qwen3-Max的發佈標誌著中國在大模型領域正式躋身全球第一梯隊。這一成就對國內AI產業發展具有深遠戰略意義。大模型預訓練的Scaling Law（規模化法則）認為，持續增長資料和參數規模是通向AGI的可能路徑之一。面對自然資料數量有限的挑戰，有學者認為預訓練的Scaling Law即將逼近上限，但Qwen3-Max的性能突破顯示，繼續增巨量資料、模型參數，依然能鍛造出更強的模型。阿里雲已建構起從0.5B到超兆參數的全尺寸模型覆蓋，包含三百多個大模型，可滿足不同場景的需求。這種全端式佈局為AI技術在各行業的應用落地奠定了堅實基礎。Qwen3-Max的成功驗證了“算力投入—模型提升—應用落地”的正向閉環模式，預計將推動國內AI產業在2025年第四季度迎來應用商業化的加速期。Qwen3-Max的發佈不僅代表技術突破，更具有深遠的產業影響。阿里巴巴集團CEO吳泳銘在雲棲大會上表示，大模型是下一代作業系統，而AI雲是下一代電腦。公司計畫三年內投入超過3800億元用於AI模型與基礎設施建設，彰顯了對AI技術的長期承諾。資本市場對這一突破反應積極。模型發佈當日，阿里巴巴港股漲幅擴大至逾4.5%，創近4年來新高；美股夜盤漲超5%。值得注意的是，美國"女股神"凱西·伍德(Cathie Wood)重新開倉買入阿里巴巴股份，為四年來首次，顯示國際資本對中國AI技術的認可。04 全球競爭格局的重塑Qwen3-Max的成功標誌著全球AI競爭格局正在重塑。當前LMArena排行榜前三名分別是Google的Gemini-2.5-Pro、Anthropic的Claude-Opus-4.1和OpenAI的GPT-O3。Qwen3-Max的崛起使中國首次在頂級大模型競爭中躋身第一梯隊，改變了由美國科技巨頭主導的競爭格局。從技術路線來看，Qwen3-Max採用了與GPT-5-Chat不同的發展路徑。GPT-5-Chat是OpenAI專門為企業級對話設計的獨立模型，支援多模態輸入、上下文感知和自然語言理解。而Qwen3-Max更注重通用能力與專業能力的平衡，在保持強大對話能力的同時，在程式碼生成、邏輯推理等專業領域表現突出。隨著Qwen3-Max-Thinking推理版本的正式發佈臨近，阿里雲有望在高端企業市場與國際廠商展開直接競爭，重塑全球AI大模型市場格局。05 編輯點評從追隨者到規則制定者Qwen3-Max的里程碑意義遠超技術本身：它標誌著中國大模型首次在核心能力標準（程式設計、數學、工具呼叫）上主導話語權。當GPT-5因忽視使用者體驗跌落神壇，阿里以“頂級性能+場景深耕”的組合拳打開新局。隨著Thinking版本即將發佈，中國AI的“算力投入—模型提升—應用落地”閉環正加速形成——大模型的競爭，終於迎來東方時間。 (壹零社)