阿里首個超兆參數新王登基！ Qwen3-Max屠榜全SOTA，碾壓DeepSeek V3.1

2025/09/06

•

阿里迄今為止，參數最大的模型誕生了！

昨夜，Qwen3-Max-Preview（Instruct）官員宣上線，超1兆參數性能爆表。

直接用成績說話——

在全球主流權威基準測試中，Qwen3-Max-Preview狂攬非推理模型「C」位，直接碾壓Claude-Opus 4（Non-Thinking）、Kimi-K2、DeepSeek-V3.1。

甚至，它把自家Qwen3-235B-A22B-Instruct-2507狂甩身後，堪稱「AI卷王本王」。

驚豔的性能表現再次證明了，Scaling仍然有效，參數越大模型性能越強。

總的來說，Qwen3-Max-Preview有以下幾大亮點：表現更強、知識更廣、更擅長對話、任務處理、指令遵循。

新模型可支援100+語言，還針對RAG、工具呼叫進行最佳化。

模型一出，全網立即開始了實測。

@karminski-牙醫實驗中，Qwen3-Max-Preview前端能力明顯超越DeepSeek-V3.1。

例如，在一個杯子流體模擬中，Gemini 2.5在傾倒前杯子底部有嚴重bug，DeepSeek-V3.1杯子中物體倒出的狀態（最後有一條線）不對，而Qwen3-Max-Preview比較符合物理常識。

Qwen3-Max-Preview還能完美產生一個騎自行車的鵜鶘SVG、一鍵直出精美前端網頁，一張照片做出像素花園。

目前，模型已正式上線阿里雲百煉平台，可透過API直接呼叫。同時，Qwen Chat也同步上線新模型，支援免費使用。

在百煉平台上，最大支援256k上下文，依token數階梯計費：