•
阿里宣佈推出 Qwen3系列#Qwen3
開源了兩個 MoE 模型的權重:Qwen3-235B-A22B,一個擁有 2350 多億總參數和 220 多億啟動參數的大模型,以及Qwen3-30B-A3B,一個擁有約 300 億總參數和 30 億啟動參數的小型 MoE 模型
此外,六個 Dense 模型也已開源,包括 Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B 和 Qwen3-0.6B,均在 Apache 2.0 許可下開源
這裡可以直接免費體驗:
chat.qwen.ai
按照千問官方的說法:旗艦模型 Qwen3-235B-A22B 在程式碼、數學、通用能力等基準測試中,與 DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 等頂級模型相比,表現出極具競爭力的結果
此外,小型 MoE 模型 Qwen3-30B-A3B 的啟動參數數量是 QwQ-32B 的 10%,表現更勝一籌,甚至像 Qwen3-4B 這樣的小模型也能匹敵 Qwen2.5-72B-Instruct 的性能
一圖讀懂:
(AI寒武紀)