阿里通義千問，上新

2025/02/26

•

2月25日，通義千問官方帳號Qwen在海外社交平台發佈了QwQ-Max-Preview（推理模型預覽版），即將發佈QwQ-Max正式版本、可部署在本地的較小版本以及官方App QwQ-Max。

Qwen表示：“我們在Qwen Chat平台上發佈了‘思考（QwQ）’功能，由QwQ-Max-Preview提供支援。這是一個基於Qwen2.5-Max的推理模型。該模型仍為預覽版。它具有很強的數學理解、編碼、代理等能力。與Qwen2.5-Max相比，它更聰明，更具創造力。”

Qwen同時宣佈，即將發佈QwQ-Max的正式版本，將在Apache 2.0許可下開源QwQ-Max和Qwen2.5-Max。此外，還將提供規模較小的版本，例如QwQ-32B，可部署在本地裝置上。另外，將在發佈官方QwQ-Max的同時發佈Android和iOS App。

1月20日，DeepSeek-R1推理模型發佈後火速出圈，實現了最快復現OpenAI o1推理模型。業內預計，中國頭部科技公司阿里巴巴、字節跳動等有望在1到2個月內跟上R1的創新成果。

1月29日，阿里發佈通義千問Qwen2.5-Max大模型。在多個基準測試中，Qwen2.5-Max比肩Claude-3.5-Sonnet，並幾乎全面超越了GPT-4o、DeepSeek-V3及Llama-3.1-405B。

值得一提的是，DeepSeek-R1模型出圈後，美國李飛飛團隊2月初稱以不到50美元的雲端運算費用，成功訓練出了一個名為s1的人工智慧推理模型。隨後被爆出s1模型的訓練並非從零開始，其基座模型也是阿里通義千問（Qwen）模型。 (上海證券報)