•
2月25日,通義千問官方帳號Qwen在海外社交平台發佈了QwQ-Max-Preview(推理模型預覽版),即將發佈QwQ-Max正式版本、可部署在本地的較小版本以及官方App QwQ-Max。
Qwen表示:“我們在Qwen Chat平台上發佈了‘思考(QwQ)’功能,由QwQ-Max-Preview提供支援。這是一個基於Qwen2.5-Max的推理模型。該模型仍為預覽版。它具有很強的數學理解、編碼、代理等能力。與Qwen2.5-Max相比,它更聰明,更具創造力。”
Qwen同時宣佈,即將發佈QwQ-Max的正式版本,將在Apache 2.0許可下開源QwQ-Max和Qwen2.5-Max。此外,還將提供規模較小的版本,例如QwQ-32B,可部署在本地裝置上。另外,將在發佈官方QwQ-Max的同時發佈Android和iOS App。
1月20日,DeepSeek-R1推理模型發佈後火速出圈,實現了最快復現OpenAI o1推理模型。業內預計,中國頭部科技公司阿里巴巴、字節跳動等有望在1到2個月內跟上R1的創新成果。
1月29日,阿里發佈通義千問Qwen2.5-Max大模型。在多個基準測試中,Qwen2.5-Max比肩Claude-3.5-Sonnet,並幾乎全面超越了GPT-4o、DeepSeek-V3及Llama-3.1-405B。
值得一提的是,DeepSeek-R1模型出圈後,美國李飛飛團隊2月初稱以不到50美元的雲端運算費用,成功訓練出了一個名為s1的人工智慧推理模型。隨後被爆出s1模型的訓練並非從零開始,其基座模型也是阿里通義千問(Qwen)模型。 (上海證券報)