#TOP5
開源模型TOP5,被中國廠商包圓了
開源大模型,進入中國時間。10月,公開資料顯示,來自中國的開源大模型已經牢牢佔據榜單前五。阿里的Qwen系列和DeepSeek,更是從2024年下半年起,就在開源社區建構起越來越深遠的影響力。這一結果正在引發熱議。有不少網友指出:這種情況確實已經持續了很長一段時間。比如半年前Llama 4翻車時的梗圖,就又被挖了出來:無論是模型質量還是開放程度,這一次,國產模型已經從追趕者,轉變為引領潮流的一方。緊跟SOTA閉源模型更具體的情況,可以在LMArena公開榜單中窺見一二。在文字排行榜中,頂級閉源模型如GPT-5、Gemini-2.5-pro、Claude-Sonnet-4.5等之後,緊隨而來的就是智譜的GLM-4.6和DeepSeek-v3.2。而Qwen3-max-preview則躋身到了TOP3,不過目前該版本模型並未開源。前端開發排行榜中,國產開源模型更是實現了跟程式設計SOTA Claude的分庭抗禮,DeepSeek-R1/V3.1、GLM-4.6和Qwen3-Coder都排到了前10。視覺方面,騰訊的Hunyuan-vision-1.5注和Qwen3同樣緊跟閉源SOTA,位列開源最強。註:Hunyuan-vision-1.5處於計畫開源狀態,技術報告和模型權重尚未公佈。視訊模型方面,開源模型中Wan-v2.2表現最佳。值得注意的是,在這個領域,國產閉源模型同樣表現不俗,Kling-2.5、Seedance-v1-pro、Hailuo-02等都位居榜單前列。另一個角度,從HuggingFace的模型下載量和模型趨勢上,也可以看出開源模型領域,中國力量越來越活躍、越來越強大了。在趨勢榜中,螞蟻的Ling-1T、智譜的GLM-4.6,都是當下最受關注的開源模型。最受歡迎模型,依然由DeepSeek-R1擔當。下載量方面,Qwen3是下載量最高的模型之一。如果將參數規模具體到百億級,Qwen3更是領先包括gpt-oss在內的其他開源模型。競爭推動創新,而開源已經被證明,是加速創新的重要力量。有網友認為:現在,這股推動力來自中國。還有人指出,開源模型領域主導地位的轉變,不僅僅關乎誰將引領潮流,更重要的是,這或將重新定義全球創新格局。Llama 5要無了?Anyway,回到開頭那張圖片上,中國開源力量對大模型格局的衝擊,一個重要的節點是“DeepSeek時刻”。而Llama 4的翻車,也不能說沒有貢獻一份力量(doge)。最近小扎不是終於把OpenAI前CTO Mira的公司聯創Andrew Tulloch挖走了嘛,傳聞是給了一份35億美元的offer。消息一出,又把大家對Llama 5的關注給勾起來了:挖了這麼多人,花了這麼多錢,Meta超級智能實驗室能搞出好東西來吧?但這邊剛期待,就有人冒出來潑冷水:Llama 5無了。爆料人說是Meta的資料集供應方。不過後來他又刪掉了這個回覆,表示以上並非官方消息,他只是從另一個獲得Meta資金的團隊那裡得到了這個消息。那麼,被亞歷山大·王動搖了開源決心的小扎,究竟會拿出點什麼?板凳,瓜子,長期準備吧~ (量子位)