DeepSeek-R1 大模型競技場排行出爐，挺進前三！性能直逼頂尖

2025/01/25

•

人工智慧模型評估大模型競技場剛剛發布重磅消息，由DeepSeek AI 開發的DeepSeek-R1 模型強勢崛起，一舉衝入排行榜前三甲！

LM Arena (原lmsys.org) 在官方帳號@lmarena_ai 上激動地宣佈了這一消息，稱DeepSeek-R1 的表現令人矚目，並稱讚其為社區帶來了一份「令人難以置信的里程碑和禮物」。

**DeepSeek-R1 的亮點包括：**

綜合排名第三：DeepSeek-R1 目前在LM Arena 綜合榜單上排名第三，與頂尖推理模型o1 並列，展現了強大的通用能力

技術領域表現卓越：在"Hard Prompts" (高難度提示詞)、 "Coding" (代碼能力) 和"Math" (數學能力) 等技術性極強的領域，DeepSeek-R1更是拔得頭籌，位列第一

風格控制並列第一：在"Style Control" (風格控制) 方面，DeepSeek-R1 也展現了驚人的實力，與o1 並列第一，意味著模型在理解和遵循用戶指令，並按照特定風格生成內容方面表現出色

推文還指出，在"Hard Prompt with Style Control" （高難度提示詞與風格控制結合）的測試中，DeepSeek-R1 更是與o1並列第一，進一步證明了其在復雜任務和精細化控制方面的強大能力。

雖然目前的排名是基於早期的結果，更多投票正在收集中以確保排名的穩定性，但DeepSeek-R1 已經展現出在各個領域都非常強勁的潛力。（AI寒武紀）