重磅!DeepSeek V3.2 特別版發佈:性能超越GPT-5,硬剛Gemini 3.0「IOI/IMO金牌」

DeepSeek-V3.2系列模型正式上線

作為“為Agent建構的推理優先模型”,DeepSeek-V3.2包含兩個版本:

DeepSeek-V3.2:V3.2-Exp的官方繼任者,平衡了推理能力與生成長度,性能對標GPT-5,現已上線App、Web端及API

DeepSeek-V3.2-Speciale:專攻深度推理能力的極限版本,性能超越GPT-5,比肩Gemini-3.0-Pro,目前僅通過API提供

技術報告顯示,DeepSeek-V3.2-Speciale在2025年國際數學奧林匹克(IMO)、國際資訊學奧林匹克(IOI)、ICPC世界總決賽及CMO中均取得了金牌級成績

官方已公開上述競賽的最終提交結果,社區可通過assets/olympiad_cases進行二次驗證

技術報告:

https://huggingface.co/deepseek-ai/DeepSeek-V3.2/blob/main/assets/paper.pdf


以下是詳細資訊

核心能力與技術突破

DeepSeek-V3.2基於三大技術突破,實現了高計算效率與卓越推理、Agent性能的統一:

1.DeepSeek Sparse Attention (DSA):引入高效注意力機制,大幅降低計算複雜度,並針對長上下文場景進行了最佳化

2.可擴展強化學習框架:通過穩健的RL協議與後訓練(post-training)算力擴展,實現了高性能表現

3.大規模Agent任務合成管線:涵蓋1800+環境及8.5萬+複雜指令

這一合成管線不僅提升了模型在複雜互動環境中的遵循度和泛化能力,更讓DeepSeek-V3.2將“思考”直接整合進工具使用(Tool-Use)的模型,同時支援在思考和非思考模式下使用工具

API更新與Speciale版限制

DeepSeek-V3.2

API使用模式與V3.2-Exp保持一致,作為日常主力模型(Daily Driver),提供GPT-5等級的性能

DeepSeek-V3.2-Speciale

該版本專為解決複雜任務設計,消耗更多Token,目前僅作為API提供,具體限制如下:

臨時端點:需使用

base_url="https://api.deepseek.com/v3.2_speciale_expires_on_20251215"

服務期限:該端點服務至2025年12月15日 15:59 (UTC) 截止

功能限制:不支援工具呼叫(Tool Calls),僅用於支援社區評估與研究。

定價:與DeepSeek-V3.2保持一致

聊天範本重大調整

DeepSeek-V3.2不再提供Jinja格式範本,並引入了“帶工具思考”及新角色設定。

Python指令碼編碼:官方提供了encoding資料夾,包含Python指令碼(encoding_dsv32.py),用於將OpenAI相容格式消息編碼為模型輸入字串及解析輸出

Developer角色:範本新增developer角色,專門用於搜尋Agent場景,官方API不接受分配給該角色的消息

輸出解析注意:提供的解析函數僅處理格式良好的字串,生產環境需自行增加穩健的錯誤處理機制。

程式碼示例如下:

import transformers
from encoding_dsv32 import encode_messages

tokenizer = transformers.AutoTokenizer.from_pretrained("deepseek-ai/DeepSeek-V3.2")
messages = [
    {"role": "user", "content": "hello"},
    {"role": "assistant", "content": "Hello! I am DeepSeek.", "reasoning_content": "thinking..."},
    {"role": "user", "content": "1+1=?"}
]
# 思考模式配置
encode_config = dict(thinking_mode="thinking", drop_thinking=True, add_default_bos_token=True)
prompt = encode_messages(messages, **encode_config)
tokens = tokenizer.encode(prompt)

本地部署建議

模型結構與DeepSeek-V3.2-Exp相同。

採樣參數:建議設定 temperature = 1.0,top_p = 0.95。

Speciale版提示:本地部署Speciale版本時,同樣不支援工具呼叫功能

開源與協議

倉庫及模型權重均採用 MIT License 授權。 (AI寒武紀)