不誘於譽,不恐於誹,率道而行,端然正己。
2026年4月24日,全球AI圈期待已久的DeepSeek V4終於正式發佈!這一次,DeepSeek不僅帶來了技術上的重大突破,更重要的是,它標誌著中國大模型發展邁入了全新的階段。
雙版本齊發,性能比肩頂級閉源模型
此次DeepSeek V4發佈採用了"頂配+性價比"的雙版本策略:
DeepSeek-V4-Pro:性能怪獸
- 參數規模:1.6T總參數,49B啟動參數
- 核心優勢:
- Agent能力達到開源模型最佳水平
- 世界知識儲備大幅領先其他開源模型,僅稍遜於Gemini-Pro-3.1
- 在數學、STEM、競賽型程式碼測評中超越所有已公開的開源模型
- 內部評測顯示:使用體驗優於Sonnet 4.5,交付質量接近Opus 4.6非思考模式
DeepSeek-V4-Flash:經濟之選
- 參數規模:284B總參數,13B啟動參數
- 核心優勢:
- 推理能力接近Pro版本
- 在簡單Agent任務上與Pro旗鼓相當
- 更快捷、經濟的API服務
百萬上下文成為"標配"
從今天開始,1M(一百萬)上下文長度將成為DeepSeek所有官方服務的標配。
一年前,百萬上下文還是Gemini的獨家王牌,而今天,DeepSeek通過技術創新將這一"高端功能"變成了"水電煤"般的基礎設施。
技術創新實現突破
DeepSeek V4開創了一種全新的注意力機制,通過以下技術創新大幅降低了計算和視訊記憶體需求:
- 混合注意力架構:結合壓縮稀疏注意力(CSA)和高度壓縮注意力(HCA)
- 流形約束超連接:增強傳統殘差連接,提高訊號傳播穩定性
- Muon最佳化器:加速收斂,提升訓練穩定性
- DSA稀疏注意力:在token維度進行壓縮,實現高效長上下文處理
資料對比:DeepSeek-V4-Pro相比前代V3模型,FLOPs降低73%,KV快取大小減少90%。
攜手華為昇騰,打破技術封鎖
此次發佈最大的亮點之一,就是DeepSeek V4將採用華為昇騰晶片。
從CUDA到CANN的轉變
過去幾年,中國大模型開發高度依賴輝達GPU和CUDA生態。而DeepSeek V4的反向操作令人矚目:
- 完全運行在華為最新AI晶片上(主要為Ascend 950PR)
- 從CUDA生態轉向CANN框架的軟體架構適配
Agent能力專項最佳化
DeepSeek V4針對當前最火的Agent應用場景進行了專門最佳化:
- 適配主流Agent產品:Claude Code、OpenClaw、OpenCode、CodeBuddy等
- 程式碼任務表現突出:在Agentic Coding評測中達到開源模型最佳水平
- 文件生成能力提升:能夠高品質完成各類文件創作任務
官方發佈的PPT生成示例顯示,V4-Pro在Agent框架下的表現已經相當成熟。
API同步更新,開發者友好
即時可用
- 官網和App:登錄chat.deepseek.com或官方App即可體驗
- API服務:修改model_name為deepseek-v4-pro或deepseek-v4-flash即可呼叫
- 介面相容:支援OpenAI ChatCompletions介面與Anthropic介面
重要提示
舊有API介面的兩個模型名deepseek-chat與deepseek-reasoner將於三個月後(2026年7月24日)停止使用。
當前階段,這兩個模型名分別指向deepseek-v4-flash的非思考模式與思考模式。
開源同步發佈,踐行開放承諾
DeepSeek延續了其開源傳統,V4預覽版同步開源:
- Hugging Face:https://huggingface.co/collections/deepseek-ai/deepseek-v4
- ModelScope:https://modelscope.cn/collections/deepseek-ai/DeepSeek-V4
- 技術報告:https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf
行業影響與意義
DeepSeek V4的發佈對中國AI產業具有深遠意義:
- 技術路徑的自主創新
從跟隨CUDA生態到建構基於國產硬體的完整技術堆疊,為行業發展提供了新路徑。 - 性能與成本的雙重突破
在性能比肩頂級閉源模型的同時,保持了極具競爭力的成本優勢。 - 開源生態的建設者
通過持續開源高品質模型,推動了整個開源AI社區的發展。 - AGI目標的務實探索
正如DeepSeek在發佈稿中所說:"我們將始終秉持長期主義的原則理念,在嘗試與思考中踏實前行,努力向實現AGI的目標不斷靠近。"
寫在最後
在過去的幾個月裡,關於V4何時發佈、是否跳票、是否被超越的傳言在AI圈來回傳播。但DeepSeek沒有回應任何傳言,而是選擇在某個周五的上午,默默地將V4放出來,同步開源,同步上線所有服務。
"不誘於譽,不恐於誹,率道而行,端然正己。"這不僅是DeepSeek的態度,也應該是中國AI產業發展的寫照。
DeepSeek V4的發佈,讓我們看到了中國AI在技術創新、生態建設、產業協同方面的巨大潛力。未來,讓我們期待更多這樣的突破。 (半山AI進化論)
