它來了!
千呼萬喚始出來,就在剛剛,DeepSeek正式發佈並開源全新系列模型DeepSeek-V4,分為Pro和Flash兩個版本。在一年前震動矽谷之後,這次帶來了其迄今為止最大的一次升級。
DeepSeek發佈V4版本
4月24日,DeepSeek全新系列模型DeepSeek-V4的預覽版本正式上線並同步開源。據介紹,DeepSeek-V4擁有百萬字超長上下文,在Agent能力、世界知識和推理性能上均實現國內與開源領域的領先。模型按大小分為兩個版本。即日起登錄官網或官方App,即可與DeepSeek-V4對話,API服務也已同步更新。
以下是新版本的重點內容:
1. DeepSeek-V4-Pro:性能比肩頂級閉源模型
相比前代模型,DeepSeek-V4-Pro的Agent能力顯著增強。在Agentic Coding評測中,V4-Pro已達到當前開源模型最佳水平,並在其他Agent相關評測中同樣表現優異。目前DeepSeek-V4已成為公司內部員工使用的Agentic Coding模型,據評測反饋使用體驗優於Sonnet 4.5,交付質量接近Opus 4.6非思考模式,但仍與Opus 4.6思考模式存在一定差距。
DeepSeek-V4-Pro在世界知識測評中,大幅領先其他開源模型,僅稍遜於頂尖閉源模型Gemini-Pro-3.1。
在數學、STEM、競賽型程式碼的測評中,DeepSeek-V4-Pro超越當前所有已公開評測的開源模型,取得了比肩世界頂級閉源模型的優異成績。
2. 大幅降低了對計算和視訊記憶體的需求
DeepSeek-V4開創了一種全新的注意力機制,在token維度進行壓縮,結合DSA稀疏注意力(DeepSeek Sparse Attention),實現了全球領先的長上下文能力,並且相比於傳統方法大幅降低了對計算和視訊記憶體的需求。從現在開始,1M(一百萬)上下文將是DeepSeek所有官方服務的標配。
3. Agent 能力專項最佳化
DeepSeek-V4針對Claude Code、OpenClaw、OpenCode、CodeBuddy 等主流的Agent產品進行了適配和最佳化,在程式碼任務、文件生成任務等方面表現均有提升。
DeepSeek融資進行中
據多家媒體報導,DeepSeek近日啟動首輪融資,正與少數戰略投資者接觸,可能把估值推高至200億美元以上。
知情人士稱,DeepSeek的自由現金流確實不如一些體量更大的競爭對手充裕,但公司眼下並沒有迫切的大額外部融資需求。
因此,這輪融資的核心其實是穩定研究團隊。過去一年,一些競爭對手估值快速上升,DeepSeek已有部分研究人員離職投向對方。在AI行業,股票期權通常是研究人員薪酬的重要組成部分,很多時候甚至佔到大頭。
目前談判仍存在較大不確定性,最終是否達成交易以及具體估值仍未可知。
2025年1月,DeepSeek發佈了一款具有突破性的模型,其性能可與美國競爭對手相媲美,震動了整個AI行業。
市場反應
DeepSeek消息出來之後,市場反應較為劇烈。
國產晶片直線猛拉,寒武紀直線大漲。消息面上,寒武紀已基於vLLM推理框架完成對DeepSeek全新版本的Day 0適配,適配程式碼已開源到GitHub社區。這一成果得益於寒武紀長期積累的自研NeuWare軟體生態與晶片設計技術,也是寒武紀對晶片與演算法聯合創新持續投入的延續。
而DeepSeek的競爭對手——智譜、Minimax在V4發佈後跌勢擴大,分別跌6.8%和3.9%。
(中國基金報)
