實測！DeepSeek V4-pro是第一個接近Claude開源模型，前Meta研究員震驚

2026/05/02

•

DeepSeek V4-pro是第一個接近Claude開源模型

DAIR.AI創始人、前Meta AI研究員Elvis最近花了幾個小時，用DeepSeek-V4-Pro在Pi這個Agent框架裡搭了一個LLM知識庫。結果他直接被整震驚了。

開箱即用

他用的是Pi，一個基礎的Agent腳手架，沒有做任何特殊配置，直接把DeepSeek-V4-Pro接進去，就跑起來了。

他特別強調這一點：這是他第一次見到一個開源模型，可以就這樣插進一個基礎框架，什麼都不用調，直接工作。以前遇到的模型，基本都需要大量的配置和前期準備工作。能做到這一步，本身就已經很罕見了。

推理服務跑在Fireworks AI上。

Agent幹了什麼

這個Agent承擔的任務並不輕鬆，是一次覆蓋面很廣的知識密集型多步研究任務：

從Anthropic、OpenAI、Google、Stripe、Meta、Modal、DeepSeek、Mistral、Cohere等多家公司的官方文件裡，抓取Agent工程的最佳實踐；同時搜尋並消化Reddit和Hacker News上的相關討論帖；總結arXiv上的學術論文；挖掘GitHub上的熱門倉庫。

最後，把所有這些來源的內容彙總，提煉成分類清晰、可以直接落地執行的建議，組成一整個知識庫Wiki。

Wiki已經開源，可以直接查看：

https://github.com/dair-ai/dair-workshops/tree/main/agentic-engineering-wiki

Elvis對成品質量的評價是：真的很好。

模型在整個過程中沒有出任何問題

多步研究查詢、為腳手架生成程式碼、跨多個來源的重度上下文推理，全部流暢完成，沒有卡頓，沒有中斷。

他對DeepSeek-V4-Pro的判斷是兩點：

第一，在開源模型裡，它在Agent程式設計任務上可能是最強的；第二，它在知識密集型、需要推理的任務上同樣表現出色，不只是會寫程式碼。

在程式設計能力這件事上，他給出了一個更直接的評價：這是他見過的第一個開源模型，真正能讓人感受到接近Codex或Claude Code的體驗。不是說能力差不多，而是在實際的多輪Agent任務裡，它能真正比肩這兩個產品。

他也提到，這是他第一次感受到，有一個開源模型的推理能力真正達到了Claude和Codex的水平，同時還以一種經濟實惠的方式實現了對100萬token上下文長度的支援。

跑得快，背後有架構原因

整個Agent循環之所以響應迅速，有兩個因素。

一個是Fireworks AI的推理速度，Elvis認為這是目前市場上最快的，並且Fireworks在上線模型之前會在系統層面做驗證，沒有出現推理鏈損壞的問題，迭代穩定可靠。

另一個是DeepSeek-V4-Pro自身的架構設計。它採用了混合CSA和HCA注意力機制，在100萬token的上下文長度下，KV快取只有原來的10%，推理所需的FLOPs降低了近4倍。這兩點加在一起，讓Agent循環在實際使用中足夠快、足夠便宜，真正可以跑起來。

給一直在等的開發者

Elvis最後說，對於那些一直在觀察開源模型能否真正追上閉源模型、但始終沒找到一個能在實踐中真正交付的人來說，DeepSeek-V4-Pro是他目前見過最接近那個答案的模型。 (AI寒武紀)