爆料！DeepSeek R2即將發佈：1.2兆參數，成本暴跌97%，真王炸，還是空歡喜？

2025/04/28

•

DeepSeek 這是要搞一波大的了？

一條關於 DeepSeek 新模型的消息在 AI 圈裡炸開了鍋。

什麼？DeepSeek-R2，混合專家模型，5.2 PB 訓練資料，1.2 兆總參數，780 億動態啟動參數，最最炸裂的是，R2 的訓練和推理成本比 GPT-4 還要低 97.3%？！

上面這條在 X 平台瘋傳的帖子，經我調查，源頭來自一個叫“韭研公社”的投資平台。

根據“韭研公社”的爆料，DeepSeek-R2 模型採用混合專家 3.0（Hybrid MoE 3.0）架構，總參數規模達到驚人的 1.2 兆，其中動態啟動 780 億；單位 token 推理成本比起 GPT-4 Turbo 下降 97.3%，硬體適配上實現了昇騰 910B 晶片叢集 82% 的高利用率，算力接近 A100 叢集。

然而，先別急著開香檳，爆料的真實性仍待 DeepSeek 官方確認。

“熱心”的外國網友甚至根據這則爆料製作出了下面這份 DeepSeek-R2 概念股（DeepSeek R2 Concept Stocks）的盤點圖。

一個字，絕！