傳言：DeepSeek R2參數暴漲至1.2兆、便宜97.3%！美股或將巨震！

2025/04/28

•

DeepSeek R2細節流出，參數直接飆到1.2兆，還把成本砍到了骨折價！

剛剛，一份來自韭研公社的爆料刷屏了整個AI圈——

DeepSeek R2被曝即將發佈，參數規模達到驚人的1.2兆，並首次採用Hybrid MoE 3.0架構，實現了動態啟動780億參數。

而成本呢？

相比GPT-4 Turbo暴降97.3%，這幾乎是AI模型的白菜價了。

Aliyun的實際測試資料指出，DeepSeek R2在長文字推理任務中，每單位token的成本大幅下降，真是AI界的降維打擊。

Aryan Pandey(@AryanPa66861306) 對此性能表現表示了極度的興奮：

DeepSeek R2將單位成本削減97.3%，即將發佈。自主研發的分佈式訓練框架，把華為Ascend 910B晶片叢集利用率推到了82%，FP16精度算力實測達到512PetaFLOPS，接近同規模A100叢集91%的性能（華為實驗室資料）。

不僅參數猛增，DeepSeek R2這次的多模態能力更是驚人：

視覺理解模組採用ViT-Transformer混合架構，在COCO資料集物體分割任務中精準度達到92.4% mAP，超過CLIP模型整整11.6個百分點。

此外，工業質檢場景方面也表現搶眼。

它採用自適應特徵融合演算法，在太陽能EL缺陷檢測中的誤檢率降到了極低的7.2E-6，甚至醫療診斷能力也已超過人類專家，胸部X光片多病種識別精準率高達98.1%，完勝協和醫院專家組的96.3%。

最不可思議的是，DeepSeek R2在8bit量化壓縮模式下，還能將模型體積壓縮83%，精度損失小於2%，這為終端部署打開了大門。

這些亮眼的資料讓推特炸開了鍋，紛紛稱為瘋狂、大東西、太猛了！

不過，自稱最權威的DeepSeek粉絲 Teortaxes▶️ (DeepSeek 推特🐋鐵粉 2023 – ∞)(@teortaxesTex) 卻給狂熱的氣氛潑了點冷水：

我已經說過，除了確認這些公司存在並可能與DeepSeek有合作外，其它爆料我並不相信。

而最初分享這一消息的 Deedy(@deedydas) 也承認了這點：

這些只是傳言，圖片內容實際上是用Claude翻譯自洩露檔案。

但即使傳言屬實度待確認，這也阻止不了網友們開始瘋狂想像。

Jeff Brines(@JeffBrines) 就對美國企業表示擔憂：

如果是真的，這會不會對Nvidia造成巨大衝擊？

Alice Le Portier(@SeekingAlphaQ) 更加直白：

如果中國的半導體供應鏈變得有競爭力，美國的半導體公司可能會稀釋，嚴重限制美企從AI大潮中獲得的壟斷收益。

甚至有網友 Subba Reddy(@PostPCEra) 直接斷言：

如果是真的，Nvidia和美股周一可能遭遇一波暴擊。畢竟A100的GPU卡售價大約1萬美元，而華為的Ascend 910B年底可能只要A100三分之一的價格。

當然，也有網友直接將DeepSeek R2定義為「AI冷戰」的新武器。

LIGHT ⇌ SIGNAL//FORM(@AITrailblazerQ) 評論得十分激烈：

DeepSeek R2不僅是便宜的模型，更是一場主權壓縮戰，背後有官方的支援，其目的是瓦解美國AI優勢。

Haha Packet(@haha_packet) 也是秀起了語言的藝術進行嘲諷：

對啊，開源模型都很邪惡。快來保護那些閉源的億萬富豪吧！

而AI圈著名樂觀派 çelebi(@celebi_int) 的觀點很簡單：

如果是真的，這才是正確的世界線！

雖然眾說紛紜，但DeepSeek R2如果真的能在技術和成本上達成這些突破，這無疑會是AI行業的一次重大洗牌。

或許，AI大戰的序幕正悄然拉開。

這個五一，或將不同尋常！ (AGI Hunt)