H100 很快變成過去式?

摩根士丹利最新報告揭示,中國AI新創公司 DeepSeek 即將推出的旗艦大語言模型 R2,在參數規模與性能大幅升級的同時,具備超高性價比。R2 擁有 1.2 兆總參數,活躍參數達 780 億,是前一代 R1 的兩倍以上,實力接近 Google Gemini 與 Anthropic Claude 等國際頂尖模型。

在成本方面,R2 每百萬 token 的輸入成本為 0.07 美元,輸出為 0.27 美元,對比 GPT-4o 的輸入 2.5 美元、輸出 10 美元,僅為其 約 3% 成本,極具吸引力。

R2 採用了 MoE(混合專家)架構,在多語言處理、程式生成、圖像理解、算力效率等方面均有顯著提升。同時,DeepSeek 正逐步擺脫對輝達 H100 的依賴,改用 華為昇騰 910B 晶片訓練與推理,展現中國 AI 自主化的重大突破,有助降低美國技術封鎖帶來的風險。