隨寫 | 科技 | 鉅亨號

H100 很快變成過去式?

摩根士丹利最新報告揭示，中國AI新創公司 DeepSeek 即將推出的旗艦大語言模型 R2，在參數規模與性能大幅升級的同時，具備超高性價比。R2 擁有 1.2 兆總參數，活躍參數達 780 億，是前一代 R1 的兩倍以上，實力接近 Google Gemini 與 Anthropic Claude 等國際頂尖模型。

在成本方面，R2 每百萬 token 的輸入成本為 0.07 美元，輸出為 0.27 美元，對比 GPT-4o 的輸入 2.5 美元、輸出 10 美元，僅為其 約 3% 成本，極具吸引力。

R2 採用了 MoE（混合專家）架構，在多語言處理、程式生成、圖像理解、算力效率等方面均有顯著提升。同時，DeepSeek 正逐步擺脫對輝達 H100 的依賴，改用 華為昇騰 910B 晶片訓練與推理，展現中國 AI 自主化的重大突破，有助降低美國技術封鎖帶來的風險。

stock.yahoo.com

大摩揭密DeepSeek R2大語言模型，成本壓到僅約GPT-4o的3%

【財訊快報／陳孟朔】中國AI新創公司DeepSeek即將推出的旗艦級大語言模型「R2」備受關注，摩根士丹利(大摩)日前在最新研究報告中提前披露其細節，不僅參數規模與能力大幅提升，還具備超高性價比與本土晶片替代突破，為中國AI自主化注入強勁動能。外電引述報告指出，DeepSeek R2總參數高達1.2兆，為前一代R1的兩倍以上，活躍參數也從370億提升至780億，模型推理時可調用更多「腦細胞」，類似Google Gemini與Anthropic Claude等國際領先模型，朝深度語言理解邁進。在成本方面，R2大幅壓縮至每百萬Token輸入僅0.07美元、輸出0.27美元，對比OpenAI GPT-4o輸入2.5美元、輸出10美元，便宜高達97%，成為企業與開發者的新選擇。技術上，R2採用更高效的MoE(Mixture of Experts)混合專家架構，具備多語言與程式生成強化、圖像處理與視覺理解強化、算力效率與推理優化。更具戰略意涵的是，報告揭示DeepSeek逐步擺脫對輝達H100的依賴，改採華為昇騰910B晶片集群進行訓練與推理，被視為中國AI供應鏈自主化的重要突破，減少美國晶片技