華爾街頂尖分析師鉅亨網開專欄【Joe’s華爾街脈動】，即日起分享會員

9月29日，DeepSeek-V3.2-Exp模型正式在Hugging Face平台發佈並開源。模型引入稀疏 Attention 架構，這種架構能夠降低計算資源消耗並提升模型推理效率。

據“華為計算”微信公眾號消息，昇騰已快速基於vLLM/SGLang等推理框架完成適配部署，實現DeepSeek-V3.2-Exp 0day支援，並面向開發者開源所有推理程式碼和算子實現。

寒武紀在官方微訊號宣佈，已同步實現對深度求索公司最新模型DeepSeek-V3.2-Exp的適配，並開源大模型推理引擎vLLM-MLU原始碼。依託DeepSeek-V3.2-Exp帶來的全新DeepSeek Sparse Attention機制，疊加寒武紀的極致計算效率，可大幅降低長序列場景下的訓推成本。

海光資訊同日宣佈其DCU實現無縫適配+深度調優，做到大模型算力“零等待”部署。海光資訊表示，基於GPGPU架構強大的生態優勢，與程式設計開發軟體棧DTK的特性，DeepSeek-V3.2-Exp在海光DCU上展現出優異的性能，同時驗證海光DCU高通用性、高生態相容度及自主可控的技術優勢。  (財聯社)

寒武紀、華為昇騰適配DeepSeek最新模型