寒武紀、華為昇騰適配DeepSeek最新模型

9月29日,DeepSeek-V3.2-Exp模型正式在Hugging Face平台發佈並開源。模型引入稀疏 Attention 架構,這種架構能夠降低計算資源消耗並提升模型推理效率。

據“華為計算”微信公眾號消息,昇騰已快速基於vLLM/SGLang等推理框架完成適配部署,實現DeepSeek-V3.2-Exp 0day支援,並面向開發者開源所有推理程式碼和算子實現。

寒武紀在官方微訊號宣佈,已同步實現對深度求索公司最新模型DeepSeek-V3.2-Exp的適配,並開源大模型推理引擎vLLM-MLU原始碼。依託DeepSeek-V3.2-Exp帶來的全新DeepSeek Sparse Attention機制,疊加寒武紀的極致計算效率,可大幅降低長序列場景下的訓推成本。

海光資訊同日宣佈其DCU實現無縫適配+深度調優,做到大模型算力“零等待”部署。海光資訊表示,基於GPGPU架構強大的生態優勢,與程式設計開發軟體棧DTK的特性,DeepSeek-V3.2-Exp在海光DCU上展現出優異的性能,同時驗證海光DCU高通用性、高生態相容度及自主可控的技術優勢。 (財聯社)