摩爾線程率先完成MiniMax M2.7大模型適配

2026/04/13

•

4月12日，摩爾線程旗艦級AI訓推一體全功能GPU MTT S5000已完成對新一代大模型MiniMax M2.7的Day-0極速適配，再次驗證了中國國產全功能GPU對前沿AI大模型的快速響應與穩定支撐能力。

MiniMax M2.7是業界首個具備深度自我進化能力的大模型，能夠自主建構Agent Harness，通過Agent Teams協作、複雜Skills呼叫及Tool Search Tool等能力完成複雜生產力任務，甚至深度參與自身迭代。在軟體工程領域，M2.7支援端到端完整項目交付、日誌分析排障、程式碼安全審查及機器學習任務；在專業辦公場景，其Excel/PPT/Word高保真編輯與多輪修改能力顯著提升，即使在超長上下文複雜任務中仍保持穩定的高水平skills遵循率。與此同時，該模型對長上下文處理、複雜Agent任務調度及高保真編輯等場景提出了極高的計算效率要求。

針對上述挑戰，摩爾線程技術團隊基於MUSA架構完成深度調優，成功在MTT S5000上實現M2.7大模型的高性能推理，核心技術優勢包括：

▼超長上下文高吞吐：依託MTT S5000的80GB大容量視訊記憶體、1.6TB/s高頻寬及PD分離架構，配合高效KV Cache管理，支撐MiniMax M2.7長時間、多步驟任務的穩定執行。

▼全精度端到端支援：MTT S5000原生支援FP8至FP64全精度計算，可滿足程式碼生成、金融建模等場景對混合精度及高精度計算的要求，確保決策精準可靠。

▼高算力低延遲推理：MTT S5000單卡可提供1000 TFLOPS稠密算力，結合vLLM-MUSA定製化調優，實現複雜Agent Harness與高頻工具呼叫場景下的低延遲響應。

▼強大生態相容性：深度相容PyTorch、vLLM、SGLang、Triton等主流生態，通過MUSA C++、Triton-MUSA、TileLang-MUSA等抽象層實現新算子“零成本遷移”，確保前沿模型發佈當日完成極速適配。

此次Day-0適配是摩爾線程常態化技術響應能力的再次體現。依託 MUSA 架構對主流AI生態的深度相容與持續演進，中國國產全功能GPU算力底座已形成覆蓋前沿模型“極速適配-高效部署”的全鏈路支撐體系，幫助開發者以更快響應、更穩運行、更低遷移成本第一時間接入最新模型能力，加速大模型創新落地與規模化應用。 (深科技)

摩爾線程 率先完成MiniMax M2.7大模型適配

摩爾線程率先完成MiniMax M2.7大模型適配