高效支撐長程任務與程式碼生成今日,摩爾線程在其旗艦級AI訓推一體全功能GPU MTT S5000上,成功實現了對智譜新一代旗艦模型GLM-5.1的Day-0極速適配,提供推理部署和訓練復現全流程支援。依託MUSA軟體棧強大的生態相容性,摩爾線程技術團隊基於高性能 SGLang-MUSA推理引擎及TileLang-MUSA算子程式語言,採用PD分離架構完成深度調優,在 MTT S5000 上實現 GLM-5.1 的高效、高精度推理。這一成果彰顯了國產算力基礎設施對前沿 SOTA 模型的快速響應能力,也為行業樹立了軟硬協同應對複雜 AI 推理場景的新標竿。GLM-5.1是智譜迄今最智能的旗艦模型,也是目前全球最強的開源模型。GLM-5.1大大提高了程式碼能力,在最接近真實軟體開發的SWE-bench Pro基準測試中超過GPT-5.4、Claude Opus 4.6,刷新全球最佳成績。值得一提的是,在模型整體性能大幅提升外,GLM-5.1還在長程任務(Long Horizon Task)處理能力上實現了顯著突破。和當前分鐘級互動的模型不同,GLM-5.1能夠在一次任務中獨立、持續工作超過8小時,期間自主規劃、執行、自我進化,最終交付完整的工程級成果。針對GLM-5.1的長程任務與程式碼生成特性,摩爾線程基於自研MUSA架構與SGLang-MUSA、TileLang-MUSA等關鍵技術,完成了系統性的算子適配與推理性能調優。MTT S5000單卡AI算力(稠密)可達1000 TFLOPS,支援FP8到FP64全精度計算,其原生FP8加速顯著提升推理效率;結合高效KV Cache管理,有效支撐極長上下文的視訊記憶體需求;同時,PD分離架構進一步解耦Prefill與Decode階段,降低長序列生成中的干擾,保障持續任務的高吞吐與低延遲。此外,MTT S5000提供784GB/s的卡間互聯頻寬,為大規模部署帶來彈性擴展能力。通過軟硬協同最佳化,MTT S5000能夠穩定承接GLM-5.1的長程任務吞吐與工程級程式碼推理表現。從GLM-4.7到GLM-5.1,摩爾線程已連續實現發佈當日極速適配。這既體現了MUSA架構對主流AI生態的深度相容,更標誌著國產全功能GPU已具備大模型“從適配到部署”的全鏈路支撐能力。摩爾線程將持續夯實算力底座,助力開發者快速應用前沿模型,共建更成熟的國產AI生態。來源:摩爾線程 (芯榜+)