#Day-0 | 熱門關鍵字 | 鉅亨號

高效支撐長程任務與程式碼生成今日，摩爾線程在其旗艦級AI訓推一體全功能GPU MTT S5000上，成功實現了對智譜新一代旗艦模型GLM-5.1的Day-0極速適配，提供推理部署和訓練復現全流程支援。依託MUSA軟體棧強大的生態相容性，摩爾線程技術團隊基於高性能 SGLang-MUSA推理引擎及TileLang-MUSA算子程式語言，採用PD分離架構完成深度調優，在 MTT S5000 上實現 GLM-5.1 的高效、高精度推理。這一成果彰顯了國產算力基礎設施對前沿 SOTA 模型的快速響應能力，也為行業樹立了軟硬協同應對複雜 AI 推理場景的新標竿。GLM-5.1是智譜迄今最智能的旗艦模型，也是目前全球最強的開源模型。GLM-5.1大大提高了程式碼能力，在最接近真實軟體開發的SWE-bench Pro基準測試中超過GPT-5.4、Claude Opus 4.6，刷新全球最佳成績。值得一提的是，在模型整體性能大幅提升外，GLM-5.1還在長程任務（Long Horizon Task）處理能力上實現了顯著突破。和當前分鐘級互動的模型不同，GLM-5.1能夠在一次任務中獨立、持續工作超過8小時，期間自主規劃、執行、自我進化，最終交付完整的工程級成果。針對GLM-5.1的長程任務與程式碼生成特性，摩爾線程基於自研MUSA架構與SGLang-MUSA、TileLang-MUSA等關鍵技術，完成了系統性的算子適配與推理性能調優。MTT S5000單卡AI算力（稠密）可達1000 TFLOPS，支援FP8到FP64全精度計算，其原生FP8加速顯著提升推理效率；結合高效KV Cache管理，有效支撐極長上下文的視訊記憶體需求；同時，PD分離架構進一步解耦Prefill與Decode階段，降低長序列生成中的干擾，保障持續任務的高吞吐與低延遲。此外，MTT S5000提供784GB/s的卡間互聯頻寬，為大規模部署帶來彈性擴展能力。通過軟硬協同最佳化，MTT S5000能夠穩定承接GLM-5.1的長程任務吞吐與工程級程式碼推理表現。從GLM-4.7到GLM-5.1，摩爾線程已連續實現發佈當日極速適配。這既體現了MUSA架構對主流AI生態的深度相容，更標誌著國產全功能GPU已具備大模型“從適配到部署”的全鏈路支撐能力。摩爾線程將持續夯實算力底座，助力開發者快速應用前沿模型，共建更成熟的國產AI生態。來源：摩爾線程 (芯榜+)