騰訊推出全新開源模型:僅130億啟動參數，媲美o1 和DeepSeek

2025/06/28

•

企鵝最新開源LLM Hunyuan-A13B，MoE 架構，在多個主流基準測試中與o1 和DeepSeek相當

【核心特性與優勢:】

小參數量，高效能：僅啟動130億參數（總參數量800億），即可在多樣化基準任務中媲美更大規模模型的競爭力表現

混合推理支援：同時支援快思考和慢思考兩種模式，支援使用者靈活選擇

超長上下文理解：原生支援256 K上下文窗口，在長文字任務中保持穩定性能

增強Agent能力：最佳化Agent能力，在BFCL-v3、τ-Bench等智能體基準測試中領先
高效推理：採用分組查詢注意力（GQA）策略，支援多量化格式，實現高效推理

為了進一步提高LLM的能力，企鵝還開源了兩個新的資料集：ArtifactsBench 旨在彌合程式碼評估中的視覺和互動差距，而C3-Bench 是一個特定於代理的評估資料集，旨在揭示模型漏洞並促進對性能可解釋性的研究。

試用： hunyuan.tencent.com
API地址： cloud.tencent.com/product/tclm
GitHub： github.com/Tencent-Hunyuan
抱抱臉： huggingface.co/tencent/Hunyua…
C3-Bench資料集： github.com/Tencent-Hunyua… （AI寒武紀）