騰訊推出全新開源模型:僅130億啟動參數,媲美o1 和DeepSeek

企鵝最新開源LLM Hunyuan-A13B,MoE 架構,在多個主流基準測試中與o1 和DeepSeek相當

【核心特性與優勢:】

小參數量,高效能:僅啟動130億參數(總參數量800億),即可在多樣化基準任務中媲美更大規模模型的競爭力表現

混合推理支援:同時支援快思考和慢思考兩種模式,支援使用者靈活選擇

超長上下文理解:原生支援256 K上下文窗口,在長文字任務中保持穩定性能

增強Agent能力:最佳化Agent能力,在BFCL-v3、τ-Bench等智能體基準測試中領先
高效推理:採用分組查詢注意力(GQA)策略,支援多量化格式,實現高效推理

為了進一步提高LLM的能力,企鵝還開源了兩個新的資料集:ArtifactsBench 旨在彌合程式碼評估中的視覺和互動差距,而C3-Bench 是一個特定於代理的評估資料集,旨在揭示模型漏洞並促進對性能可解釋性的研究。

試用: hunyuan.tencent.com
API地址: cloud.tencent.com/product/tclm
GitHub: github.com/Tencent-Hunyuan
抱抱臉: huggingface.co/tencent/Hunyua…
C3-Bench資料集: github.com/Tencent-Hunyua… (AI寒武紀)