登入
關鍵字
#長文注意力機制
官方認證
RexAA
2025/02/19
•
Kimi新論文再次“撞車”DeepSeek,都談到了長文注意力機制
Kimi背後的長上下文處理機制曝光了! 這項名為MoBA的新型注意力機制,能將處理1M長文字的速度一下子提升6.5倍,而且還是經過Kimi平台實際驗證的那種。 概括而言,這項耗時一年半的工作主要看點在: 把完整上下文劃分成塊,讓每個查詢token自動去關注最相關的KV塊,這樣就能高效處理長序列資料;
#Kimi
#長文注意力機制
247人
讚
留言
分享