最近忙著大規模招兵買馬的 DeepSeek,也始終沒有忘記開源這條主線。
今天,DeepSeek 與北京大學團隊聯合發佈論文《DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation》,提出了一套新的大模型推理加速框架 DSpark。
技術報告 🔗 https://github.com/deepseek-ai/DeepSpec/blob/main/DSpark_paper.pdf
論文披露,DSpark 已經進入 DeepSeek-V4-Flash preview 和 DeepSeek-V4-Pro preview 的生產服務系統,並替代此前的 MTP-1 方案。