每日调研 2026-03-23

#2026-03-23 学习记录：Multi-Token Prediction

#今日主题

大模型中的 multi-token prediction（MTP）研究进展，以及它与 speculative decoding 的区别。

#今日学到的重点

MTP 是训练目标层面的改造，不只是推理技巧
它的核心是：同一位置同时学习多个未来 token
训练侧收益包括更密集的监督信号和更好的长程建模潜力
推理侧收益通常要和 speculative / 多头并行验证机制结合才能释放
Better & Faster MTP 是该方向的重要代表工作
DeepSeek-V3 则体现了工业系统如何把 MTP 接进训练与推理协同设计中

#对后续学习的意义

MTP 是理解“训练目标还能怎么改”的关键方向，也和代码模型、推理模型、推理加速栈直接相关。

#建议后续衔接

Better & Faster MTP 论文
DeepSeek-V3 technical report
speculative decoding / Medusa / self-speculative