Tag Archive

标签:On-Policy Distillation

这里整理所有带有「On-Policy Distillation」标签的文章,方便按主题快速回看。

On-Policy Distillation

共 1 篇
主题归档 · 2026-05-16

大模型 OPD:经典工作、发展逻辑与最新问题

系统梳理大模型 On-Policy Distillation 的定义、经典工作、发展逻辑、方法谱系与当前开放问题。
LLMOPDOn-Policy Distillation后训练LLM Agent