Tag Archive
标签:On-Policy Distillation
这里整理所有带有「On-Policy Distillation」标签的文章,方便按主题快速回看。
首页
每日调研
论文精读
主题归档
实验分析
复现指南
On-Policy Distillation
共 1 篇
主题归档 · 2026-05-16
大模型 OPD:经典工作、发展逻辑与最新问题
系统梳理大模型 On-Policy Distillation 的定义、经典工作、发展逻辑、方法谱系与当前开放问题。
LLM
OPD
On-Policy Distillation
后训练
LLM Agent