Tag Archive

标签:Distillation

这里整理所有带有「Distillation」标签的文章,方便按主题快速回看。

Distillation

共 1 篇
主题归档 · 2026-04-28

On-Policy Distillation:从模型压缩到 Agent 自我进化的蒸馏范式

On-Policy Distillation 将蒸馏从静态教师数据推进到学生自身行为分布上的密集监督,成为连接 SFT、RLHF、模型合版与 personal agent 自我进化的一条关键技术路线。
LLMAgentReinforcement LearningDistillationSelf-Evolution