Tag Archive
标签:Coding Agent
这里整理所有带有「Coding Agent」标签的文章,方便按主题快速回看。
首页
每日调研
论文精读
主题归档
实验分析
Coding Agent
共 1 篇
主题归档 · 2026-04-28
On-Policy Distillation:从模型压缩到 Agent 自我进化的蒸馏范式
On-Policy Distillation 将蒸馏从静态教师数据推进到学生自身行为分布上的密集监督;它不仅是 RL 的稳定替代形态,也是 DeepSeek-V4 式多专家合版、coding agent 经验吸收和 personal agent 自我进化的关键桥梁。
LLM
Agent
Reinforcement Learning
Distillation
Self-Evolution
DeepSeek-V4
Coding Agent