Tag Archive
标签:Agent
这里整理所有带有「Agent」标签的文章,方便按主题快速回看。
首页
每日调研
论文精读
主题归档
实验分析
Agent
共 3 篇
每日调研 · 2026-04-29
2026-04-29 AI/LLM 最新论文与研究热点简报
最近 24-48 小时 AI/LLM/Agent/代码智能相关最新论文与热点进展筛选。
daily
AI
LLM
Agent
Code Intelligence
Research Briefing
每日调研 · 2026-04-28
2026-04-28 AI/LLM 最新论文与研究热点简报
最近 24-48 小时 AI/LLM/Agent/代码智能相关最新论文与热点进展筛选。
daily
AI
LLM
Agent
Code Intelligence
Research Briefing
主题归档 · 2026-04-28
On-Policy Distillation:从模型压缩到 Agent 自我进化的蒸馏范式
On-Policy Distillation 将蒸馏从静态教师数据推进到学生自身行为分布上的密集监督,成为连接 SFT、RLHF、模型合版与 personal agent 自我进化的一条关键技术路线。
LLM
Agent
Reinforcement Learning
Distillation
Self-Evolution