Tag Archive

标签:weak-supervision

这里整理所有带有「weak-supervision」标签的文章,方便按主题快速回看。

weak-supervision

共 1 篇
论文精读 · 2026-04-22

When Can LLMs Learn to Reason with Weak Supervision? 论文详解

这篇论文系统回答了一个关键问题:LLM 在什么条件下能靠弱监督 RL 真正学会推理,什么时候又只是在记忆和投机。
papersreasoningrlweak-supervisionrlvr