Tag Archive

标签:"model growth"

这里整理所有带有「"model growth"」标签的文章,方便按主题快速回看。

"model growth"

共 1 篇
论文精读 · 2026-04-23

"论文解读:Stacking Your Transformers——重新审视用模型增长加速 LLM 预训练"

"这篇论文系统比较了多种模型增长方法,发现最简单的 depthwise stacking(Gstack)反而最有效,并进一步给出了 growth timing 与 growth factor 的经验法则。"
["LLM""pretraining""scaling law""model growth""stacking""论文解读"]