Tag Archive
标签:"scaling law"
这里整理所有带有「"scaling law"」标签的文章,方便按主题快速回看。
首页
每日调研
论文精读
主题归档
实验分析
"scaling law"
共 1 篇
论文精读 · 2026-04-23
"论文解读:Stacking Your Transformers——重新审视用模型增长加速 LLM 预训练"
"这篇论文系统比较了多种模型增长方法,发现最简单的 depthwise stacking(Gstack)反而最有效,并进一步给出了 growth timing 与 growth factor 的经验法则。"
["LLM"
"pretraining"
"scaling law"
"model growth"
"stacking"
"论文解读"]