Tag Archive
标签:deep-learning
这里整理所有带有「deep-learning」标签的文章,方便按主题快速回看。
首页
每日调研
论文精读
主题归档
实验分析
deep-learning
共 1 篇
主题归档 · 2026-04-26
从 SGD 到 Muon:大模型训练中优化器的演化逻辑、方法细节与未来展望
从最基础的随机梯度下降出发,系统梳理 Momentum、AdaGrad、RMSProp、Adam、AdamW、大模型训练中的参数分组与二阶/预条件思想,最后落到 Muon 的核心动机、算法结构、适用边界与未来优化器演化趋势。
optimization
llm
training
muon
deep-learning
reasoning