Tag Archive
标签:data-centric-ai
这里整理所有带有「data-centric-ai」标签的文章,方便按主题快速回看。
首页
每日调研
论文精读
主题归档
实验分析
data-centric-ai
共 1 篇
主题归档 · 2026-04-30
预训练数据能否像人类教育一样组织?Curriculum Learning、数据混合与 Developmental Pretraining 研究脉络
调研“按人类学习顺序组织预训练数据”的现有研究支撑:从 Bengio 的 Curriculum Learning、自步学习、NMT 中的 competence-based curriculum,到 BabyLM、TinyStories、Textbooks Are All You Need、DoReMi、ODM、Irreducible Curriculum 与最新 LLM 预训练课程实验,分析该想法的证据、边界与可研究机会。
LLM
预训练
curriculum-learning
data-mixture
developmental-learning
data-centric-ai