每日调研 2026-04-20 dailypapersdigest

#2026-04-20 Hugging Face Daily Papers 早读

#重点论文

#HY-World 2.0: A Multi-Modal World Model for Reconstructing, Generating, and Simulating 3D Worlds

  • 背景:3D 世界模型关系到虚拟场景生成、机器人仿真、游戏内容生产和数字孪生。难点在于输入模态多、世界尺度大、跨视角一致性要求高。
  • 解决方案:统一支持文本、单图、多图和视频输入,输出可交互的 3D Gaussian Splatting 场景。核心是四阶段流水线:全景生成、轨迹规划、视角扩展、世界组合。
  • 链接:

- Hugging Face: https://huggingface.co/papers/2604.14268

- arXiv: https://arxiv.org/abs/2604.14268

- GitHub: https://github.com/Tencent-Hunyuan/HY-World-2.0

#DR³-Eval: Towards Realistic and Reproducible Deep Research Evaluation

  • 背景:Deep Research Agent 很热,但评测一直偏虚,真实环境会变、报告难客观打分。
  • 解决方案:构建可复现的研究沙箱,评估信息召回、事实准确、引用覆盖、指令遵循和分析深度。
  • 链接:

- Hugging Face: https://huggingface.co/papers/2604.14683

- arXiv: https://arxiv.org/abs/2604.14683

- GitHub: https://github.com/NJU-LINK/DR3-Eval

#RAD-2: Scaling Reinforcement Learning in a Generator-Discriminator Framework

  • 背景:自动驾驶轨迹规划里,扩散式规划器能建模多模态未来,但缺少长期回报纠偏。
  • 解决方案:生成器提出候选轨迹,判别器用强化学习学习长期驾驶质量后进行重排。
  • 链接:

- Hugging Face: https://huggingface.co/papers/2604.15308

- arXiv: https://arxiv.org/abs/2604.15308

- GitHub: https://github.com/hustvl/RAD

#今日判断

今天最值得继续深挖的是 HY-World 2.0。它更像一个 3D 世界底座,而不是单点生成模型。