Diversity or Precision? A Deep Dive into Next Token Prediction

Dec 30, 2025·

Haoyuan Wu

Haoyuan Wu

,

Hai Wang

,

Jiajia Wu

,

Jinxiang Ou

,

Keyao Wang

,

Weile Chen

,

Zihao Zheng

,

Bei Yu

· 0 min read

Paper

Type

Conference paper

Publication

arXiv:2512.22955 (2025), (Hunyuan Technical Report)

Last updated on Dec 30, 2025

Large Language Models

Haoyuan Wu

Authors

Ph.D. Student

One-Token Rollout: Guiding Supervised Fine-Tuning of LLMs with Policy Gradient Sep 30, 2025 →