DanceGRPO:首个统一视觉生成的强化学习框架 本文由字节跳动 Seed 和香港大学联合完成。第一作者薛泽岳为香港大学 MMLab@HKU 在读博士生,在 CVPR、NeurIPS 等国际顶级会议上发表多篇研究成果。项目通讯作者为黄伟林博士和罗平教授。 llm 视觉 flux 文生 dancegrpo 2025-05-14 18:38 2