模态llm

用多模态LLM超越YOLOv3！强化学习突破多模态感知极限｜开源

华中科技大学、北京邮电大学等多所高校研究团队共同推出的Perception-R1（PR1），在视觉推理中最基础的感知层面，探究rule-based RL能给模型感知pattern带来的增益。

从现有对齐算法涵盖的应用场景，到构建对齐数据集的核心因素，再到用于评估对齐算法的基准，还有对齐算法未来潜在发展方向，全都梳理了一遍。