清华团队深度实证:RL 真能让大模型进化吗?能力边界仍被基座“锁死”! 强化学习(RL)真的能让大模型获得超越基础模型的新推理能力吗?近日,清华大学LeapLab团队联合上海交大,发布了一篇题为《Does Reinforcement Learning Really Incentivize Reasoning Capacity in 模型 清华 基座 rl rl真能 2025-04-23 12:01 3