rl真能

清华团队深度实证：RL 真能让大模型进化吗？能力边界仍被基座“锁死”！

强化学习（RL）真的能让大模型获得超越基础模型的新推理能力吗？近日，清华大学LeapLab团队联合上海交大，发布了一篇题为《Does Reinforcement Learning Really Incentivize Reasoning Capacity in