清华耶鲁推理模型新范式:动态推理实现高效测试时扩展 以OpenAI的o1系列、DeepSeek-R1等模型为代表,这些系统通过强化学习和大规模思维链(CoT)轨迹训练,在数学证明、编程竞赛等任务中展现出接近人类专家的水平。 推理 范式 清华 耶鲁 清华耶鲁 2025-04-07 17:31 5