清华耶鲁

清华耶鲁推理模型新范式：动态推理实现高效测试时扩展

以OpenAI的o1系列、DeepSeek-R1等模型为代表，这些系统通过强化学习和大规模思维链（CoT）轨迹训练，在数学证明、编程竞赛等任务中展现出接近人类专家的水平。