批判式微调

CMU等华人学者提出全新批判式微调，媲美复刻版DeepSeek

CMU等华人学者提出全新批判式微调，媲美复刻版DeepSeek

在面对复杂的推理任务时，SFT往往让大模型显得力不从心。最近，CMU等机构的华人团队提出了「批判性微调」（CFT）方法，仅在 50K 样本上训练，就在大多数基准测试中优于使用超过200万个样本的强化学习方法。

华人 cmu deepseek cft 批判式微调 2025-03-10 08:39 14

让SFT重新伟大！CMU等华人学者提出全新「批判式微调」

让SFT重新伟大！CMU等华人学者提出全新「批判式微调」

在面对复杂的推理任务时，SFT往往让大模型显得力不从心。最近，CMU等机构的华人团队提出了「批判性微调」（CFT）方法，仅在 50K 样本上训练，就在大多数基准测试中优于使用超过200万个样本的强化学习方法。

华人 cmu cft sft 批判式微调 2025-03-09 19:58 13