OpenAI强化微调登场:几十条数据o1-mini反超o1,“今年最大惊喜” 新功能强化微调(Reinforcement Fine-Tuning),使用极少训练数据即在特定领域轻松地创建专家模型。 openai o1 alpha版本 2024-12-07 03:38 2