从失败中学习:强化蒸馏法让大语言模型更擅长推理
在人工智能研究的最前沿,一项创新研究正在改变我们训练大语言模型(LLM)推理能力的方式。来自国立新加坡大学和上海英飞睿(INFLY TECH)的研究团队于2025年5月30日在arXiv预印本平台发表了一篇题为《从负面信号中获益:利用教师数据的强化蒸馏提升LL
在人工智能研究的最前沿,一项创新研究正在改变我们训练大语言模型(LLM)推理能力的方式。来自国立新加坡大学和上海英飞睿(INFLY TECH)的研究团队于2025年5月30日在arXiv预印本平台发表了一篇题为《从负面信号中获益:利用教师数据的强化蒸馏提升LL
在历史的记载中,关于谁最先使用蒸馏技术制酒的问题,充满了趣味与神秘。亚里士多德曾提及通过煮沸海水并冷凝来去除盐分的方法,这一记录表明古希腊人在当时已经掌握了蒸馏技术的雏形。然而,真正开启蒸馏酒制作先河的并非希腊人,而是阿拉伯人。