蒸馏法

从失败中学习：强化蒸馏法让大语言模型更擅长推理

在人工智能研究的最前沿，一项创新研究正在改变我们训练大语言模型（LLM）推理能力的方式。来自国立新加坡大学和上海英飞睿（INFLY TECH）的研究团队于2025年5月30日在arXiv预印本平台发表了一篇题为《从负面信号中获益：利用教师数据的强化蒸馏提升LL

在历史的记载中，关于谁最先使用蒸馏技术制酒的问题，充满了趣味与神秘。亚里士多德曾提及通过煮沸海水并冷凝来去除盐分的方法，这一记录表明古希腊人在当时已经掌握了蒸馏技术的雏形。然而，真正开启蒸馏酒制作先河的并非希腊人，而是阿拉伯人。