合成数据的突破: 从降低迎合性偏差到认知自主性的重构
马来西亚思特雅大学博士生王立博,近两年来主要研究大语言模型。起初,王立博做这类研究也是被大语言模型给逼的,因为日常总得提防其“献媚(Sycophancy)”,这是由基于人类反馈的强化学习调优策略导致的固有缺陷。
transformer 性偏差 立博 2025-01-04 10:16 4
马来西亚思特雅大学博士生王立博,近两年来主要研究大语言模型。起初,王立博做这类研究也是被大语言模型给逼的,因为日常总得提防其“献媚(Sycophancy)”,这是由基于人类反馈的强化学习调优策略导致的固有缺陷。
transformer 性偏差 立博 2025-01-04 10:16 4