偏序

ICML 2025 Oral | 从「浅对齐」到「深思熟虑」

在大语言模型(LLM)加速进入法律、医疗、金融等高风险应用场景的当下,“安全对齐”不再只是一个选项,而是每一位模型开发者与AI落地者都必须正面应对的挑战。然而,如今广泛采用的对齐方式,往往只是让模型在检测到风险提示时机械地回复一句“很抱歉,我无法满足你的请求”

推理 蒙特卡洛 icml oral 偏序 2025-06-26 06:02  4