摘要:IT之家不是这谣言的创造者,而是二手屎的搬运工,《商业内幕》的相关新闻稿是 Lakshmi Varanasi 撰写的Why AI chatbots hallucinate, according to OpenAI researchers,该作者在新闻稿开头就吹
具体情况是,这问题引用的来自 IT 之家的新闻 以讹传讹 、玩标题党吸引眼球。OpenAI 研究人员并没有自称已“破解”大语言模型的“幻觉”难题。
IT之家不是这谣言的创造者,而是二手屎的搬运工,《商业内幕》的相关新闻稿是 Lakshmi Varanasi 撰写的 Why AI chatbots hallucinate, according to OpenAI researchers ,该作者在新闻稿开头就吹嘘道:
OpenAI researchers claim they've cracked one of the biggest obstacles to large language model performance — hallucinations.该作者列出的新闻稿要点是:
OpenAI 研究人员表示,他们找到了大语言模型产生幻觉的原因。 当模型自信地生成不准确信息并将其当作事实时,就会产生幻觉。 OpenAI 研究人员在一篇论文中说,重新设计评估指标可以防止模型猜测。实际上,八字还没有一撇。OpenAI 未回应《商业内幕》的置评请求。
“目前广泛使用的基于准确率的评估需要更新”云云属于泛泛而谈,这也轮不到 OpenAI 研究人员第一个说。以“准确率”作为唯一的评估标准当然是不够的,而且,大语言模型的准确率不可能在有限的成本下达到 100%. “标准的训练和评估程序奖励猜测而不奖励承认不确定性的行为”只能为一部分幻觉负责,训练集包含的错误、训练过程中发生的错误之类跟大语言模型在聊天时承不承认不确定性无关。已经有多个团队尝试让大语言模型在结果不确定的时候说“我不确定”,幻觉并没有消失。
OpenAI 的相关文章:
https:// openai.com/index/why-la nguage-models-hallucinate/
这文章说得就没有新闻稿那么“确定”,例如:
Hallucinations persist partly because current evaluation methods set the wrong incentives. While evaluations themselves do not directly cause hallucinations, most evaluations measure model performance in a way that encourages guessing rather than honesty about uncertainty.幻觉持续存在的 部分 原因是当前的评价方法设置了错误的激励。尽管评价方法本身不会直接导致幻觉, 大多数 评价方法以鼓励猜测而不是诚实表达不确定性的方式来衡量模型的性能。
文章作者举例说,询问某人的生日、模型不知道答案的时候,随便猜个“9 月 10 日”有 1/365 的概率答对,拒绝回答则有 0% 的概率答对。在大量这类场景影响下训练出来的大模型就倾向于在不知道答案的时候猜测。
做过答错不但不得分还额外扣分、不答不得分的试卷的读者大概已经笑了。文章作者也承认这种惩罚猜测行为的方法是已经存在的,他认为这还不够。评价方法应当抑制猜测行为。
这里有个好玩的人类幻觉:在谈论 1/365 的时候,显然,文章作者忘了闰年,还忘记了更多影响人类行为的要素。 假设人的出生日期是完全随机分布的,随便猜个日期有约 1/365.2422 的概率答对。实际上,人的出生日期还受到季节、社会文化等影响,基于统计的大语言模型很可能不会均匀猜测,从而让正确率高于 1/365. 大语言模型应当有能力将上述情况讲给不知道应该怎么问的用户,例如回答“我不知道你问的那个人的生日,如果要猜测,我会猜测八月到九月的某一天来得到稍微高一点的成功率,你想知道为什么吗”,但是大模型聊天服务的提供者未必有动机耗费资源如此做。文章作者进而讨论了大语言模型发生的高度具体的事实性错误与数据模式有关,在预训练学习过程中,陈述往往缺少对/错的标签,而且标签无法彻底防止涉及随机性的数据(例如宠物的生日)出错。最后,文章作者承认准确率永远无法达到 100%,因为无论模型大小、搜索和推理能力如何,有些现实问题本质上就是无法回答的。不过,文章作者坚持认为大语言模型的幻觉不是不可避免的,因为大语言模型可以在不确定的时候拒绝回答——我认为这没什么实际意义。大语言模型可以先谈及不确定性再给出推测性回答,可以行为艺术式地对一切问题声称如果外部世界存在且像我所学习的资料显示的那样那么我推测XX、我并不确定外部世界存在、而且用户你也确定不了。
来源:晚晚的星河日记一点号