ChatGPT 为何避而不谈大卫·梅耶尔:史翠珊效应与机器遗忘

摘要:上周, 发生了与一个名为大卫·梅耶尔(David Mayer)的人相关的奇怪而有趣的新闻。说的是ChatGPT用户遇到了一个令人不解的现象,当用户的问题中涉及“大卫·梅耶尔(David Mayer)”时,这个流行的聊天机器人就会出现故障。无论用户如何努力,聊天

原创:科技哲思 科技世代千高原

上周, 发生了与一个名为大卫·梅耶尔(David Mayer)的人相关的奇怪而有趣的新闻。说的是ChatGPT用户遇到了一个令人不解的现象,当用户的问题中涉及“大卫·梅耶尔(David Mayer)”时,这个流行的聊天机器人就会出现故障。无论用户如何努力,聊天机器人都无法说出他的名字。相反,它要么在句子中间卡住,要么声称“出了点问题”,要么干脆拒绝回应。

大卫·梅耶尔是谁?

这让互联网陷入了猜测的漩涡:大卫·梅耶尔是谁,为什么 ChatGPT 对他视而不见?一时间各种阴谋论纷纷出笼,甚至有人联想大卫·梅耶尔可能是某个神秘家族的重要成员。

更让人们觉得好奇的是,除了David Mayer,遇到Brian Hood、Jonathan Turley、Jonathan Zittrain、David Faber 和 Guido Scorza等名字时,也会使它的回应发生崩溃。有些用户琢磨再三,猜测其中潜在的原因可能是这些名字属于某些公众人物或半公众人物,这些人可能依据被遗忘权要求搜索引擎或 AI 模型“忘记”某些信息。


沿着这一思路,有人像模像样地编排起一系列貌似合理的故事。以Brian Hood为例,它可能是澳大利亚一位市长的名字,2023年时曾经让他的律师联系OPENAI,指责ChatGPT 错误地将他描述为几十年前的一个犯罪的实施者,而事实上,是它举报的这一犯罪行为。后来,他告诉媒体,ChatGPT在版本更新后删除了“违规内容”。而Jonathan Turley可能是一位律师和福克斯新闻评论员,他在 2023 年底曾经遭遇“恶作剧”——一个虚假的 911 电话让武装警察来到他家。Jonathan Zittrain 是一个四处谈论“被遗忘权”的法律专家和意见领袖。David Faber可能是 CNBC的一位资深记者的名字。Guido Scorza是意大利数据保护局的董事会成员。


至于大卫·梅耶尔 (David Mayer)是谁,一时间涌现出各种解释,从平淡无奇到荒诞不经。有人认为,梅耶尔可能只是一个普通人,但他通过法律途径行使了“被遗忘权”——根据英国和欧盟的个人数据保护方面的法律,人们有权要求在网上删除自己的个人数据。另外一些人则喜欢诉诸阴谋论,怀疑他是否是位有权势的人,甚至可能是著名的梅耶尔·德·罗斯柴尔德家族的成员。但大卫·梅耶尔·德·罗斯柴尔德很快驳斥了这种说法,称这是无稽之谈,并与整个事件划清界限。


还有人有鼻子有眼地指出,他可能是一位戏剧与历史方面的教授,专门研究维多利亚晚期与早期电影之间的联系。虽然此人已于 2023 年夏天去世(享年 94 岁),但在他辞世前几年里,由于一名通缉犯以他的名字作为化名,这位英裔美国学者深受由网络搜索导致的法律问题的困扰,甚至无法出门旅行。在生命的最后岁月,他不得不竭力使自己的名字与那位独臂恐怖分子的化名区分开来。


由此,一个合理的推测是由于这些人的强烈申诉,迫使大模型服务提供者做出了相应的处理。无论是出于法律、安全、隐私还是其他考虑,这些姓名可能都受到特殊规则的约束。就像候选人等敏感人物的姓名和身份一样,基于大模型的聊天机器人遇到这些名字时可能会对其响应做出更改。这些更改有的是有明文规则的,如在政策上规定:本模型不会预测任何候选人的选举结果。但大多数情况下,大模型不会明确提示其政策,而是在用户的提问触发特殊规则时,以引发错误等无效回应或终止回应的方式呈现。


在受到大量包括阴谋论在内的各种质疑之后,ChatGPT 的开发商OpenAI 于12月3日证实,此事与GDPR 或个人请求无关,该问题是由于“David Mayer”这个名字被内部隐私工具错误地标记而造成的“故障”。 OpenAI在一份声明中表示,“在某些情况下,ChatGPT 不会提供有关人们的某些信息以保护他们的隐私”。同时,他们也不会提供有关工具或流程的更多细节。


透过这一大模型时代的小花絮有很多问题值得进一步的讨论和思考。在此只简单地谈两个方面。

史翠珊效应

一是所谓史翠珊效应(Streisand effect)。这个效应之所以以美国歌手兼演员芭芭拉·史翠珊的名字命名,原因在于20多年前网络热潮兴起时(2003年)的一起网络事件。2003 年,美国歌手兼演员芭芭拉.史翠珊起诉摄影师肯尼斯.阿德尔曼和图片网站Pictopia.com侵犯隐私,索赔 5000 万美元。该诉讼试图从阿德尔曼主持的加州海岸记录项目(该项目包含的 12,000 张加州海岸线照片)中删除其中一张可以看到史翠珊豪宅的航拍照片(“图像3850”)。由于该项目的目标是记录海岸侵蚀以影响政府决策者,因此房主的隐私问题被认为无关紧要或不重要。该诉讼被驳回,史翠珊被责令支付阿德尔曼 177,000 美元的律师费。


虽然照片的拍摄者无意专门披露史翠珊的豪宅,但这一诉讼发生后,反而引起了人们对这张之前不为人知的照片的更多关注。这种效应体现了人们在社会层面的心理抗拒,一旦人们意识到某些信息被隐瞒,他们就会更有意愿去获取和传播这些信息。也就是说,一些人试图隐藏信息的举动反而使寻找和传播这些信息变得更有趣。简言之,史翠珊效应是指试图隐藏、删除或审查信息可能导致的一种意外后果是这种努力反而激发和增进了人们对这些信息的认识。

机器遗忘


二是生成式人工智能时代的机器遗忘问题。不论大模型采取什么样的内部隐私工具,其目的不外乎删除某些特定的信息/数据并消除其可能影响。它们应该与大模型(LLM)出于法律、伦理的原因而实施的价值对齐类似并互为补充,目的都是对训练后的大模型做出进一步矫正或指导。


从技术层面讲,LLM是通过从堪称“全数据”的海量网络数据集中提取知识而训练出来的,一旦 LLM 训练完成,在涉及知识产权和个人数据保护需要遗忘某些特定数据和信息时,就会出现一个技术问题:如何让模型“忘记”某些信息或数据并消除这些数据的影响。为了解决这一问题,近年来出现了一种被称为Machine Unlearning——“机器遗忘”或“机器反学习”的新技术。简单地讲,机器遗忘的目标大致可分为二种:撤销访问和模型矫正。


所谓撤销访问,即对个人隐私敏感数据和受版权保护的数据的机器遗忘。但这对生成式人工智能而言无疑是一项挑战。在理想的情况下,由于大模型在训练中使用的海量数据集中数据大多可能是未经许可的,似乎可以通过“机器遗忘”将这些“借用”的数据“归还”给其所有者。在实践中,最常见的“机器遗忘”是方法根据隐私保护和版权保护的具体需求,在删除了需要遗忘的特定数据后,对基础模型进行重新训练。从成本上讲,这种重新训练只能是定期的。而实际上,保持其竞争力和更新速度,许多模型提供商已经这样做了。


当然,从市场的角度来看,完全可以引入数据市场机制,使数据所有者得到适当的补偿,以消除相关权力诉求。这就好比,如果你在餐厅因为坐错位置等误会吃了谁谁谁(比方说你的爱豆)的芝士蛋糕,一般情况下,他/她宁愿你付钱或归还等价的东西(补偿),而不至于要求你呕吐到进食前的状态(机器遗忘)。


所谓模型矫正,主要针对模型训练中存在毒性、偏见、陈旧/危险知识的删除和遗忘。一方面涉及消除不良内容在训练中产生的影响,另一方面涉及对调动这些不良内容的使用者的不良动机的捕捉。与撤销访问不同,模型矫正的要求相对宽容一些,其所追求的是构建和部署“足够安全”的模型。为达到这一目的而进行的机器遗忘属于大模型训练后的安全风险缓解机制,因此更多的属于近似的机器遗忘而非精确的机器遗忘。


从技术上讲,传统的机器学习方法侧重于增加或强化知识,并且没有简单的机制让模型“忘记”某些东西。而从数据集中删除某些敏感数据再重新训练大模型既昂贵又耗时,在许多情况下是不可行的。因此,大多数机器遗忘或机器反学习是在不对大模型进行重新训练的情况下的进行的。其目的是有效地最小化目标数据点的影响,力图将需要机器遗忘的数据的影响最小化到可接受的水平。根据一项在Meta 的 Llama2–7b模型上得到验证的研究表明,通过机器反学习可以让该模型“忘记”《哈利波特》系列中的叙事细节,但仍保持其在已知 LLM 基准上执行任务的能力,保持其整体质量。


关于机器遗忘技术层面有大量的研究,提出了多种方案和基准。从方法论和认识论层面来讲,还有很多问题有待深入探究。这些问题包括机器遗忘的元认知问题、生成式人工智能的知识建构与无知建构等。通过对这些问题的研究,有助于推进当下兴起的人类与机器的相互学习等通用人工智能(或通用认知工具意义上的人工智能)发展的新进路。

来源:人工智能学家

相关推荐