AI 能比我们更好地理解情绪吗?生成式 AI 在情商测试中胜过人类

360影视 欧美动漫 2025-05-23 16:35 3

摘要:人工智能 (AI) 是否能够在情绪激动的情况下建议适当的行为?来自日内瓦大学 (UNIGE) 和伯尔尼大学 (UniBE) 的一个团队使用通常为人类设计的情商 (EI) 评估对包括 ChatGPT 在内的六种生成式 AI 进行了测试。结果:这些 AI 的性能优

人工智能 (AI) 是否能够在情绪激动的情况下建议适当的行为?来自日内瓦大学 (UNIGE) 和伯尔尼大学 (UniBE) 的一个团队使用通常为人类设计的情商 (EI) 评估对包括 ChatGPT 在内的六种生成式 AI 进行了测试。结果:这些 AI 的性能优于人类的平均性能,甚至能够在创纪录的时间内生成新的测试。这些发现为 AI 在教育、辅导和冲突管理方面开辟了新的可能性。该研究发表在《传播心理学》上。

大型语言模型 (LLM) 是能够处理、解释和生成人类语言的人工智能 (AI) 系统。例如,ChatGPT 生成式 AI 就是基于这种类型的模型。LLM 可以回答问题并解决复杂的问题。但它们也可以暗示情商行为吗?

这些结果为人工智能在被认为为人类保留的环境中使用铺平了道路。

情绪激动的场景

为了找出答案,来自 UniBE、心理学研究所和 UNIGE 瑞士情感科学中心 (CISA) 的一个团队对六个 LLM(ChatGPT-4、ChatGPT-o1、Gemini 1.5 Flash、Copilot 365、Claude 3.5 Haiku 和 DeepSeek V3)进行了情商测试。“我们选择了研究和企业环境中常用的五种测试。它们涉及充满情绪的场景,旨在评估理解、调节和管理情绪的能力,“UniBE心理研究所人格心理学、差异心理学和评估部的讲师兼首席研究员、该研究的主要作者Katja Schlegel说。

例如:Michael 的一位同事窃取了他的想法,并受到了不公平的祝贺。Michael 最有效的反应是什么?

a) 与涉事同事争论

b) 与他的上司讨论情况

c) 默默地怨恨他的同事

d) 偷回一个想法

在这里,选项 b) 被认为是最合适的。

同时,对人类参与者进行了相同的五项测试。“最终,LLM 获得了显着更高的分数——82% 的正确答案,而人类为 56%。这表明这些 AI 不仅理解情绪,而且掌握情商行为的意义,”参与这项研究的 UNIGE 瑞士情感科学中心 (CISA) 高级科学家 Marcello Mortillaro 解释说。

在创纪录的时间内进行新测试

在第二阶段,科学家们要求 ChatGPT-4 创建具有新场景的新情商测试。然后,这些自动生成的测试由 400 多名参与者进行。“事实证明,它们与花了数年时间开发的原始测试一样可靠、清晰和现实,”Katja Schlegel 解释说。“因此,LLM 不仅能够在各种可用选项中找到最佳答案,而且还能够生成适应所需环境的新场景。这强化了这样一种观点,即 ChatGPT 等 LLM 具有情感知识并且可以推理情绪,”Marcello Mortilaro 补充道。

这些结果为人工智能在被认为为人类保留的环境中使用铺平了道路,例如教育、辅导或冲突管理,前提是它由专家使用和监督。

期刊参考

来源:人工智能学家

相关推荐