AI 能比我们更好地理解情绪吗？生成式 AI 在情商测试中胜过人类

摘要：人工智能（AI）是否能够在情绪激动的情况下建议适当的行为？来自日内瓦大学（UNIGE）和伯尔尼大学（UniBE）的一个团队使用通常为人类设计的情商（EI）评估对包括 ChatGPT 在内的六种生成式 AI 进行了测试。结果：这些 AI 的性能优

人工智能（AI）是否能够在情绪激动的情况下建议适当的行为？来自日内瓦大学（UNIGE）和伯尔尼大学（UniBE）的一个团队使用通常为人类设计的情商（EI）评估对包括 ChatGPT 在内的六种生成式 AI 进行了测试。结果：这些 AI 的性能优于人类的平均性能，甚至能够在创纪录的时间内生成新的测试。这些发现为 AI 在教育、辅导和冲突管理方面开辟了新的可能性。该研究发表在《传播心理学》上。

大型语言模型（LLM）是能够处理、解释和生成人类语言的人工智能（AI）系统。例如，ChatGPT 生成式 AI 就是基于这种类型的模型。LLM 可以回答问题并解决复杂的问题。但它们也可以暗示情商行为吗？

这些结果为人工智能在被认为为人类保留的环境中使用铺平了道路。

情绪激动的场景

为了找出答案，来自 UniBE、心理学研究所和 UNIGE 瑞士情感科学中心（CISA）的一个团队对六个 LLM（ChatGPT-4、ChatGPT-o1、Gemini 1.5 Flash、Copilot 365、Claude 3.5 Haiku 和 DeepSeek V3）进行了情商测试。“我们选择了研究和企业环境中常用的五种测试。它们涉及充满情绪的场景，旨在评估理解、调节和管理情绪的能力，“UniBE心理研究所人格心理学、差异心理学和评估部的讲师兼首席研究员、该研究的主要作者Katja Schlegel说。

例如：Michael 的一位同事窃取了他的想法，并受到了不公平的祝贺。Michael 最有效的反应是什么？

a）与涉事同事争论

b）与他的上司讨论情况

c）默默地怨恨他的同事

d）偷回一个想法

在这里，选项 b）被认为是最合适的。

同时，对人类参与者进行了相同的五项测试。“最终，LLM 获得了显着更高的分数——82% 的正确答案，而人类为 56%。这表明这些 AI 不仅理解情绪，而且掌握情商行为的意义，”参与这项研究的 UNIGE 瑞士情感科学中心（CISA）高级科学家 Marcello Mortillaro 解释说。

在创纪录的时间内进行新测试

在第二阶段，科学家们要求 ChatGPT-4 创建具有新场景的新情商测试。然后，这些自动生成的测试由 400 多名参与者进行。“事实证明，它们与花了数年时间开发的原始测试一样可靠、清晰和现实，”Katja Schlegel 解释说。“因此，LLM 不仅能够在各种可用选项中找到最佳答案，而且还能够生成适应所需环境的新场景。这强化了这样一种观点，即 ChatGPT 等 LLM 具有情感知识并且可以推理情绪，”Marcello Mortilaro 补充道。

这些结果为人工智能在被认为为人类保留的环境中使用铺平了道路，例如教育、辅导或冲突管理，前提是它由专家使用和监督。

期刊参考：

来源：人工智能学家

标签：情绪 llm 情商 cisa 伯尔尼大学

本文地址：https://news.43u.com.cn/a/1738131.html

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!