OpenAI 发布更新版 GPT-4o 模型夺回聊天机器人基准测试头名

摘要：今天，OpenAI 宣布了改进后的 GPT-4o 模型，并进行了一些显著的改进。最新的 GPT-4o 模型改进了创意写作能力，可以提供更自然、更吸引人、更有针对性的写作，并具有更好的相关性和可读性。 OpenAI 还声称，这个新模型能更好地处理上传的文件，提

今天，OpenAI 宣布了改进后的 GPT-4o 模型，并进行了一些显著的改进。最新的 GPT-4o 模型改进了创意写作能力，可以提供更自然、更吸引人、更有针对性的写作，并具有更好的相关性和可读性。 OpenAI 还声称，这个新模型能更好地处理上传的文件，提供更深入的见解和更全面的回复。

全球的 ChatGPT 用户已经可以使用这种新模式。对于开发人员来说，新的 GPT-4o 型号有以下名称：

GPT-4O-2024-11-20 (API)

chatgpt-4o-latest (API)

上述两个模型仍然具有 128000 个词元的上下文窗口、16384 个最大输出词元以及截至 2023 年 10 月的训练数据。

凭借这个新模型，OpenAI 还夺回了众包人工智能基准测试开放平台 Chatbot Arena 的第一名。过去一周，ChatGPT-4o（20241120）作为"匿名聊天机器人"在聊天机器人竞技场进行了测试，并收集了约 8000+ 张社区选票。

根据排名，ChatGPT-4o (20241120) 超过了上周刚刚发布的Gemini-Exp-1114模型，得分1361。根据社区评分，最新的 GPT-4o 在创意写作方面取得了显著的进步；其得分从 1365 分上升到了 1402 分。总排名变化如下。

总成绩： #2 → #1

整体（StyleCtrl）： #2 → #1

创意写作： #2 → #1

编码： #2 → #1

数学 #4 → #3

硬提示： #2 → #1

OpenAI 更新的 GPT-4o 模型标志着他们从之前的 o1 系列的转变，该系列侧重于逻辑推理。 GPT-4o 优先考虑创意写作，这表明 OpenAI 致力于探索人工智能模型的各种能力。这与业界目前对数学和编码的关注相比，是一个令人耳目一新的变化。

来源：cnBeta一点号

标签：聊天机器人 openai 基准测试

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!