谷歌的Gemini击败了宝可梦蓝版（稍有助力）

摘要：谷歌的人工智能模型Gemini 2.5 Pro在经典视频游戏《宝可梦蓝版》中取得了重要进展，完成了游戏的挑战。谷歌首席执行官桑达尔·皮查伊对此表示兴奋，并指出Gemini获得了第5个徽章，而竞争对手Claude仅获得3个徽章。尽管如此，Joel Z，这位与谷歌

#头条精品计划#

谷歌的人工智能模型Gemini 2.5 Pro在经典视频游戏《宝可梦蓝版》中取得了重要进展，完成了游戏的挑战。谷歌首席执行官桑达尔·皮查伊对此表示兴奋，并指出Gemini获得了第5个徽章，而竞争对手Claude仅获得3个徽章。尽管如此，Joel Z，这位与谷歌无关的工程师，强调了Gemini与Claude之间的比较并不简单，因为两者使用了不同的工具和信息来源。Joel Z承认他在游戏过程中提供了一些开发干预，但他否认这属于作弊，并表示这些干预只是改善了Gemini的决策能力。此外，他指出，Gemini的开发仍在继续，项目框架也在不断演变，表明人工智能在游戏领域的潜力和进步。

谷歌最先进的人工智能模型已在超过一款29年的视频游戏中取得了重要里程碑。昨晚，谷歌首席执行官桑达尔·皮查伊在X平台上表达了他的激动之情，称：“真是个精彩的结局！Gemini 2.5 Pro刚刚完成了《宝可梦蓝版》！”值得注意的是，Gemini Plays Pokémon的直播是由一位名叫Joel Z的30岁软件工程师发起的，他与谷歌并无关联。然而，谷歌高管在这段旅程中一直支持他的倡议。

谷歌AI工作室的产品负责人洛根·基尔帕特里克上个月分享道，Gemini在完成《宝可梦》的过程中“取得了重大进展”，并已“获得了第5个徽章”，而次优模型仅持有3个徽章，尽管使用的是不同的代理工具。这使得皮查伊幽默地评论道：“我们正在开发API，人工宝可梦智能 :)”之所以专注于《宝可梦》，源于人工智能社区中的一种趋势。今年2月，Anthropic报告称，其Claude AI模型在《宝可梦红版》中取得了进展，展示了Claude的“扩展思维和代理训练”如何提升其在意想不到的任务中的表现，例如玩经典视频游戏。

尽管取得了进展，Claude尚未征服《宝可梦红版》。这引发了一个问题：Gemini在游戏中是否优于Claude？在他的Twitch频道上，Joel Z告诫观众不要将这一成就视为大型语言模型（LLM）游戏能力的最终衡量标准。他强调，直接比较具有误导性，因为Gemini和Claude使用了不同的工具，并获取了不同的信息。这两种人工智能模型都需要借助辅助工具来导航游戏，这一过程由之前提到的代理工具来实现。这些工具为模型提供了增强了额外上下文的游戏截图，使得人工智能能够确定其行动，包括召唤专门的代理来执行命令。

Joel Z承认，还有其他“开发干预措施”帮助Gemini完成游戏，但他坚决表示这并不等同于作弊。“我的干预改善了Gemini的整体决策和推理能力，”他解释道。“我并没有提供具体提示——没有针对特定挑战（如月亮山）的攻略或直接指令。”他提供的唯一帮助是告知Gemini需要与一名火箭小弟互动两次以获取升降钥匙，这在《宝可梦黄版》中是一个后来修正的错误。此外，他指出，“Gemini Plays Pokémon仍在积极开发中，框架也在不断演变，”突显了该项目的持续进展。

来源：老孙科技前沿

标签： gemini 谷歌 claude 宝可梦 joel

本文地址：https://news.43u.com.cn/a/1424832.html

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!