摘要:谷歌的人工智能模型Gemini 2.5 Pro在经典视频游戏《宝可梦蓝版》中取得了重要进展,完成了游戏的挑战。谷歌首席执行官桑达尔·皮查伊对此表示兴奋,并指出Gemini获得了第5个徽章,而竞争对手Claude仅获得3个徽章。尽管如此,Joel Z,这位与谷歌
#头条精品计划#
谷歌的人工智能模型Gemini 2.5 Pro在经典视频游戏《宝可梦蓝版》中取得了重要进展,完成了游戏的挑战。谷歌首席执行官桑达尔·皮查伊对此表示兴奋,并指出Gemini获得了第5个徽章,而竞争对手Claude仅获得3个徽章。尽管如此,Joel Z,这位与谷歌无关的工程师,强调了Gemini与Claude之间的比较并不简单,因为两者使用了不同的工具和信息来源。Joel Z承认他在游戏过程中提供了一些开发干预,但他否认这属于作弊,并表示这些干预只是改善了Gemini的决策能力。此外,他指出,Gemini的开发仍在继续,项目框架也在不断演变,表明人工智能在游戏领域的潜力和进步。
谷歌最先进的人工智能模型已在超过一款29年的视频游戏中取得了重要里程碑。昨晚,谷歌首席执行官桑达尔·皮查伊在X平台上表达了他的激动之情,称:“真是个精彩的结局!Gemini 2.5 Pro刚刚完成了《宝可梦蓝版》!”值得注意的是,Gemini Plays Pokémon的直播是由一位名叫Joel Z的30岁软件工程师发起的,他与谷歌并无关联。然而,谷歌高管在这段旅程中一直支持他的倡议。
谷歌AI工作室的产品负责人洛根·基尔帕特里克上个月分享道,Gemini在完成《宝可梦》的过程中“取得了重大进展”,并已“获得了第5个徽章”,而次优模型仅持有3个徽章,尽管使用的是不同的代理工具。这使得皮查伊幽默地评论道:“我们正在开发API,人工宝可梦智能 :)”之所以专注于《宝可梦》,源于人工智能社区中的一种趋势。今年2月,Anthropic报告称,其Claude AI模型在《宝可梦红版》中取得了进展,展示了Claude的“扩展思维和代理训练”如何提升其在意想不到的任务中的表现,例如玩经典视频游戏。
尽管取得了进展,Claude尚未征服《宝可梦红版》。这引发了一个问题:Gemini在游戏中是否优于Claude?在他的Twitch频道上,Joel Z告诫观众不要将这一成就视为大型语言模型(LLM)游戏能力的最终衡量标准。他强调,直接比较具有误导性,因为Gemini和Claude使用了不同的工具,并获取了不同的信息。这两种人工智能模型都需要借助辅助工具来导航游戏,这一过程由之前提到的代理工具来实现。这些工具为模型提供了增强了额外上下文的游戏截图,使得人工智能能够确定其行动,包括召唤专门的代理来执行命令。
Joel Z承认,还有其他“开发干预措施”帮助Gemini完成游戏,但他坚决表示这并不等同于作弊。“我的干预改善了Gemini的整体决策和推理能力,”他解释道。“我并没有提供具体提示——没有针对特定挑战(如月亮山)的攻略或直接指令。”他提供的唯一帮助是告知Gemini需要与一名火箭小弟互动两次以获取升降钥匙,这在《宝可梦黄版》中是一个后来修正的错误。此外,他指出,“Gemini Plays Pokémon仍在积极开发中,框架也在不断演变,”突显了该项目的持续进展。
来源:老孙科技前沿