图像编辑基准

GPT-4o-Image仅完成28.9%任务!上海AI实验室等发布图像编辑基准

现有的图像编辑评测基准是否已经无法跟上时代的步伐?仅仅停留在“更换颜色”等改变物体表层属性的测试,是否已显得过于简单,无法真正衡量AI的“深度理解”能力?当指令变得更加复杂,涉及图片背后的逻辑、上下文关联甚至隐含意图时,现有模型能否正确“领会”并精准执行,同时

实验室 上海 图像编辑 闭源 图像编辑基准 2025-05-30 14:57  3