浙大哈佛

一个LoRA实现GPT-4o级图像编辑!浙大哈佛新模型冲上Hugging Face

随着Gemini、GPT-4o等商业大模型把基于文本的图像编辑这一任务再次推向高峰,获取更高质量的编辑数据用于训练、以及训练更大参数量的模型似乎成了提高图像编辑性能的唯一出路。然而浙大哈佛这个团队却反其道而行之,仅用以往工作0.1%的数据量(获取自公开数据集)

模型 浙大 哈佛 图像编辑 浙大哈佛 2025-05-08 12:57  9