浙大哈佛资讯

冲上HuggingFace榜第二，仅次Qwen3！浙大哈佛「全能LoRA」杀疯了

探索了大型预训练扩散Transformer（如FLUX）的编辑能力，并引入了一种新颖的上下文编辑范式，该范式能够实现有效的指令图像编辑，而无需修改模型架构或进行大量微调。

随着Gemini、GPT-4o等商业大模型把基于文本的图像编辑这一任务再次推向高峰，获取更高质量的编辑数据用于训练、以及训练更大参数量的模型似乎成了提高图像编辑性能的唯一出路。然而浙大哈佛这个团队却反其道而行之，仅用以往工作0.1%的数据量（获取自公开数据集）