图像编辑资讯

通义千问发布200亿参数图像生成模型Qwen-Image，中文文本渲染领先

近日，通义千问宣布了一项重大进展，正式推出了其首个开源图像生成基础模型——Qwen-Image。该模型基于MMDiT架构，拥有惊人的200亿参数，标志着通义千问在图像生成领域迈出了坚实的一步。

中文模型图像海报设计图像编辑 2025-08-05 14:07 3

Qwen新开源，把AI生图里的文字SOTA拉爆了

通义模型家族，刚刚又双叒开源了，这次是Qwen-Image——一个200亿参数、采用MMDiT架构的图像生成模型。

开源图像编辑 qwen sota 文字sota 2025-08-05 13:33 3

通义千问首个文生图模型开源：破解AI图像生成“写字”难题，复杂中英文渲染效果惊艳

8月5日，通义千问官方宣布开源一个20B的MMDiT模型Qwen-Image，这是通义千问系列中的首个图像生成基础模型，在复杂文本渲染和精确图像编辑方面进展显著。

模型开源图像文生图像编辑 2025-08-05 08:05 3

阿里通义千问开源全新文生图模型Qwen-Image

通义千问系列首次开源了一款名为Qwen-Image的20亿参数多模态扩散变换器（MMDiT）图像生成基础模型。这一创新成果不仅在复杂文本渲染和精确图像编辑方面取得了突破性进展，更是在多个公开基准测试中展现了卓越性能，成为图像生成与编辑领域的新星。

模型开源文生图像编辑 gedit 2025-08-05 08:12 3

阿里通义千问首个图像生成基础模型Qwen-Image开源

阿里通义千问团队今日宣布开源Qwen-Image，这是一个 20B 的 MMDiT 模型，也是通义千问系列中首个图像生成基础模型，其在复杂文本渲染和精确图像编辑方面取得了显著进展。

模型开源图像图像编辑通云 2025-08-05 06:49 3

豆包“一句话P图”升级了：可一键替换原有文字

豆包宣布，APP智能修图全新升级，基于最新图像编辑模型SeedEdit 3.0，支持更多P图玩法。

动漫豆包图像编辑油画 p图 2025-06-10 15:56 8

南方科技大学团队：如何实现可编辑物体组合？

对于那些喜欢编辑图像的人来说，将一个物体自然地放入背景场景中一直是个难题。想象一下，你手中有一张可爱柯基犬的照片，希望将它放在客厅沙发上，但总是效果不佳：要么柯基看起来像"贴"上去的贴纸，要么角度不对，要么狗狗的毛色和特征都变了。这正是南方科技大学林剑满、李昊

组合科技大学图像编辑南方科技大学林亮 2025-06-09 15:45 10

高考第一天，用豆包修图3.0花式「整活」送祝福，已原地笑翻！

豆包的一句话P图功能，又进化了！各种高考祝福、网络梗图、大片级精修、设计师草稿，无不是信手拈来。此刻，AI P图再次迎来降维打击，只要用自然语言，就能实现精准的图片编辑。可以说，AI修图终于来到了3.0时代！

高考修图豆包图像编辑豆包修图 2025-06-07 16:02 9

GPT-4o-Image仅完成28.9%任务！上海AI实验室等发布图像编辑基准

现有的图像编辑评测基准是否已经无法跟上时代的步伐？仅仅停留在“更换颜色”等改变物体表层属性的测试，是否已显得过于简单，无法真正衡量AI的“深度理解”能力？当指令变得更加复杂，涉及图片背后的逻辑、上下文关联甚至隐含意图时，现有模型能否正确“领会”并精准执行，同时

实验室上海图像编辑闭源图像编辑基准 2025-05-30 14:57 6

自媒体入门学习指南：如何从零起步

随着数字时代的迅速发展，自媒体已成为人们获取信息、分享视角、甚至实现个人品牌化的重要渠道。如果你想要深入学习自媒体，掌握从基础到进阶的各项技能，需要明确学习路径，并逐步构建自己的内容生态。本文将为你提供从零开始学习自媒体的起步方法，帮助你在这个充满潜力的领域找

学习自媒体 seo 图像编辑搜索引擎优化 2025-05-28 21:24 8

可直接投产？AI生成的3D服装模型来啦

迪士尼经典反派电影《黑白魔女库伊拉》中的“浴火红裙”桥段令人印象深刻。一根火柴烧掉了平淡无奇的白色斗篷后，露出了惊艳的红色长裙。或许，许多服装人，在很多纠结的时刻，都想拥有这样一根“魔法火柴”吧.....

模型服装图像编辑高斯联想研究院 2025-05-28 18:14 11

字节把GPT-4o级图像生成能力开源了！

不止于此，其最新融合的多模态模型BAGEL主打一个“大一统”，将带图推理、图像编辑、3D生成等功能全都集中到了一个模型。

模态开源字节图像图像编辑 2025-05-24 15:35 8

小模型逆袭屠榜！30倍数据效率+13倍模型压缩效果暴增近10%！

亮点直击新发现：旨在解决由编辑指令与原始-编辑图像对之间错位引起的噪声监督问题，这是先前工作忽视的根本性问题，如下图2所示。修正监督：利用扩散生成先验指导视觉语言模型，为原始-编辑图像对生成更匹配的编辑指令。强化监督：引入基于三元组损失的对比监督，使编辑模型能

模型文生图像编辑 vlm 先验 2025-05-17 01:03 10

当AI同时精通“看”与“画”：阿里巴巴团队多模态AI模型的惊人进展

在人工智能领域，有两类模型一直沿着不同的轨道发展：一类擅长"理解"图像和文字，就像一个能看懂图片并回答问题的智能助手；另一类则擅长"创造"图像，就像一位根据文字描述作画的数字艺术家。直到最近，这两种能力很少能在同一个AI系统中完美共存。这正是阿里巴巴集团联合多

模型模态数据集阿里巴巴图像编辑 2025-05-12 21:03 10

感受「言出法随」的图像编辑，HiDream-E1-Full 现已上线模力方舟

图像编辑模型HiDream-E1-Full现已上线模力方舟 AI 模型广场，访问以下链接立即在线体验：https://ai.gitee.com/serverless-api?model=HiDream-E1-Full

模态开源 transformer llama 图像编辑 2025-05-12 16:38 12

开源全能图像模型媲美GPT-4o！解决扩散模型误差累计问题

开源的MLLMs和扩散模型已经过大规模预训练，其从零开始训练统一任务，不如取长补短，将MLLMs的语言建模能力，与扩散模型的像素级图像建模能力，进行有机的结合。

模型开源图像图像编辑 token 2025-05-12 08:41 12

一个LoRA实现GPT-4o级图像编辑！浙大哈佛新模型冲上Hugging Face

随着Gemini、GPT-4o等商业大模型把基于文本的图像编辑这一任务再次推向高峰，获取更高质量的编辑数据用于训练、以及训练更大参数量的模型似乎成了提高图像编辑性能的唯一出路。然而浙大哈佛这个团队却反其道而行之，仅用以往工作0.1%的数据量（获取自公开数据集）

模型浙大哈佛图像编辑浙大哈佛 2025-05-08 12:57 11

图层式记忆：让AI图像编辑如魔法般简单直观

当你使用手机或电脑修图时，是否曾经遇到过这样的情况：你想在一张森林照片中依次添加一个乐高小人、一辆吉普车，再放一只小狗，但每次添加新元素时，前面添加的内容却变得奇怪或者完全消失了？韩国首尔国立大学的研究团队最近解决了这个令人头痛的问题，他们在2025年5月发表

记忆魔法图像编辑首尔国立大学 ai图像编辑 2025-05-06 20:14 11

字节开源SuperEdit图像编辑方法，AI的P图水平如何？

字节的ByteDance Intelligent Creation (USA) 团队开源了SuperEdit项目，帮助AI提升P图水平，项目包含数据和模型。（所以直男没救了吗？）

开源字节图像编辑 p图 superedit 2025-05-06 15:40 12

AI日报：Kimi全新音频基础模型Kimi-Audio；阶跃星辰开源图像编辑模型Step1X-Edit；夸克AI超级框上线 “拍照问夸克”

Moonshot AI最近推出的Kimi-Audio是一款开源音频基础模型，旨在推动音频理解、生成和交互技术的发展。该模型基于Qwen2.5-7B架构，结合Whisper技术，支持多种音频任务，如语音识别和音频问答。凭借超过13亿小时的多样化音频数据训练，Ki

模型开源夸克图像编辑 kimi 2025-04-28 01:07 13