图像编辑

当AI同时精通“看”与“画”:阿里巴巴团队多模态AI模型的惊人进展

在人工智能领域,有两类模型一直沿着不同的轨道发展:一类擅长"理解"图像和文字,就像一个能看懂图片并回答问题的智能助手;另一类则擅长"创造"图像,就像一位根据文字描述作画的数字艺术家。直到最近,这两种能力很少能在同一个AI系统中完美共存。这正是阿里巴巴集团联合多

模型 模态 数据集 阿里巴巴 图像编辑 2025-05-12 21:03  2

一个LoRA实现GPT-4o级图像编辑!浙大哈佛新模型冲上Hugging Face

随着Gemini、GPT-4o等商业大模型把基于文本的图像编辑这一任务再次推向高峰,获取更高质量的编辑数据用于训练、以及训练更大参数量的模型似乎成了提高图像编辑性能的唯一出路。然而浙大哈佛这个团队却反其道而行之,仅用以往工作0.1%的数据量(获取自公开数据集)

模型 浙大 哈佛 图像编辑 浙大哈佛 2025-05-08 12:57  3

图层式记忆:让AI图像编辑如魔法般简单直观

当你使用手机或电脑修图时,是否曾经遇到过这样的情况:你想在一张森林照片中依次添加一个乐高小人、一辆吉普车,再放一只小狗,但每次添加新元素时,前面添加的内容却变得奇怪或者完全消失了?韩国首尔国立大学的研究团队最近解决了这个令人头痛的问题,他们在2025年5月发表

记忆 魔法 图像编辑 首尔国立大学 ai图像编辑 2025-05-06 20:14  3

AI日报:Kimi全新音频基础模型Kimi-Audio;阶跃星辰开源图像编辑模型Step1X-Edit;夸克AI超级框上线 “拍照问夸克”

Moonshot AI最近推出的Kimi-Audio是一款开源音频基础模型,旨在推动音频理解、生成和交互技术的发展。该模型基于Qwen2.5-7B架构,结合Whisper技术,支持多种音频任务,如语音识别和音频问答。凭借超过13亿小时的多样化音频数据训练,Ki

模型 开源 夸克 图像编辑 kimi 2025-04-28 01:07  6

集体照拍摄避坑指南,确保拍出所有参与者的最佳状态

无论是工作中还是生活中,集体照作为记录美好瞬间的重要方式,承载着无数的回忆与情感。然而,一个不容忽视的问题是,几乎每一张集体照中,总有那么一两位成员或是闭眼、或是表情管理失控,为完美的照片留下遗憾。本文旨在深入探讨这一现象背后的原因,并提出五项专业级的集体照拍

图像编辑 连拍 相机参数 黄金分割法 参与者 2025-04-13 08:54  6

手机12g运存和16g运存差距明显吗?不同使用场景下的性能差异深度

在当今智能手机性能日益强大的时代,运行内存(RAM)作为衡量手机多任务处理能力和应用响应速度的重要指标,越来越受到消费者的关注。尤其是12GB与16GB这两个运存规格,它们在不同使用场景下的表现差异,成为许多用户在选择手机时的重要考量因素。本文将深入探讨这两种

软件 手机 多任务处理 内存 图像编辑 2025-03-24 19:53  7

图片太大不能上传怎么压缩变小?5招教你轻松压缩变小

图片太大不能上传怎么压缩变小?在数字化时代,图片已成为我们日常生活和工作中不可或缺的一部分。无论是分享生活点滴,还是展示工作成果,图片都是最直观、最生动的表达方式。然而,有时候我们会遇到这样一个问题:图片太大,无法上传。这种情况常常让人感到棘手。尤其是在一些对

图片 优速 界面 图像编辑 输入框 2025-03-14 13:01  10