摘要:3月26日,OpenAI 正在 ChatGPT 中直接引入图像生成功能。在其旗舰多模态模型 GPT-4o 的支持下,该聊天机器人现在可以直接从聊天界面创建视觉效果。
3月26日,OpenAI 正在 ChatGPT 中直接引入图像生成功能。在其旗舰多模态模型 GPT-4o 的支持下,该聊天机器人现在可以直接从聊天界面创建视觉效果。
该功能最初将向 ChatGPT Plus、Pro、Team 和免费用户开放。企业和教育级用户将很快获得访问权限。
OpenAI 首席执行官 Sam Altman 在周二的视频直播开始时表示:今天,我们推出了有史以来最有趣、最酷的产品之一……ChatGPT 中的原生图像。
Altman 承认,该功能备受期待——尤其是因为Google Gemini等竞争对手自 2024 年中期以来就已提供集成图像生成功能。
ChatGPT 现在允许用户根据提示、对话和上传的文件生成图像。用户可以创建全新的图像或转换现有图像。
OpenAI 表示,经过训练到GPT-4o 模型中的世界知识使 ChatGPT 能够更好地理解图像的使用环境。
OpenAI 表示,它还能更好地按照提示在图像中呈现文本。
用户可以通过用自然语言提示模型来优化图像。例如,在设计视频游戏角色时,模型可以在用户进行调整时在多次迭代中保持视觉一致性。
OpenAI 表示,它希望人们使用该工具来制作需要精确的工作相关视觉效果(例如图表、信息图表、品牌内容)、文字较多的图像(说明海报、名片)、具有精确灯光和纹理的逼真图像以及受益于对话背景的视觉效果。
OpenAI 通过使用处理所有图像生成任务的单一多模式模型来简化流程,将 ChatGPT 定位为个人和专业图像生成的首选工具。
来源:鞭牛士