摘要:字节跳动旗下 AI 助手豆包近日升级文生图能力,支持一键生成指定文本。用户可以在生图提示词中加入文本要求。
文 |动点科技
作者|Steven Lee
排版|恩惠
本文预计阅读时长4分钟
字节跳动旗下 AI 助手豆包近日升级文生图能力,支持一键生成指定文本。用户可以在生图提示词中加入文本要求。
豆包大模型团队相关负责人表示,豆包文生图模型通过打通 LLM 和 DIT 构架,具备更好的原生中文数据学习能力,并在此基础上强化了汉字生成能力,大幅提升了生成效果。
图上加点字
简单来讲,这个新能力可以让你在 AI 生成的图片上加入指定文字。目前该功能已经在豆包 App 开启测试,豆包网页及电脑版也将在近期上线该能力。
我们尝试让豆包生成市中心商务区大楼照片,大楼上方有“动点科技”四个大字。一次性给出的四张图片基本都符合预期。
第二次尝试让它生成手持显示“动点科技”四个字的手机图片,结果中有一张的手指多了一只,且手部比例失调;另一张的右手有两个拇指……
第三次尝试我们不按常规套路来,要求文字:
帮我生成一张图,学校操场运动会,人满为患,主席台大屏幕上有“动点出海”四个大字,图片比例 16:9
晃眼一看,操场部分(包括人)挺像一张照片,但大屏幕上除了要求的大字外,还出现了 AI 想象的不明字体,且其中一张图背景墙上多出一个“点”字。
另外,这四张图并没有按比例要求生成。
总结
以往用 AI 生成图片只能作为案例参考或者以玩一玩的心态试试,如今 AI 生图可以在其中加入指定文字,这着实是一项值得肯定的功能提升。不过豆包的新技能还是欠些火候,我们在尝试中遇到了“不认识的汉字”以及部分违反常识的图片要素。
上面测试的图片形式,比较适合笔者的职业内容——比如有时需要给文章配图,用 AI 生成公司名称相关的展示图,再合适不过。
顺带一提,如果你对 AI 图片功能感兴趣,豆包此前上线了图片理解能力,可识别图片中包含的元素和基本特征。用户还可通过该功能询问某景点所处的位置或某个角色出自哪部影视作品。在试一试之前可以看看我们的体验文章。
- - - - - - - - END - - - - - - - -
精彩好文值得推荐!
一键转发,戳个在看!
来源:动点科技一点号