摘要:对于这个工具,可能大家都是比较陌生的,Reve Image来自加利福尼亚的AI初创公司Reve AI,这是一款在提示词遵循度、美学表现和文字渲染方面表现出色的文本到图像生成模型,也是这个初创公司的第一个大模型产品。
最近一段时间,GPT-4o的原生多模态功能非常火,许多人开始用GPT-4o进行AI绘画。
不过,近期有一款非常强大的AI绘画模型被GPT-4o的光环所掩盖,这款工具就是Reve Image。
什么是Reve Image?
对于这个工具,可能大家都是比较陌生的,Reve Image来自加利福尼亚的AI初创公司Reve AI,这是一款在提示词遵循度、美学表现和文字渲染方面表现出色的文本到图像生成模型,也是这个初创公司的第一个大模型产品。
行业巨头Midjourney是类似于ChatGPT一样的这个大模型,相当于就是绘图领域的ChatGPT,是位于美国的一家AI公司的产品,普通人无法直接访问,且需要付费,因为reve image 1.0的横空出世,为我们提供了AI绘图的新的版本答案。
为什么要学习 Reve Image?
众所周知,现在的国产的大模型,诸如这个豆包,文心一言之类的,在文本处理上面还可以,但是遇到这种图像类的问题,这个生成的效果往往不尽如人意,给我们的体验感不是很好;
但是作为AI生图的大模型,Reve Image 1.0的文字渲染,颜色搭配,透视变化和文字理解能力都展现出不错的特性,能够满足用户的个性化需求,并且他的图像上面的文字的清晰度在业界里面都是遥遥领先的,有一说一,这个是我们的国产大模型无法比肩的;
首先我们看一下这个网站的主页:这个实际上是一个类似于gif的动态的页面风格,当你打开这个网站的时候,一股美学气息扑面而来,使用邮箱密码进行注册即可,因为是刚刚问世,所以这个目前是免费体验的,后面会不会收费,这个真的说不定。
下面的这个就是网站的素材库,内容还是很丰富的:
正确的使用方式
1.文案生图
和其他的这个大模型一样,这个AI绘图模型使用的也是一个常见的聊天框,而且位于这个页面的最下方,目的就是为了尽可能不遮挡生成的这个图片的效果,提升用户的体验感。
案例一
提示词:唐宋八大家,背景是古典书房有书卷和砚台,自然光线下人物面容沉稳,8K超清摄影质感,浅景深突显人物主体。
生成效果如下,可见还是存在一些问题的,首先,不可以有女性,其次,这个人物的数量可能有出入,但是整体的风格是没问题的:
提示词:国学大师,半身正面影像,身姿笔挺直面观者,背景为雅致的中式书斋,满架经史典籍与古朴笔洗、镇纸相伴。柔和的自然光自一侧倾洒,勾勒出他面庞轮廓,神色从容、目光深邃,尽显睿智与沉稳。画面以 8K 超高清摄影质感呈现,运用浅景深效果,虚化背景,周围不见任何旁人干扰,完整展现其一代大儒的独特气韵。
生成效果如下,这个时候就有点感觉了,这个生成的背景色和这种大师的气质感扑面而来:
提示词:王小波正对着镜头立身于简约书桌前,双手随意垂放在身侧,眼神带着思索与诙谐直视镜头,并未有丝毫闪躲。背景是一间充满旧时光气息的书房,木质书架上摆满各类书籍,有的书脊已经泛黄磨损,旁边放置着一台老式打字机。窗外透进暖黄的光线,映照出几缕悬浮的微尘。王小波身着宽松的棉质衬衫,领口微微敞开,搭配一条洗得有些发白的牛仔裤,衬衫袖口随意挽起。他留着标志性的清爽短发,面部以细腻笔触雕琢,带着一丝不羁的笑意,嘴角轻扬。背景运用写实且怀旧的色调晕染,营造出宁静又充满人文气息的氛围,画面采用中心构图突出他洒脱自在的独特气质。
生成效果如下,可以看到这个整体的风格是符合我们的描述要求的:
生成效果如下,这个时候,你就会发现这个效果真的就非常的逼真了,普通的大模型绝对做不出来这个效果:
总结:可以发现,这个AI生图的效果,跟很多因素相关,我们需要尽可能的进行详细的描述,从第一个案例到第四个案例,我们就可以发现,描述的越详细,这个效果可能呢更久会更加符合我们的需求,从第一个唐宋八大家,到最后一个案例里面的李清照,不同的描述的效果,是显而易见的,当然,更多的是需要我们去使用,去体验。
在上面的这个过程里面,不知道大家是不是注意到了下面的这些参数:
1)第一项是我们的图片的纵横比,里面有很多的这个选项供我们进行调整。
2)4images表示的就是一次生成的图像的数量,这个也是可以调整的。
3)enhanceon就是对于我们的描述进行增强,生成更详细的文本,达到更好的效果。
4)auto就是种子按钮:用于选择是否使用之前生成图像的特定数字串来指导后续生成。
5)对于上面的这些内容,我们鼠标放上去就会看到对应的解释,我们可以对比前后的这个效果。
上传图片的话就是点击这个输入框里面的加号位置,这个时候我们的图片就会上传:
上传之后,我们选中这个图片,这个时候的聊天框就会出现下面的这个变化,弹出的提示就是:What would you like to change?
这个意思就是让我们想要对于上传的图片进行怎么样的修改,我们给出来这个对应的修改意见,模型就会根据我们的需求进行分析和对应的修改。
Reve Image最初上线时,确实是免费的,但由于这个模型太火热了,短时间涌进来一大批用户过来薅羊毛,导致他们的服务器成本增加。一般初创公司,也很难承受得住,因此趁现在,抓紧体验吧。
Reve Image 1.0的体验入口如下:
来源:程序员小灰