Reve Image 1.0,一个生不逢时的AI模型

360影视 动漫周边 2025-04-05 21:17 1

摘要:对于这个工具,可能大家都是比较陌生的,Reve Image来自加利福尼亚的AI初创公司Reve AI,这是一款在提示词遵循度、美学表现和文字渲染方面表现出色的文本到图像生成模型,也是这个初创公司的第一个大模型产品。

最近一段时间,GPT-4o的原生多模态功能非常火,许多人开始用GPT-4o进行AI绘画。

不过,近期有一款非常强大的AI绘画模型被GPT-4o的光环所掩盖,这款工具就是Reve Image。

什么是Reve Image?

对于这个工具,可能大家都是比较陌生的,Reve Image来自加利福尼亚的AI初创公司Reve AI,这是一款在提示词遵循度、美学表现和文字渲染方面表现出色的文本到图像生成模型,也是这个初创公司的第一个大模型产品。

行业巨头Midjourney是类似于ChatGPT一样的这个大模型,相当于就是绘图领域的ChatGPT,是位于美国的一家AI公司的产品,普通人无法直接访问,且需要付费,因为reve image 1.0的横空出世,为我们提供了AI绘图的新的版本答案。

为什么要学习 Reve Image?

众所周知,现在的国产的大模型,诸如这个豆包,文心一言之类的,在文本处理上面还可以,但是遇到这种图像类的问题,这个生成的效果往往不尽如人意,给我们的体验感不是很好;

但是作为AI生图的大模型,Reve Image 1.0的文字渲染,颜色搭配,透视变化和文字理解能力都展现出不错的特性,能够满足用户的个性化需求,并且他的图像上面的文字的清晰度在业界里面都是遥遥领先的,有一说一,这个是我们的国产大模型无法比肩的;

首先我们看一下这个网站的主页:这个实际上是一个类似于gif的动态的页面风格,当你打开这个网站的时候,一股美学气息扑面而来,使用邮箱密码进行注册即可,因为是刚刚问世,所以这个目前是免费体验的,后面会不会收费,这个真的说不定。

下面的这个就是网站的素材库,内容还是很丰富的:

正确的使用方式

1.文案生图

和其他的这个大模型一样,这个AI绘图模型使用的也是一个常见的聊天框,而且位于这个页面的最下方,目的就是为了尽可能不遮挡生成的这个图片的效果,提升用户的体验感。

案例一

提示词:唐宋八大家,背景是古典书房有书卷和砚台,自然光线下人物面容沉稳,8K超清摄影质感,浅景深突显人物主体。

生成效果如下,可见还是存在一些问题的,首先,不可以有女性,其次,这个人物的数量可能有出入,但是整体的风格是没问题的:

提示词:国学大师,半身正面影像,身姿笔挺直面观者,背景为雅致的中式书斋,满架经史典籍与古朴笔洗、镇纸相伴。柔和的自然光自一侧倾洒,勾勒出他面庞轮廓,神色从容、目光深邃,尽显睿智与沉稳。画面以 8K 超高清摄影质感呈现,运用浅景深效果,虚化背景,周围不见任何旁人干扰,完整展现其一代大儒的独特气韵。

生成效果如下,这个时候就有点感觉了,这个生成的背景色和这种大师的气质感扑面而来:

案例三

提示词:王小波正对着镜头立身于简约书桌前,双手随意垂放在身侧,眼神带着思索与诙谐直视镜头,并未有丝毫闪躲。背景是一间充满旧时光气息的书房,木质书架上摆满各类书籍,有的书脊已经泛黄磨损,旁边放置着一台老式打字机。窗外透进暖黄的光线,映照出几缕悬浮的微尘。王小波身着宽松的棉质衬衫,领口微微敞开,搭配一条洗得有些发白的牛仔裤,衬衫袖口随意挽起。他留着标志性的清爽短发,面部以细腻笔触雕琢,带着一丝不羁的笑意,嘴角轻扬。背景运用写实且怀旧的色调晕染,营造出宁静又充满人文气息的氛围,画面采用中心构图突出他洒脱自在的独特气质。

生成效果如下,可以看到这个整体的风格是符合我们的描述要求的:

案例四提示词:清照正对镜头端立雕花轩窗前,双手持素绢词卷至胸前,眼眸含愁凝视镜头,不要低头,轻启朱唇,背景为宋代书斋陈设,博古架上置青铜香炉与汝窑梅瓶,窗外可见残荷摇曳的秋日池塘,人物梳高髻戴珍珠发冠配点翠发簪,身着月白交领襦裙外罩淡青纱质褙子,衣襟处绣银线缠枝纹,面部采用超写实技法刻画蹙眉凝思神态,背景运用绢本设色技法渲染秋意,画面采用对称构图突显人物端庄仪态。

生成效果如下,这个时候,你就会发现这个效果真的就非常的逼真了,普通的大模型绝对做不出来这个效果:

总结:可以发现,这个AI生图的效果,跟很多因素相关,我们需要尽可能的进行详细的描述,从第一个案例到第四个案例,我们就可以发现,描述的越详细,这个效果可能呢更久会更加符合我们的需求,从第一个唐宋八大家,到最后一个案例里面的李清照,不同的描述的效果,是显而易见的,当然,更多的是需要我们去使用,去体验。

在上面的这个过程里面,不知道大家是不是注意到了下面的这些参数:

1)第一项是我们的图片的纵横比,里面有很多的这个选项供我们进行调整。

2)4images表示的就是一次生成的图像的数量,这个也是可以调整的。

3)enhanceon就是对于我们的描述进行增强,生成更详细的文本,达到更好的效果。

4)auto就是种子按钮:用于选择是否使用之前生成图像的特定数字串来指导后续生成。

5)对于上面的这些内容,我们鼠标放上去就会看到对应的解释,我们可以对比前后的这个效果。

上传图片的话就是点击这个输入框里面的加号位置,这个时候我们的图片就会上传:

上传之后,我们选中这个图片,这个时候的聊天框就会出现下面的这个变化,弹出的提示就是:What would you like to change?

这个意思就是让我们想要对于上传的图片进行怎么样的修改,我们给出来这个对应的修改意见,模型就会根据我们的需求进行分析和对应的修改。

Reve Image最初上线时,确实是免费的,但由于这个模型太火热了,短时间涌进来一大批用户过来薅羊毛,导致他们的服务器成本增加。一般初创公司,也很难承受得住,因此趁现在,抓紧体验吧。

Reve Image 1.0的体验入口如下:

来源:程序员小灰

相关推荐