AI美女图成了过去式,“巨物宝可梦”才是新的流量密码

摘要:最关键的是,这个视频来自国人,也是我一直以来在AI领域的两位偶像:

大数据文摘受权转载自数字生命卡兹克

作者:卡兹克

这两天,X上一个贼可爱的视频爆火了。

截止到我发文,100w的播放,1.5w的赞。

最关键的是,这个视频来自国人,也是我一直以来在AI领域的两位偶像:

海辛和阿文。

直接放一下这个视频。

作为一个老任死忠粉,又是从红蓝宝石就开始入坑的骨灰级宝可梦玩家,看到这个视频的一瞬间,心里的某根弦就动了。

按那句话说,就是打在了我的心趴上。

最核心的是,海辛和阿文还做了一系列,也都在圈里疯狂刷屏。

“一觉醒来,罗马塌了。

罗马虽然不是一天建成的,但可以一天塌掉!”

我太太太太太太太喜欢了。

而且数据也非常好看。

一夜之间,模仿者也开始涌现。

因为效果太好,很多朋友,都在在疯狂的问是怎么做的。

所以,在征得海辛和阿文的同意和授权后,我就来,给大家拆解一下,这个视频的做法。

其实蛮简单的。

就是先出图,然后图生视频。

视频部分反而是最简单的,图生视频谁好用谁,海辛这个质量很明显的就是可灵1.6,上周我也发过可灵1.6的评测,在图生视频领域现在就是断层式的领先。

最核心的其实是最开始的图片部分,要让图片融合的天衣无缝栩栩如生,还要保证主体和场景的一致性,才能达到完美的效果。

所以,图片部分,要祭出的是上周Google更新的一个很有趣的AI绘图产品:

Whisk。

网址在此:https://labs.google/fx/zh/tools/whisk

虽然它上手极度简单,小白也是有手就行上手就会,但是效果却好的令人发指。

使用逻辑非常简单,给主体、场景、风格,然后Whisk就能给你完美的拼合在一起。

比如我们想做一个跟海辛类似的,一个皮卡丘抱着埃菲尔铁塔。

你只需要找到皮卡丘和埃菲尔铁塔的图,然后传上去。最后样式风格空着就行。

写一句贼简单的Prompt:

巨大的皮卡丘抱着埃尔菲铁塔。

然后点击生成,大概只需要十几秒钟,一张贼可爱的图,就诞生了。

就是这么迅速。。。

就是这么无脑。。。

海辛还做过更多的例子。

真的,酷毙了好嘛。

而且Whisk最屌的点是,它并没有用图片参考,而是把这些图,用大模型Gemini 2的能力,硬生生转成Prompt,再用Google的AI绘图产品Imagen3,硬生生的直接生成。

比如我给朋友做的这个图。

上面有一段超长的Prompt。

而我给的原图是这样的:

只能说一句,Google的硬实力却是还是太猛了。。。

不用参考图,就能把一致性保持的这么好,这要是到时候原生多模态的Gemini 2上了还得了。。。

不过如果直接把Whisk出的图拿过来直接用,其实效果也还达不到海辛和阿文的那种级别。

因为,AI的图,总归是有些瑕疵和细节缺失。

比如文章一开始的那个视频,卡比兽还有一个之前的版本,Whisk直出的图是这样的:

一个对细节要求不那么高的人,可能会觉得已经很好了。

但是阿文觉得不行。

于是,他直接扔到PS里,扣了很多细节,调了颜色、调了光影、调了构图,特别是还加了一些大气透视和云层,让这个卡比兽,更有巨物感,更写实。

效果直接立竿见影,瞬间真实可信多了。

这,就是职业玩家,和普通人的区别。

也所以,才有了最开始视频的,大爆特爆。

这真的,就是专业者和创意者,最好的时代。前路AI已经为你尽情铺好,而你,只需要肆意挥洒你的灵感就行。

而后一步,图生视频,就非常简单了,直接无脑可灵1.6的图生视频。

我也找海辛和阿文把他们两个图生视频的prompt给要来了,供大家参考(其实很简单,说明白你的想法就行)

Prompt:巨大的卡比兽,把一碗雪倒扣在富士山上,富士山瞬间被雪覆盖。

Prompt:巨大的可达鸭在斗兽场上熟睡并打呼,肚皮缓慢起伏,马路上的车在行驶,突然斗兽场塌了,冒出滚滚沙尘,可达鸭突然惊恐地睁大眼睛。

最终,配上音效,就成了一段创意极佳、制作精良的超级有趣的短视频。

AI+专业者+超棒的想法,等于真正的好内容。

而这,才是我认为的,真正的流量密码。

所以,流量的尽头从来不是跟风,而是创造。

创造让人眼前一亮的世界,创造能引发情感共鸣的瞬间,创造属于你自己的语言和故事。

AI只是助力。

而内容,才是永恒的灵魂。

租售GPU算力

特别适合企业级应用

来源:大数据文摘一点号

相关推荐