虽然近两年AI技术已经越来越普及,但是视频网站的用户反而更加排斥AI生成的内容,“一眼AI,假”“举报AI”的评论随处可见。然而,在这么一个看起来“反常规”的赛道,冯彬用AI制作的《山海经》纪录片,却收获了大量好评。摘要:虽然近两年AI技术已经越来越普及,但是视频网站的用户反而更加排斥AI生成的内容,“一眼AI,假”“举报AI”的评论随处可见。然而,在这么一个看起来“反常规”的赛道,冯彬用AI制作的《山海经》纪录片,却收获了大量好评。
作者:周悦
封图:受访者供图
导读
壹 || 虽然目前国内外的AI生图工具还不能直接生成复杂的异兽,但可以大大提高制作效率。
贰 ||《山海经》纪录片借助AI工具,首集制作只用了8天。但是冯彬告诉经济观察报,实际过程并不如外界想象得那么简单。
叁 || 冯彬认为,目前国内的AI视频生成工具更可控、性价比更高,并且进化速度快。
肆 || 一位知识产权相关的法律专家告诉经济观察报,现行著作权制度以“人”的智力成果为衡量标准,对AI生成内容的规定还不够完备。
2023年底,39岁的冯彬决定离开互联网大厂,在即将不惑的年纪“疯狂”一把。
此时,他的个人视频账号“AI疯人院”已经建立1年,距离爆款《山海经》AI纪录片的问世,还有8个月。
虽然近两年AI技术已经越来越普及,但是视频网站的用户反而更加排斥AI生成的内容,“一眼AI,假”“举报AI”的评论随处可见。然而,在这么一个看起来“反常规”的赛道,冯彬用AI制作的《山海经》纪录片,却收获了大量好评。
1月17日,AI《山海经》系列第4集发布,当天冲上哔哩哔哩(B站)热门榜首。
截至2025年1月23日,总时长75分钟的《山海经》系列纪录片全网播放量近1亿,是目前全网播放量最高的由AI制作的纪录片之一。在抖音和视频号上,该纪录片的播放量均超3000万,成千上万网友“催更”。
许多《山海经》的爱好者留言:这就是想象中的山海世界、立刻做成3A游戏端上来。也有家长表示:终于能给小孩解释远古神兽了、孩子看了纪录片愿意读原著。
冯彬的“疯狂”没有落空,但他的选择也不是一时冲动。他曾在多家互联网游戏公司担任技术美术这一岗位,很早就接触到文生图、文生视频等AI工具,也是文生图应用Midjourney最早一批邀请入驻的体验者。
在《山海经》系列问世之前,冯彬已经通过多个AI生成视频作品崭露头角。2022年底,其暗黑十二生肖系列视频在抖音获得了2800万的播放量。只不过,当时技术还不够成熟,生成图片不够精细,AI视频只能勉强让神兽“动起来”,变形扭曲的情况时常发生,不能制作较长的内容。
2024年,AI图片及视频生成工具大爆发,Midjourney迭代至 V6版,国内外近20个公司发布AI视频应用。
对冯彬而言,实现儿时梦想,“复活”远古神兽的时机到了。
钻进几十本《山海经》
冯彬在账号后台收到大量的留言,有许多《山海经》爱好者的夸赞,也有很多人试图纠正错误,尤其是原文中大量的生僻字读音和部分知名神兽是否存在。
比如,有观众认为“亶爰(chányuán)山”应该读为(dǎnyuán)。冯彬找出两晋训诂学家郭璞注释中的“亶音蝉”解释。还有一些观众问他为什么不做鲲鹏、白泽等神兽,他表示,多个版本《山海经》的现存文字中并没有相关记载。《山海经》原本是一部有图有文的书,但原始古图及后代的配图大多遗失。仅在明清时代的部分作品中,还能零散地找到一些配图。在创作过程中,冯彬查阅了20个不同版本,着重参考了明代胡文焕、蒋应镐以及清代汪绂的图文版本。
冯彬家中的20多本《山海经》(周悦/摄)
他解释:“现代的插图很多都有艺术加工,来贴近现代人的想象,会夸张很多,而明清版本更简洁,更真实地还原古人对神兽的想象。”
以猼訑为例,原文中记载为“兽,其状如羊,九尾四耳,其目在背,佩之不畏”。在上述明清多位学者的版本里,其配图都和羊近似,有山羊胡须、羊角等。但是不同版本里有至少四五种不同形象,主要是毛发茂密程度不同,背上眼睛的排列方式不同。现代出版的版本里,在猼訑的四肢和耳朵上凭空增加了繁琐的装饰物。冯彬最后选择了大多数古图版本共有的形象,进行初始手绘制图。
冯彬以“四大凶兽”之一的穷奇为例,向经济观察报介绍了一个镜头完整的创作流程。《山海经》原文记载:“穷奇状如虎,有翼”“状如牛,蝟毛,音如嗥狗”。也就是说,穷奇的大小如牛、外形象虎、披有刺猬的毛皮、长有翅膀,叫声像狗。
穷奇设计图(受访者供图)
在创作时,他首先用ChatGPT进行头脑风暴,把原文扩展成一个充满细节的分镜脚本——穷奇在山上蛰伏、外部光线弱、发出嘶吼、有老虎形态等。
然后,他开始进行手绘,把老虎形象、鬃毛和肉刺等特征先画出,再上传到AI生图应用中,这一步叫“垫图”,能使得生成的图片更受控制,不至于严重变形。
为了让穷奇更具威严感,他在AI生成图片的基础上进行了大量手绘修正,比如增强鬃毛的层次,调整虎身的比例,突出肉刺的尖锐等细节,使其更符合观众对“凶兽”的期待。
穷奇的形象还相对更符合物理世界的规律,老虎的确是存在的生物。然而,《山海经》里大量异兽完全违背常理,比如龙身鸟首的山神、鱼身人面的赤鱬、三头六目的尚付等。这都是大模型训练时从未输入的数据,自然也不可能凭空输出,这时就需要冯彬一张张手绘、合成。
龙身鸟首山神设计图(受访者供图)
冯彬说:“虽然目前国内外的AI生图工具还不能直接生成复杂的异兽,但可以大大提高制作效率。比如1条鱼有10个翅膀,每个翅膀花纹都不同,用AI生成各种花纹,再合成到主图中,比一个个手绘节省近一半的时间。”
真实的AIGC创作
冯彬告诉经济观察报,他将这部影片定义为“AI纪录片”,而非“AI短剧”。一方面因为大量的细节都是经过缜密地考据,经得起观众推敲。
AI制作一个场景或一个神兽要生成上百张图片,冯彬再从中选择几张最优的进行手绘处理,然后用AI视频应用使之“动起来”。他的电脑里保存着超过10000张底稿图片以及几千段空镜、奇珍异兽的视频。这一制作体量能排进国内外AI创作者的第一梯队。
另一方面,他认为“剧”对故事情节和人物设定的要求更高,但《山海经》的文本并不适合这一表现形式。全文都是介绍性的文字,没有剧情,往往是从一座山系到另一座山系,以及其中的飞禽走兽、花草树木等,更像“人在画中游”的体验。
在创作《山海经》纪录片之初,冯彬曾考虑过用其他风格呈现,比如传统水墨画、《哪吒闹海》的彩绘风,或者线条感更强烈的二次元风,但最后还是选择了写实风格,他希望能做到类似《恐龙星球》的超写实感,“让观众能真切地感受到那个世界存在,或者至少曾经存在过”。“真实的不像AI做的”“博主在现场拍的吧”是这部纪录片最常见的弹幕。
在故事线的设计上,冯彬完全遵循原文中的顺序,用镜头语言进行自然过渡。
以第一集首幕为例,《山海经·南山一经》开篇的招摇山。首先以空镜展示俯瞰招摇山的全貌,承接招摇山内部特写镜头,展现其“多桂,多金玉”的特点。然后是山上独具特色的“状如韭而青华”的祝余草等植物,以及形似猕猴、直立行走的异兽狌狌。最后过渡到发源于招摇山的丽麂水,向西奔腾汇入大海。
制作这一幕时,冯彬强调了代入感:“就像导游一样,要规划出一条漫游路径,引领着观众游览。”此时创作者对AI生成提示词的控制至关重要,要逐步替换提示词,形成两个场景同时存在、衔接有序的情况。这种创作在前期阶段相当耗时。
例如,视频里先介绍招摇山上的桂树,然后通过一个穿过桂树的镜头来到金玉满堂的山洞里。这时需要推动镜头的表现方式,让观众代入自己正在逐步向前行动。如果是硬性切换或者闪回,会出戏。10秒的镜头要反复打磨至少1个小时。《山海经》纪录片借助AI工具,首集制作只用了8天。但是冯彬告诉经济观察报,实际过程并不如外界想象得那么简单,“完全交给AI是行不通的”。第一集约15分钟的内容包含200—300个镜头,70%的内容都经过手绘重置。大量的素材是在过去2—3年日积月累出来的。
冯彬向经济观察报展示了一部分神兽的初稿,比如“四大凶兽”、精卫、鹿蜀、九尾狐等都是在2023年至2024年初完成。他为奇珍异兽的草图分门别类建立了文件夹,等待着AI工具快速迭代“复活”它们的那一天。
青丘九尾狐设计图(受访者供图)
AI进化快 工作效率快速提升
从2022年起,冯彬开始接触国外AI文生图应用Midjourney,并且成为最早期版本邀请的开发者,从V2版本开始使用。但是那时模型能力有限,只能做出一些草图,无法生成视频。
他从2023年开始构思《山海经》系列,当时Midjourney扩大了模型训练数据,发展到V4和V5版本,能够较好地呈现原画中的构图、色彩关系、明暗色调等元素,也能保证风格统一。前述的初稿大部分是在这时完成。
当时国外也有一些AI生成视频应用,比如Runway和Pika,它们也开启了文生视频和图生视频的序章,但技术不成熟,存在一致性差、时长短、价格贵等问题。
2024年2月,OpenAI的文字生成视频模型——Sora首次面世,但直到12月Sora才正式上线。在近300天的空白期中,国内AI视频工具的爆发为冯彬《山海经》的视频化带来了机会。
据经济观察网不完全统计,2024年,国内外近20个公司发布AI视频产品,包括字节跳动、快手、阿里云、腾讯等大厂,以及Minimax、智谱、爱诗科技与生数科技等大模型初创公司。
在利用这些工具制作了几千个镜头后,他总结出来了一些经验:字节跳动的即梦擅长人物细节动作,快手的可灵擅长大画面、场景空镜和高分辨率,生数科技的Vidu更适合动画等风格化作品……组合起来能达到很好的效果。
图片生成视频这一过程被众多AI创作者形容为“抽卡”,凭运气获得一个质量过关的素材。随着模型能力不断升级,抽到好素材的概率已经大大提高,尤其是山川湖海等自然景观的空镜素材,几乎都能做到“3—5条内得到想要的画面”。
冯彬认为,目前国内的AI视频生成工具更可控、性价比更高,并且进化速度快。“2024年初,我用AI一周时间做出了4分钟的短片,如今一周时间能做出16分钟了,并且效果好上很多”。
冯彬对AI技术未来的发展趋势很乐观:“AI视频领域的迭代实在太快了,第二天醒过来无论更新什么能力,我都不会感到意外。”
在1月17日发布的第四集中,冯彬用AI制作了一段石碑拓印风格的“羽山往事”,讲述《山海经·南山二经》中的故事。上古时期,洪水肆虐,黄帝之孙鲧为了治水偷取天帝的息壤,导致天帝大怒,派火神祝融杀死了鲧。一条虬龙破体而出,正是子承父业治水的禹,鲧则化为黄能,潜入羽渊而去。
石碑拓印风格的鲧(受访者供图)
冯彬向经济观察报介绍了制作过程,前期先通过手绘制作适用于石碑拓印风格的底图素材,新更新的Midjourney V6版本中,生成石碑拓印风格已经十分稳定,能够很好地控制一致性。此外,可灵和即梦的大模型理解能力增强了,能更准确地根据语义描述,完成指定的镜头运动。
不过,在冯彬看来,市面上的AI视频工具仍有一些问题需要改进。
首先是AI不懂战斗、打斗等冲突性动作,比如“草原上猎豹捕食羚羊”“鸟吃虫”这种画面就很难通过AI生成。即便输入提示词或“垫图”,也只能得到猎豹和羚羊并排散步或者绕过去的视频。这可能是因为模型在训练时就剔除了一些暴力、血腥等场景数据。
在他看来,使用AI视频工具生成可用的打斗动作是专业人士必不可少的需求。以影视博主为例,甲方会要求角色进行打斗以及有战损状态,以增强视频的观赏性。如果AI不能生成,则需要通过复杂的建模和角色绑定,这无疑会大幅提高创作成本。
其次,AI视频工具在理解复杂事务时,仍会发生扭曲、变形。在制作猼訑这种有九条尾和四只耳朵、眼睛长在背上的神兽时,AI无法理解这种结构,会突然抹去一只眼睛或一条尾巴,或者把眼睛变成背上的盾牌,试图让其看起来正常。
商业化机会伴随知识产权难题
2024年8月,冯彬制作的AIGC《山海经》系列首集发布。
很快,网上就出现了类似的AI《山海经》视频,其文案、运镜构思等都非常相似,画面品质一般,却也收获了不少播放。有些用户会误认为那是冯彬的小号。三个月后,冯彬去深圳领取一个AI影像制作的金奖,颁奖的组委会成员也提到了这件事情。这让他感到很无奈。
不少人告诉冯彬,《山海经》这一IP的影响力太大了,几乎每一个中国人都知道《山海经》,一点火苗就能燃起观众们探索远古世界的好奇心。因此,在文旅及影视行业人士看来,这一系列作品的商业价值潜力巨大。
一些商业机构及地方文旅部门也与冯彬接洽,希望能够推进AI《山海经》作品的商业化。比如授权作品中一些经典神兽的形象,用来制作公仔、盲盒等周边产品,或是开放角色的设计图授权,用来制作游戏、影视作品甚至游乐园。
冯彬非常谨慎,暂时没有授权角色等商业化的打算。他认为,首先还是要把作品先完整地、高质量地呈现在观众面前。其次,现行的相关规定也存在一定的模糊地带,他需要对每一集、每一个角色及场景申请知识产权相关的保护,工作量较大。
一位知识产权相关的法律专家告诉经济观察报,现行著作权制度以“人”的智力成果为衡量标准,对AI生成内容的规定还不够完备。在法律上,生成内容能达到“独创性判断标准”,满足作品的可版权性要求,才能受到著作权法保护。创作者会容易产生纠纷,在起诉过程中,需要提供设计人物的呈现形式、设计提示词的顺序、设置相关参数等众多证据,来体现“作品”的独创特点。
除此之外,不少AI视频及图片模型使用的训练数据原本就侵犯了原作者著作权等相关权益。这让AI创作者维权先天就更难一些。以Midjourney为例,2024年1月,1.6万名英国艺术家联名,对Midjourney和其他人工智能公司发起集体诉讼。他们认为,Midjourney等工具在艺术家本人不知情的情况下,使用他们的作品对大模型进行训练,并生成与艺术家的原始作品非常相似的图像,这相当于“抄袭”。
在冯彬看来,现在最紧要的事情是打磨作品,并且把创作的过程留痕,至于商业化,他也已经在着手探索更多渠道。
2024年11月,冯彬受网易公司邀请,制作经典游戏《魔兽世界》与《暗黑破坏神:不朽》联动的宣传片,每一集时长2分钟左右,共4集,总收入在几十万元。
对方提供了脚本,并且要求必须体现游戏中8个角色,因此需要针对每个角色单独训练一个小模型,再绑定角色动作。这种限定性的商单要求较高,需要手绘、合成的素材较多。每一个角色都需要十几张底图,并且从不同方位拍摄角色图片。
如果采用过去游戏行业宣传视频的制作方式,每秒钟的制作价格高达上万元,角色等数字资产的价格则还要贵数倍。AI的出现在一定程度上改变了影视行业,减少了成本,提高了效率,也带来了新的收益。
此外,还有一些文旅、城市宣传及产品推广的工作也找到了冯彬。冯彬说,近两年短剧爆火,他也希望能够趁着热度在时代的浪潮中闯一闯,自己从小的电影导演梦也许能通过AI实现。
来源:经济观察报