AIGC驱动下的视听产业范式重构:逻辑、路径与挑战

360影视 日韩动漫 2025-05-25 09:09 2

摘要:作为新质生产力的代表,人工智能技术的快速发展,尤其是大模型的爆发式出现,引起了社会的广泛关注。AIGC(AI Generated Content,人工智能生成内容)作为生成式AI(Generative AI)在内容创作领域的具体应用,不仅带来了新的内容形态(即

作为新质生产力的代表,人工智能技术的快速发展,尤其是大模型的爆发式出现,引起了社会的广泛关注。AIGC(AI Generated Content,人工智能生成内容)作为生成式AI(Generative AI)在内容创作领域的具体应用,不仅带来了新的内容形态(即AI生成的内容),也是继PGC(专业生产内容)和UGC(用户生产内容)之后的内容生产方式革新,同时也映射出其背后自动化生成技术集群的演进趋势。因此,无论从内容形态、生产方式还是技术支撑体系来看,AIGC都在推动视听产业发生系统性变革。在经历了从传统视听产业到网络视听产业的数字化、网络化转型之后,视听产业正在迈向智能视听产业的发展新时期。正如习近平总书记所强调,人工智能是新一轮科技革命和产业变革的重要驱动力量,将对全球经济社会发展和人类文明进步产生深远影响。在此背景下,深入剖析AIGC驱动视听产业变革的内在逻辑、实施路径及其面临的挑战,对于智能视听产业的高质量发展具有重要意义。

一、AIGC驱动视听产业变革的动力演变

AIGC是通过深度学习、自然语言处理(NLP)及多模态生成技术,自动生成文字、图片、声音、视频等多模态内容的新型生产方式,也被认为是继PGC、UGC之后具有颠覆性的内容生产方式。AIGC的技术演进可以追溯到20世纪50年代人工智能发展的早期,当时基于简单生成模型已经可以实现基础音乐创作,但直至2014年生成对抗网络(GAN)的提出解决了图像生成的对抗性优化问题,才真正突破了技术瓶颈,迎来了AIGC技术的爆发式增长。2017年,微软“小冰”推出世界首部完全由AI创作的诗集《阳光失了玻璃窗》;2018年,英伟达发布StyleGAN,将图像生成的质量提升至接近人类视觉真实度的水平;2021年,OpenAI发布文生图模型Dall-E,首次实现文本到图像的跨模态精准生成;2022年,大语言模型ChatGPT的发布引发全球关注,是人工智能技术文本生成能力的重要转折点;2024年,文生视频模型Sora问世,成为AIGC在视频生成领域的重要里程碑;2025年初,DeepSeek模型通过大规模参数量和多模态对齐技术,进一步提升了人工智能生成内容的复杂性和可控性,引发全球关注。

中国的AIGC市场也呈现爆发式增长。据预测,中国AIGC市场规模2024年达到436亿元,2030年有望突破1.14万亿元。互联网巨头均已布局AIGC赛道,推出面向内容生产的智能产品和工具,例如文心一言、通义千问、豆包、Kimi等。截至2024年11月,我国共有309个生成式AI产品完成备案。AIGC的应用也日益广泛,渗透至传媒、影视、教育、电商、医疗、交通等多个行业。在视听产业中,aigc涉及剧本分镜生成、视频特效制作、广告素材生产、虚拟拍摄、海报生成等场景。

二、AIGC驱动视听产业变革的基本逻辑

(一)技术逻辑:数据—算力—算法的三元驱动

AIGC驱动视听产业变革的核心动力在于数据、算力和算法的协同进化。大数据是人工智能的基础,是AIGC模型训练的必备素材。对于视听产业而言,高质量和多模态的数据集对于多模态模型的生成能力提升至关重要,对用户偏好及行为的捕捉能力也会更加精准。算力则犹如工业文明时代的电力一样,是AIGC的“基础设施”,GPU集群和专用AI芯片等使得大模型训练成为可能,促使多模态内容的生成能力更加优秀。据统计,随着大模型的快速发展,70%的大模型训练和95%的推理任务都依赖于算力。为应对算力需求的激增,2023年10月,工业和信息化部等六部门联合发布的《算力基础设施高质量发展行动计划》提出,到2025年我国算力规模将超过300EFLOPS,智能算力占比达到35%,从而为各行业的数字化转型夯实“算力底座”,也将为视听产业的影视渲染、特效制作等高算力场景提供强大支持。算法则是AIGC生成能力突破的关键,算法的不断优化促使AIGC能够跨越文本、图像、音频、视频等多种形态,生成更加高清、逼真和自然的内容。

(二)资本逻辑:资本与平台的深度共生

AIGC驱动视听产业变革的动力不仅来自技术突破,更与资本的介入密不可分,这是因为大模型研发、算力部署等都需要极高的成本投入,因此资本的支持无疑是AIGC驱动视听产业变革落地的支撑性力量。同时,生成式AI所展现出的巨大创新潜力也在吸引资本力量的涌入,从而推动AI与资本的深度融合。据统计,2023年,全球生成式AI投融资规模达252亿美元,约为2022年的9倍;2024年上半年,全球金额最大的十笔融资事件中有6笔为大模型企业融资,金额达135亿美元。国内AI投融资市场同样非常活跃,2024年人工智能行业融资数量为696起,融资规模为1052.51亿元。其中,AIGC子行业融资数量为111起,规模达315.84亿元,仅次于AI行业应用(机器人、自动驾驶等),位列第二,显示出资本对人工智能生成内容赛道的青睐。

当前,AI与资本的一体化趋势在头部互联网平台(字节跳动、阿里、腾讯等)的发展中表现得尤为突出。作为掌握内容、数据、大模型、算法等核心资源的主体,平台巨头在技术的加持下不断拓展生产空间,并把生产空间、消费空间、社会空间和生活空间紧密串联在一起,形成了完整的“技术—生态—商业”闭环。因此,互联网平台不仅可以实质性推动AIGC技术的突破,还能将其整合至视听产业的内容生产、分发和消费环节。比如,阿里旗下“通义万相”视频生成模型2.1版本,不仅将影视分镜的生成效率大大提升,还在处理复杂运动、还原真实物理规律、提升电影质感等方面表现更加优异。此外,腾讯智影、快手的可灵AI等,都可以帮助内容生产者实现内容自动生产或进行自动剪辑、特效添加等,不仅降低了创作门槛也加速了创意到产品的转化,从而为视听产业的发展注入了新的动力。

(三)市场逻辑:用户需求驱动与技术适配的平衡

AIGC驱动视听产业变革既源于技术和资本的协同推进,更源于用户需求的深刻变革。随着场景时代的到来,加之短视频、互动视频、虚拟偶像等数字化场景的涌现和快速发展,用户对视听内容的沉浸感、互动性、场景化、跨文化等方面的需求也更加多样且增长迅速。然而,以往PGC、PUGC、UGC的生产模式由于受到专业人才、设备成本、时间空间、场景设计等因素的约束,虽然算法推荐提升了匹配效率,但仍然难以满足用户对实时交互、动态内容、沉浸体验等深层次的需求。而AIGC的突破性正是在于对用户需求的精准响应,以其自动化、高效率、低成本、精准化等特征,通过多模态适配和互动性、沉浸式的体验来满足用户的需求。

(四)政策逻辑:制度保障与规范引导

AIGC驱动视听产业变革的进程,本质上也是技术突破与政策引导合力的结果。政策逻辑通过“战略规划—生态培育—伦理规范”等布局,为AIGC构建有力的制度保障。

2017年发布的《新一代人工智能发展规划》明确了我国人工智能发展的战略目标,为后续构建政策体系提供了清晰指引。2019年和2021年,我国分别发布《新一代人工智能治理原则——发展负责任的人工智能》《新一代人工智能伦理规范》,明确了人工智能治理的原则和伦理规范。2023年,《生成式AI服务管理暂行办法》发布,提出积极推进生成式AI技术的创新发展与规范应用,建立安全评估、算法备案和投诉举报等制度。除此之外,《中华人民共和国网络安全法》《中华人民共和国数据安全法》《中华人民共和国个人信息保护法》等法律,以及地方政府推出的对AIGC的扶持政策,也从不同维度对人工智能的健康发展提供了规范引导和安全保障。可以看出,这些法律和政策相互呼应、相互支撑,为AIGC的发展及在各行业的落地应用提供了有力的制度保障。

三、生态重构:AIGC驱动视听产业变革的路径

(一)生产链:人机协同范式的形成

1.生成式AI:新的行动元

在视听内容生产过程中,人工智能不仅以智能助手的角色参与到录音转文字、写稿、视频剪辑、视频字幕生成、视频集锦、视频拆条等任务当中,也开始独立完全自动生成作品。比如,爱奇艺“奇声影视剧智能配音系统”已经为超过300部海外电影制作了普通话配音版本,为50多部华语电影、800多集国产剧制作了多国配音版本;中央广播电视总台出品的《中国神话》被视为国内首部AI全流程微短剧,其美术设计、分镜生成、视频合成、配音、配乐全部由AI完成,是AI技术影视化应用的一次先锋实践,也标志着AI从工具性存在向创作主体的跃迁。

从行动者网络理论来看,人工智能的主体性跃迁说明它正在以“新的非人类行动元”介入视听内容的生产和传播当中,大模型、新闻机器人、社交机器人、AI数字人等智能体都是其化身,它与其他行动者之间必然会通过“转译—协商—再定位”来构建新型生产关系。因此,内容生产实践活动将变得更为复杂和动态化。比如,AI编剧可能并行生成多个剧本供决策选择,这种“创作涌现”会颠覆以往的线性生产流程,同时也意味着AI能够将人类的创作经验进行数字化存储和重组。从理想的发展趋势来看,AI与人类可以通过任务分工来实现优势互补,AI善于处理大量数据和执行重复任务,而人类更擅于提出创意、情感交流和复杂的决策,在不断协商互动中形成人机协同的内容生产新模式。

2.垂直大模型:智能视听生产的底层支撑

在生成式AI快速发展的背景下,不少影视公司和媒体组织正在通过开发行业垂直大模型来实现技术具身化的突破,比如中央广播电视总台的央视听媒体大模型、湖南广电的芒果TV大模型等。2024年2月,中国首部文生视频AI动画片《千秋诗颂》在央视综合频道播出,该作品依托央视听大模型,实现了诗词的古典意境与水墨动画的深度耦合。目前,央视听大模型已经嵌入节目创作、短视频生成、AIGC动画、节目剪辑等领域。芒果TV大模型也已正式通过中央网信办生成式人工智能(大语言模型)备案审核。

在通用大模型激烈竞争的背景下,媒体和影视公司为什么还要推出自研的大模型,其对于视听产业的独特价值在哪里?其一,最突出的优势是专有数据的训练与深度挖掘。长期以来视听产业积累了大量专业化、质量高、安全可信的视听数据资源。比如,中国音像资料馆作为全球最大的中文音像语料库,其所有视听资料已经实现标签化。这为模型训练提供了独特优势,使得大模型更能深入理解行业的运作规律,研发训练具有中国文化特色的视听大模型。其二,具有独特的场景优势。无论是新闻和其他类型的节目,还是影视作品,适配的场景都是内生的需求,大模型依托行业的高质量数据和视听制作经验可以提供更多具有创意的垂直场景。比如,《千秋诗颂》所呈现的古诗词意境和独特的中国传统水墨画文化,这种场景适配所达成的共振会大大增强作品的感染力。其三,对文化价值观的主动建构。广电影视行业长期以来秉持文化作品社会效益优先的基本原则,可以在大模型设计中嵌入文化安全、价值观校准、敏感词词库等模块,确保AI生成的内容符合主流价值观,形成更加可控、可管、可信的具有文化主体性的智能生产范式。

3.AI数字人:情感计算驱动的新生产范式

在内容生产中,AI数字人以其独特的形象和运行逻辑正在对生产范式进行变革。比如,阿里大文娱数字人“厘里”在优酷《盒子里的猫》中担任虚拟嘉宾,以其独特的个性与风格成为一个具有吸引力的角色;芒果TV推出的AI导演“爱芒”可以评估剧本并提出修改意见、自动生成视频,还可以在节目录制过程中分析嘉宾的需求自动生成视频片段,从而为内容生产注入了更多的趣味性和创新性。可见,AI数字人正以比较具象的“创作主体”身份与人类形成人机协同模式。

作为AI技术的前沿应用,AI数字人展现出视觉逼真和情感交互的双重优势,为内容创作开辟了新的可能性。视觉设计方面,通过动作捕捉技术、高精度建模等赋予数字人逼真的外貌、表情和动作,能达到以假乱真的视觉效果。而且,通过嵌入多模态感知和情感计算系统,AI数字人能够具备情感捕捉的能力。比如,数字人可以借助语音和微表情识别来分析对话者的情绪,然后调整自己输出的声线变化和表情动作,从而进行情感化的互动和角色塑造。因此,AI数字人作为创作伙伴参与到视听内容的生产,可以更加贴近人类的情感,在带给用户独特体验的同时引发用户的共鸣。

(二)传播链:内容—用户关系的深度重构

1.生成式AI推荐:对用户需求的深层适配

在视听产业中,内容分发的智能化转型也在AIGC的推动下实现跃迁。视听平台的智能推荐系统已经可以通过算法分析用户的行为数据(比如观看历史、偏好、时间、点击、互动、停留等)、属性数据(比如性别、地点、职业、年龄等)和关系数据(比如社交关系呈现),精准地将视听内容推送给目标用户,从而提高内容的传播效率与效能。而生成式AI可以通过动态语义建模和跨模态的内容生成能力实现内容价值与用户需求更深层次地适配和场景响应。比如,爱奇艺接入百度文心大模型,探索生成式AI在内容搜索和推荐领域的应用。AI通过对弹幕、评论以及正片关键帧的学习理解,可以快速生成对应的剧情片段和剧情看点,从而实现个性化内容推荐和一键直达精彩片段的功能,高效率满足用户的需求。

相比于传统算法推荐的匹配逻辑,生成式AI的多模态嵌入技术可以融合文本、听觉、视觉信息,模拟人脑跨感官的信息整合模式,从而根据用户的停留时间、回放行为、弹幕互动等多元数据信息精准捕捉用户的需求,达成深度适配。而且,生成式AI也通过“猜你喜欢”等互动方式进一步挖掘用户的潜在偏好,推荐更具有惊喜感的内容,从而实现“认知舒适”与“探索新意”的推荐组合,平衡用户对熟悉感与新鲜感内容的需求。

2.生成式AI搜索:探寻内容新的可见性

在AIGC的推动下,用户主动发起的搜索行为也发生了巨大的变化。比如,爱奇艺接入百度文心大模型之后推出的AI搜索功能,让用户通过输入模糊搜索指令就可以获取贴合需求的内容,应用场景包括角色搜索、剧情搜索、明星搜索、语义搜索、奖项搜索;抖音的跨模态视频搜索突破单模态限制,支持截图、哼唱等非结构化的输入方式,而且可以发现传统推荐系统可能遗漏的潜在关联信息,大大提升了内容的可寻性。

从某种意义上来说,生成式AI搜索是人工智能技术与人类认知的深度融合。AI搜索突破了传统文本搜索需要的关键词匹配、多层级筛选、界面跳转等约束,通过多模态的交互把搜索行为简化为单次的意图式对话,有效降低用户的认知负荷,认知范围得到拓展。同时,生成式AI搜索的发展有望降低个性化智能推荐造成的“茧房效应”,实现内容与用户的连接从特征匹配、信息过滤到意图结构和认知引导的转变。据研究,在海量和高维数据中,因果关系的高度非线性阻碍了人类的发现能力,而深度学习使得AI在复杂非线性的高维空间中的预测能力有了实质性提高。因此,生成式AI的到来使得内容的可见性逻辑发生改变,能够促使内容与用户达成更优质的连接。

(三)消费链:沉浸式体验与互动的升级

1.个性化体验:用户需求的定制化

如前文所言,AIGC带来了更加贴近用户兴趣和需求的内容,并且可以通过与用户行为数据的深度耦合以及与AR/VR技术的深度结合,为用户创造出沉浸式的消费体验。一些视听平台也提供个性化定制服务,根据用户的喜好和习惯为用户生成个性化的音乐播放列表、短视频推荐等。比如,网易云音乐推出的“AI音乐之旅”就是在捕捉用户听歌轨迹的基础上,利用AIGC和AR/VR技术为用户打造的一个可以身临其境感受音乐的虚拟空间。腾讯打造的“元宇宙观影”也大大提升了用户的体验满意度与留存率。

透视AIGC对个性化和沉浸式消费的提升作用,可以发现视听消费的符号性建构得到了强化。正如鲍德里亚所言,消费的意义在于对其符号价值的拥有,而不是追求其实用功能。用户通过选择个性化的视听内容,甚至在虚拟空间里体验超越现实的符号世界,获得来自AI身份所投射的满足感。用户消费在AIGC的驱动下呈现出了从理念到实践的巨大变化,这一变化正在重构视听消费的新坐标。但是需要注意的是,过度个性化也可能排斥用户接触多元文化的可能性,过度自动化将会削弱用户的深度信息加工能力。因此,在AIGC赋能视听内容消费的同时,也需要平衡精准性匹配与探索性推荐的阈值。比如,可以在“猜你喜欢”“每日推荐”中植入一定的破界推荐内容或者设置探索性推荐的触发机制。

2.互动性升级:AI角色带来新体验

在视听内容的消费终端上,越来越多的互动内容让用户的参与感、互动性和满足感都呈现出AI色彩。比如,爱奇艺与微博双端联合上线首批AI角色号,这些AI角色出自热门剧集或综艺,像《云之羽》的@宫尚角bot分角、《新说唱2024》中的@新说唱R总bot等,当用户在发微博或评论时@自己关注的AI角色号,该AI角色就会迅速在评论区开启互动。芒果TV也上线了AI角色宇宙功能,集合了湖南广电热播剧中的热门角色,让用户可以通过APP与角色进行对话,实时聊天。这样的互动为用户带来了全新的社交互动体验。

AIGC在视听内容消费领域的互动性应用,不仅满足了用户在虚拟空间里建立社交关系的需求,也标志着一种新型消费模式的达成。这种模式基于AI所创新的多种互动新形式,在提升用户沉浸感和满足感的同时,也强化了用户与内容之间的独特连接。消费不是被动地吸收和占有,而是一种建立关系的主动模式。此外,AI角色在互动过程中也能获取新的符号意义,对原影视作品而言,不仅是一种新意的再编码,也是一种独特营销,可以进一步提升作品和角色的影响力,强化粉丝经济效应。这种互动模式所蕴含的创新性,将激发视听产业新的商业模式和经营空间。

四、AIGC在视听产业中的负外部性及其治理

从AIGC赋能视听产业的生产、传播、消费环节来看,整个产业链正在发生颠覆式的变革。但是,在实现生产效率提高、创意水平提升、个性化定制等优势的同时,技术双刃剑的另一面也随之显现。深度伪造、用户隐私泄露、舆论风险等负外部性也给视听产业变革带来了不确定性。

比如,深度伪造的科普视频和影视片段或者明星换脸等,很可能在平台上引起快速传播,而现有的监测技术又很难快速地识别伪造性,给个人、企业和社会带来损失的同时也让人们对视频的信任感降低,进而影响视听产业的发展。同时,深度伪造的视频也会给舆论生态带来极大的风险。生成式AI降低了虚假信息的进入门槛,生成和传播都更加容易,有可能使影视作品的价值引导能力陷入风波甚至困境。另外,AIGC的内容生成依赖于大量的数据训练和模仿,往往难以获知数据的来源和授权情况,会出现生成内容与某些原创内容“实质性相似”,具有侵权风险。还有,在用户数据方面,某些视频平台在收录用户数据进行精准画像的过程中,可能获取用户的微表情、声纹、步态、心率等生物特征,进而凭借特定的生物特征推测用户的心理状态等,可以说AI驱动的隐私泄露风险更高。此外,对于高效的人机协同模式而言,也存在一种可能性:AIGC凭其无限的记忆能力可以将人类在剧本、美术设计、配乐等方面的创作经验转化为可计算、可重组的数据,实质上构建了新型的如斯蒂格勒所说的“第三持存”,它既可能进一步激活文化创新的活力,也有可能侵蚀创作的本质。

因此,针对这些风险,视听产业在应用AIGC的时候首先要严格遵守国家在人工智能领域的治理规定,比如《生成式人工智能服务管理暂行办法》《人工智能生成合成内容标识办法》等,对AIGC生成的内容进行严格标识,并严禁大模型使用用户未脱敏的生物特征数据等。其次,采用人工智能技术反制是抵抗风险的核心防线,比如构建多模态深度伪造检测模型、构建内容审核联盟、建立分级审核体系等。此外,AIGC话题也是一个全球性关注的焦点,国际之间的协同合作治理、应急响应机制、技术援助计划等都至关重要。

结语

AIGC正在驱动智能视听时代的到来。当人机协同实现视听内容的大规模生产后,算法生成的符号将不仅是我们认知的延伸,也是斯蒂格勒“第三持存”的AI实践。AIGC让用户沉浸在虚拟数字空间的超真实体验时,也是在重塑我们想象的、认知的边界。未来,人与技术的深度融合需要找到一个平衡点,既能使智能视听产业保持技术创新,也能守护人类的创意基因与认知主权。

[本文系国家社科基金重大项目“人工智能生产内容对舆论生态的挑战、影响与治理研究”(项目编号:24&ZD215)阶段性成果。]

【声明:本号为宣传传媒领域融合创新的理论与实践平台,属官方公益账号,转载此文是出于传递更多信息之目的。若有来源标注错误或其它不妥之处,请联系我们。我们将及时更正。谢谢】

来源:融媒杂志

相关推荐