浙江卫视智媒果大模型：打造省级主流媒体智能化转型标杆

摘要：经过两年的技术攻关，浙江卫视构建了自主可控的智能媒体技术体系——智媒果大模型，成为省级主流媒体智能化转型的标杆；打造了“新闻采编—创意生产—文化传播”三位一体的智能体系，推动行业标准制定与生态共建；以AI技术激活传统文化现代表达，助力文化传承与传播，形成了“技

浙江卫视将AIGC作为推动媒体深度融合、提升核心竞争力的关键抓手和智能化转型的核心引擎。

近两年，浙江卫视将AIGC作为推动媒体深度融合、提升核心竞争力的关键抓手和智能化转型的核心引擎。

经过两年的技术攻关，浙江卫视构建了自主可控的智能媒体技术体系——智媒果大模型，成为省级主流媒体智能化转型的标杆；打造了“新闻采编—创意生产—文化传播”三位一体的智能体系，推动行业标准制定与生态共建；以AI技术激活传统文化现代表达，助力文化传承与传播，形成了“技术+文化”双轮驱动的媒体新范式。

日前，「视听潮」对话正高级工程师、浙江卫视技术中心主任罗列异。

他表示，当前，人工智能技术发展迅速，已在多个领域展现出巨大的潜力和价值，传媒行业也不例外，“广电视听媒体入局人工智能正处于一个非常关键且合适的时机”。

一方面，传统广电视听媒体面临着内容创新、用户流失、竞争加剧等诸多挑战，人工智能技术为其提供了新的发展机遇和解决方案。

另一方面，国家积极推动科技与文化深度融合战略，为广电视听媒体应用人工智能技术提供了政策支持和发展环境。

同时，人工智能的应用成本逐渐降低，技术门槛也在不断降低，使得广电视听媒体能够更容易地接入和应用相关技术。

此外，用户对智能化、个性化内容的需求日益增长，广电视听媒体入局人工智能可以更好地满足用户需求，提升自身的竞争力和影响力。

因此，广电视听媒体此时入局人工智能，既是顺应技术发展趋势的必然选择，也是实现自身转型升级和可持续发展的重要举措。

“数字化转型将媒体行业向技术驱动、用户服务、跨界融合方向演进。头部平台主导流量，垂类媒体深耕细分市场，无法快速转型者将被边缘化。数字化转型加速媒体行业的优胜劣汰，推动行业的整合和升级。”他说。

▍使命：赋能传播，赋能平台，赋能品牌，赋能效益

「视听潮」：请您介绍一下浙江卫视布局AIGC的背景，以及在频道内部具备怎样的战略地位、战略高度。

罗列异：浙江卫视布局AIGC（人工智能生成内容）主要基于4个方面因素——

一是外部环境的影响，即全球传媒行业智能化转型的必然趋势与技术驱动的创新需求。

二是国家政策的要求，即响应国家“科技与文化深度融合”的战略号召。

三是关键技术的突破，即生成式人工智能技术突破性发展，尤其今年以deepSeek为核心的国产大模型技术的崛起。

四是自身发展的需要，传统媒体面临内容生产效率、用户互动体验及文化传播深度等多重挑战，出于媒体行业本能的忧患意识，应及早布局。

浙江卫视着力打造的智媒果AI大模型于日前通过了中央网信办“生成式人工智能（大语言模型）服务”备案审核，智媒果大模型算法也在去年通过了中央网信办“境内深度合成服务算法”备案。

作为中央网信办批复通过的深度合成算法和生成式人工智能大模型双备案的大模型，智媒果大模型承载着浙江广播电视集团提出的“赋能传播、赋能平台、赋能品牌、赋能效益”的使命。

首先是技术引领，通过自主研发与外部合作结合，构建了自主可控的智能媒体技术体系，成为省级主流媒体智能化转型的标杆。

其次是生态构建，打造了“新闻采编—创意生产—文化传播”三位一体的智能体系，推动行业标准制定与生态共建。

最后是文化创新，以AI技术激活传统文化现代表达，助力文化传承与传播，形成了“技术+文化”双轮驱动的媒体新范式。

▍建设：首创“媒体主导、技术协同”组织形式

「视听潮」：请您介绍一下浙江卫视自主研发的AIGC平台“智媒果”的建设过程，以及经历了哪些关键的节点。

罗列异：智媒果AIGC平台从概念萌芽到生态成型，再到成为符合国家级标准的系统性工程，经历了3个建设阶段：

初期探索阶段（2023年第三季度至2024年第二季度）——

使用开源大模型，进行AIGC的文本、图像、视频创造的探索；成立“AIGC创新实验室”，确立了“平台+微调”的技术路线，集中力量攻克媒体垂直领域的技术适配问题。

平台建设阶段（2024年第三季度至2024年第四季度）——

2024年4月18日，在重大文化传播平台z视介一周年庆正式发布智媒果品牌，推出智媒果AI创作平台1.0版本——这个阶段采用“自主研发+云训练”的混合模式，研发了智聊、智画、智创、智音、智人等产品线，形成了集创意、绘图、视频、音乐、语音一站式创作平台。

7月，完成与融媒体生产系统全面对接，AI能力嵌入节目采编的全流程。

10月底，智媒果大模型算法通过国家网信办境内深度合成服务算法备案。

2024年，基于智媒果大模型在集团内部举办了多季AI创新大赛，产生大量优秀的AI作品。

生态成型阶段（2025年至今）——

2025年1月，平台引入DeepSeek大模型后，性能指标全面提升，应用场景从内容生产扩展到用户互动、文化传播、产业赋能等多个维度——这一时期，平台从工具层面向生态层面演进，形成了“平台+产品+生态”的三层架构。

智媒果大模型通过浙江省委网信办安全评测，3月份正式通过中央网信办生成式人工智能服务备案，完成“双备案”资质。

4月18日，重大文化传播平台z视介迎来两周年庆典，用AI的力量焕新z视介，智媒果AI为z视介带来了“科技+文化深度融合”的智能体应用生态，赋能节目创作和用户互动，对外拓展线下产业化的应用场景，推动文化传播新模式。

这3个阶段经历了多个关键决策变化——

技术路线上，放弃了“全自研”的封闭路线，采用“开源基座+行业精调+商业模型”的混合模式，保证了技术先进性，又控制了研发成本。

合规建设上，提前布局算法备案和大模型备案，为平台合规运营扫清障碍。

研发模式上，首创“媒体主导、技术协同”的组织形式，浙江卫视作为研发主体，联合集团技术中心和外部合作伙伴，形成了高效的协同创新机制。

应用落地上，坚持“场景驱动”原则，每个功能模块都针对具体的业务痛点设计，确保技术能用、好用。

智媒果平台的建设过程并非一帆风顺，团队曾面临算力不足、数据标注质量不高、业务部门接受度低等挑战。

通过建立“试点—推广”机制，比如智能陪看能力建设，我们选择了《越韵中国年》春晚、纪录片《飞来峰》等重大项目作为示范场景，用实际效果打消了疑虑；通过举办四届“智媒果 AI 大赛”，在集团内部培育AI文化，降低了技术使用门槛。

这种“以战代练”的策略，有效地加速了平台的应用落地。

「视听潮」：你们接入国产大模型DeepSeek-R1后，效能上有哪些提升？

罗列异：内容生产方面，节目素材处理效率提升47%，大幅优化制作流程。

在内容创作环节，帮助编剧和创作者快速生成故事大纲、情节发展、角色设定等，还具有脚本润色、摘要浓缩、标题精炼等功能。

在节目制作中，通过“双流CNN+光流分析混合模型”进行边界检测，自动切分关键帧和精彩片段，拆条生成分镜，对分镜向量化，通过语义匹配与片段理解检索能力，提高后期剪辑效率，还能通过大模型理解和创作能力生成缩编文稿。

用户交互方面，用户互动响应速度加快3倍，提供更流畅的观看体验，并已形成智能推荐、用户画像、精准广告投放的完整生态链，驱动文化内容的精准触达和个性化互动，提升了用户体验和平台的商业价值。

例如，我们上线了多个AI互动应用，包括AI宋韵社区、跑男第九人等互动类智能体，以及AI魔法相机、AI音乐制作人等工具类智能体。

成本效益方面，内容生产成本降低超60%，推动智能创作降本增效。

DeepSeek-R1以更低的成本实现了媲美GPT-o1的效果，有效降低了智媒果AI的运营成本。

在技术研发中，接入代码平台让大模型帮写python、java、前端代码，极大提高了研发效率和代码的通过率。

▍应用：“以战代练”，有效加速平台的应用落地

「视听潮」：智媒果AIGC平台的应用情况如何？取得了哪些成果？

罗列异：自智媒果AIGC平台上线以来，在内容生产、用户交互、文化传播等多个方面进行了深入探索和实践，取得了显著成果。

在内容生产方面，智媒果平台已经成功应用于稿件撰写、节目策划、内容创作等多个环节，快速地生成高质量的新闻稿件和节目策划方案，显著提高了内容生产效率。

智媒果AI创造平台提供了丰富的AI创作工具，如智聊、智画、智创等，为创作者提供了一站式便捷、高效的创作环境。

在用户交互方面，智媒果平台通过智能推荐、用户画像、精准广告投放等功能，实现了对用户需求的精准把握和个性化服务，为用户精准推送感兴趣的内容产品，提高了用户的满意度和黏性，也带来了更多的商业机会和收益。

同时，我们通过智媒果大模型建设智能体平台，打造多元化的智能体助手生态矩阵，分批上线品牌IP智能体、文化传播、内容创造、生活服务、智能陪伴型智能体，带给用户AI智能互动的科技体验。

在文化传播方面，智媒果平台通过引入AI技术，实现了对传统文化的创新表达和传承。

例如，在《越韵中国年》春晚等节目中，智媒果平台通过“一键识屏”等功能，让观众在观看节目的同时能够深入了解背后的文化故事和历史背景。这不仅提升了节目的观赏性和教育性，也促进了中华优秀传统文化的传播和弘扬。

此外，智媒果平台还在重大节目报道、产业生态赋能等方面取得了显著成果。

例如，在全国两会报道中，“欣燃”虚拟主播不仅实时报道两会热点，还使报道从单向传播转向多维互动，观众参与度有明显提升。

在文旅融合方面，智媒果平台与影视城合作打造了“AI深度体验馆”，为游客提供了更加丰富、有趣的旅游体验。

「视听潮」：当前，AIGC平台具体主要涉及哪些技术？使用率如何？应用门槛高吗？

罗列异：AIGC平台自身就是多种新兴技术的混合交叉载体，包括大模型混合专家架构（MoE）技术、自然语言处理技术、意图识别技术、知识图谱技术、多模态融合技术、全模态内容识别和多媒体识别理解技术、TTS技术等。

对应于AI用户端产品技术，可以细分为以下5类——

自然语言处理技术：大模型能够理解和生成人类语言，为内容创作、智能交互等提供了基础。

比如，创意生成上，大语言模型根据主题或关键词，自动生成故事大纲、分镜脚本、新闻标题等文本内容，为创作者提供灵感源泉；智能体交互场景中，大语言模型能够理解用户的提问，给出准确的回答，实现智能问答、智能客服、智能搜索等功能。

多模态/全媒态内容处理技术：通过变分自编码器（VAEs）、Transformer模型、扩散模型进行图像、音频、视频理解、生成和修复。例如，智媒果平台支持文生图、文生视频、AI音乐制作等功能，就是通过多模态融合技术实现的，用户可以一键生成配乐、海报、短视频预告片等多模态内容。

知识图谱技术：知识图谱将不同的知识点和概念之间的关系进行关联和表示。智媒果平台中，知识图谱技术为智能陪看、文化问答等功能提供支持。

例如，在浙江卫视的节目中，用户通过智能陪看功能点击屏幕，系统可以基于知识图谱快速获取剧情解析、文化背景等相关信息，为用户提供更深入的理解和体验。

智能算法技术：智能推荐算法根据用户的行为数据和兴趣偏好，构建用户的动态兴趣图谱，为用户精准推送个性化的内容和广告。

AI自动拆条算法在对视频内容理解的基础上，对视频进行切分和分析，提取关键帧和精彩片段，生成短视频，极大提高短视频生产效率，提高短视频的品质。

语音和数字人技术：构建虚拟数字人，音色克隆和语音驱动唇形同步，并通过大模型实现互动与播报。

浙江卫视虚拟主持人“谷小雨”以宋韵文化推广人身份亮相，集团9个频道上线专属的数智主持人。

从实践来看，智媒果平台利用率呈上升趋势，在多个重大项目中都发挥了重要作用。

例如，在《越韵中国年》春晚中，智能陪看、AI“一键识屏”等功能为观众提供了全新的观看体验；在纪录片《飞来峰》中，智能陪看功能让用户能够深入探索飞来峰造像的历史价值，激活了近100TB未公开素材。

此外，智媒果平台还形成了集创意、绘图、视频、写歌谱曲一站式创作平台，服务百万用户，这也充分说明AIGC平台的技术在实际应用中的广泛使用。

2024年开始，集团陆续举办了四季智媒果AI大赛，旨在培养熟悉运用AI新质生产力的人才，设立专项奖励，鼓励员工积极参与技术创新和业务创新；同时，邀请外部专家和内部技术人才进行了多轮AI业务专项培训，培养一批既懂广电业务又掌握AI技术的复合型人才，提升团队的整体创作水平和技术研发能力。

集团通过“以战代练”策略，降低AIGC平台的应用门槛，提高了运用的普及度，有效地加速了平台的应用落地。

▍影响：巨大机遇与多重挑战

「视听潮」：AIGC呈现出哪些显著优势？

罗列异：一是内容生产高效快速。

AIGC在内容创意、剧本创作、文稿撰写、节目制作等多个环节实现智能化助力和自动化生产，极大提高生产效率，缩短创造周期，同时全天候在线。

二是新潮创新突破。

通过大模型能力，激发创造灵感，突破思维定势，让传统文化有了新潮表达，形成传播新范式。

比如智能陪看提升观影体验，谷小雨代言宋韵文化。

三是降低了创作门槛。

通过AIGC的创造能力，原先需要长期专业培训才能获取专业技能，普通用户通过提示词也能轻松上手，比如AI创作海报、AI创造音乐、AI演唱歌曲等。

通过AIGC能力，新手小白编辑也能达到中等以上责编的撰稿水平，AI智能拆条能应用视频理解能轻松生产优质短视频内容，AI编程能让程序员效率翻番并保障代码高质量。

四是成本优化节约。

降低人力投入，自动化替代重复性劳动，中小团队也能使用轻量化AI工具进行高效创作，降低了技术应用成本。

「视听潮」：AIGC存在哪些潜在问题？哪些方面有待加强？

罗列异：AIGC的快速发展为内容创作、文化传播、商业创新带来了巨大机遇，但同时也面临安全、伦理、法律等多重挑战。

首要问题是内容安全与伦理风险。

AIGC可生成高度逼真的虚假新闻、伪造音视频，可能被用于舆论操纵、诈骗等恶意用途。

大模型训练数据可能隐含社会偏见，导致生成内容存在性别、种族、文化歧视问题。

数据安全与隐私保护也面临更大的挑战。

交互式AI（如智能客服）可能记录用户对话，若安全防护不足，可能导致用户敏感信息外泄。

版权与知识产权易引发争议，比如AI生成内容的权属问题，AI创作的文字、音乐、画作、视频是否受版权保护，目前法律尚未明确，导致商业应用存在法律风险；比如训练数据的版权合规性，大模型采用未经授权的互联网数据训练，可能侵犯版权或隐私。

此外，技术本身的局限性也会带来诸多问题，比如大模型“幻觉”——大模型可能生成看似合理但事实错误的答案（如虚构历史事件、虚构人物），影响新闻、学术等严肃场景的应用。又如，多模态生成的稳定性不足，导致视频生成易出现画面跳变、口型不同步等问题，难以满足影视级需求。

只有通过技术创新、行业自律、政策规范三管齐下，才能实现AIGC的可持续应用。

比如，加强AIGC立法和行业监管，加强大模型的安全评估和备案监管，完善内容治理规范，建立AI生成内容标识制度。

2025年9月1日，《人工智能生成合成内容标识办法》将全面实施，对AIGC内容进行标识，提醒用户甄别信息真实性。

「视听潮」：真实是新闻的生命，随着AIGC在新闻作品中的更多应用，会不会有悖新闻伦理？

罗列异：AIGC的发展确实给新闻伦理带来了极大挑战。

随着AIGC技术的发展，图像、视频和音频的逼真性让人真假难辨；同时，AIGC可以快速生产海量内容，智能剪辑快速生成短视频快讯，虚拟主播实时报道新闻，极易造成虚假内容泛滥，让人防不胜防。

但通过合理地规范和管理，可以避免这些问题。例如，完善相关法律法规，禁止非法采集、滥用个人信息，明确责任主体和处罚机制，强制约束造假行为；加强行业监管，严格进行内容标注“由AI生成”，严格执行大模型和算法备案制度；加强平台监督，明确发布平台是第一责任人；规范新闻内容审核机制，对AI生成的内容进行人工审核和把关，确保符合新闻伦理和法律法规；提升AI技术的鉴伪能力，从技术上甄别虚假内容；加强职业道德教育，新闻从业者保持专业素养和职业道德，正确运用AIGC技术，坚守新闻的真实性和公正性，使其更好地服务于新闻传播，而不是违背新闻伦理。

「视听潮」：在您看来，加快数字化转型将对未来的媒体竞争格局产生怎样的影响？

罗列异：数字化转型打破传统媒体的垄断地位，使得媒体竞争格局更加多元化和分散化。