腾讯司晓：大模型时代，内容产业智变新浪潮

摘要：在5月27日闭幕的第15届中国（深圳）国际文化产业博览交易会上，腾讯集团副总裁、腾讯研究院院长司晓以《大模型时代文化内容生产的范式革命》为题发表主旨演讲，系统阐述了大模型技术对文化内容生产、传播及产业生态的颠覆性变革。他指出，大模型已从“工具赋能”跃升为“生态

司晓腾讯集团副总裁、腾讯研究院院长

在5月27日闭幕的第15届中国（深圳）国际文化产业博览交易会上，腾讯集团副总裁、腾讯研究院院长司晓以《大模型时代文化内容生产的范式革命》为题发表主旨演讲，系统阐述了大模型技术对文化内容生产、传播及产业生态的颠覆性变革。他指出，大模型已从“工具赋能”跃升为“生态重构”，推动文化内容产业从“专业主导”向“全民共创”跨越，并加速文化传承与创新的深度融合。

以下是司晓的演讲内容整理。

人工智能的加速演进为文化内容领域带来新的发展机遇。这一波生成式人工智能的发展浪潮可谓“日新月异”。以2022年底ChatGPT面世作为大模型进入公众视野的首个重要节点，后续Midjourney、Gemini间隔数月陆续推出；而2025年未过半时Deepseek R1、Grok3等主流大模型就密集发布。毫不夸张地说，人类历史上首次进入了技术以“天”为单位进化的时代，从技术发展到应用落地的间隔也被压缩至无限短。文化内容行业已成为智能实践的先锋领域。腾讯研究院曾调研了百余位各行业专家，凭借业态丰富、场景明确的优势，文化产业中的传媒、游戏等板块对大模型的应用程度，在十多个不同行业中处于中上游位置。广告、软件、教育这些以智力和创意为核心的产业，成为大模型渗透速度最快的领域。

多模态突破：内容生产从"单一维度"迈向"全感官沉浸"

多模态大模型技术持续突破，生成效率与质量显著提升。以腾讯混元为例，其文生图能力在一年内实现跨越式升级：混元图像2.0支持边输入文字边实时生成图像，用户可即时调整美术风格、特效等视觉元素，相较此前需等待完整生成后再修改的模式大幅优化。文生视频领域同样进步明显，2023年，有网友利用AI工具仅用5晚便完成《流浪地球3》“概念预告片”制作，引发导演郭帆关注。到今天，主流模型如混元、可灵到刚刚发布的谷歌Veo3，已经逐步有效解决手部穿模等画面缺陷，生成视频的连贯性与物理模拟能力显著增强，甚至可以为画面同时匹配准确的人声和音效。面向影视生产的Flow等专业工具及国内同类软件已实现脚本、分镜、镜头控制等多项专业能力集成，展现惊人进化速度。在文生图片的扩散模型基础上，叠加深度参数则升级为3D生成。腾讯在文生3D领域有诸多创新：混元3D生成模型2.5版本较上一版本，总参数量提升了10倍，能够实现超高清的几何细节建模。我们的同事已通过文生3D功能结合家用3D打印机，制作出原创玩具模型。未来，用户不仅可以购买创意服务，更能自主构思创意，通过家用打印机直接输出。

大模型对世界的理解与交互能力也在增强。我曾将手机作为GPT-4o大模型的“眼睛”，问它窗台上有几个公仔。它不仅准确回答了类型和数量——四个腾讯公仔，还在追问下识别出后方隐藏的一只兔子。尽管大模型的理解能力并非人类意义上的物理世界认知，但其基于视觉与推理能力的实现方式已具突破性——例如谷歌最新发布的通用AI智能体项目Project Astra，便如同钢铁侠的个人助理，可通过眼镜或手机指导洗衣等日常操作，并与现实世界实现更自然交互。这些未来硬件与大模型结合的创新，必将为我们的生活带来更多便利。

虽然我不是技术专家，对技术细节了解有限，但反而更能跳出细节去审视大模型当前的缺陷。现阶段，用户对大模型部分能力的不满，本质上源于对其"许愿"般的进化期待——按照当前的进化节奏，诸多技术瓶颈将在未来最长以年、最短以月为单位的时间尺度内被突破。因此，AI在文化内容领域的应用前景更加值得期待。

效率革命：从"人力堆砌"到"智能涌现"的内容生产新范式

技术变革对文化内容生产范式带来的影响是广泛而深远的。大模型不仅让知识触手可及，更大幅降低了表达能力的门槛。用户无需深入学习专业理论和工具技法，即可创作出以假乱真的图片、视频甚至电影等复杂形态内容。当然，创意本身也变得易得：例如，当写作遇阻时，可让大模型生成多个后续版本，从中选择和优化内容，度过灵感“枯竭期”。未来，阅文等平台上的网络文学创作可能形成模式进化：从读者逐章追更，到可主动“许愿”希望剧情如何发展，结合大模型的无限表达与创意涌现能力，使创作正真正进入“千人千面”的全新时代。综上，我们已进入“智力即服务”时代——人类首次通过云端模拟出一种智能形态，这种智能如同水、电般“打开水龙头或电闸”即可获取，推动我们真正迈入AI平权时代，生产效率大幅提升。AIGC加持下，创意与表达的实际供给量趋于无穷大，内容质量也将显著提升，这将带来一大批“超级创作个体”的崛起。可以从两个具体案例中看到这种趋势：其一，上海民族乐团携手腾讯音乐打造全国首台国乐AI音乐会《零·壹 |中国色》。艺术家们基于“琴乐大模型”生成的音乐内容进行二次创作，同时帮助大模型改进算法，使擅长西方乐理的模型更加理解民乐独特构成方式，实现生成内容从形似到神似的跨越。其二，中国传媒大学师生制作AI短片《电火花之舞》获国际认可。创作团队借助大模型能力巧妙致敬十余部中外经典影片，并自然融入影片故事主线，斩获麻省理工学院（MIT）AI电影节最佳叙事奖。

向善而行：技术温度是内容产业的"终极竞争力"

最后，我想谈谈人工智能时代，智能向善三个重要路标“可信”“可靠”“普惠”中的“可信”问题。大模型的“幻觉问题”成因复杂，包括技术原理、数据语料等。“幻觉”与“创新”本是一体两面，在实际应用中，可以调整大模型生成内容的“温度”（Temperature）参数，使得生成内容的“天马行空”程度有所降低。但在教育、医学等大量实际场景中，我们仍然希望大模型提供的内容无限接近“100%”可信。为探索这一问题的解决方案，腾讯与多家出版机构开展合作，增加文化资源和可信大模型的双向互动。一是共同构建出版智能体，支持用户进行工具类图书的内容咨询。例如，人民卫生出版社基于腾讯元器智能平台开发"人卫知识服务"智能体，不仅能为用户提供特定医学领域的权威解答，还能精准定位并引用相关书籍原文，并可跳转至书籍电商平台进行购买。二是微信读书不断升级“AI问书”功能，当用户遇到生僻古语不知出处时，选定具体文字即可在出版机构专业语料库中快速定位来源，并展示更多相关图书链接，帮助用户打开更广阔的知识视界。此外，在微信除红包外新增的“蓝包礼物赠送”功能中，图书赠送是最常用的场景。这些尝试也推进了出版社的智能化转型。腾讯始终定位为“科技+文化”公司，从另一维度也可称为“连接+内容”公司，因此我们与敦煌、长城合作开展了“云游敦煌”“云游长城”“数字藏经洞”等多个可持续社会价值项目，腾讯始终将“科技活化传统文化”作为承担社会价值的重要方向。 “探元计划”是这一方向下的重要实践：项目通过征集产业前沿技术与文旅应用场景，推动更多来自新兴科技企业的技术与场景实现最优匹配。例如，我们近期与香港九龙城合作的“在九龙城阅见香港”项目，对不同历史时期的九龙城进行数字化，并融入专家级智能体。用户可在H5互动体验中游玩，同时向智能NPC提问关于九龙城的故事，获得游戏化交互体验。这种模式为文旅业带来了更大的想象空间。

最后，推荐大家使用研究院在ima平台搭建的AGI知识库。AI以“天”为单位进化，我们团队通过“人工+AI”方式每日搜集整理全球AI资讯，形成《AI每日速递》，并整合至同一知识库。这种基于人工筛选的定向知识库对垂类知识进行了更系统和结构化的梳理，使大模型在回答用户提问时可进行增强检索，生成内容更具可信度。推荐大家使用！
谢谢大家！