GTC25 | 提前预约媒体和娱乐会议！

摘要：探索媒体和娱乐行业如何运用 AI 实现更智能、更个性化、更具感染力的内容交付。NVIDIA Media2 以 RTX 光线追踪及神经渲染技术为基石，依托 NVIDIA NIM 微服务及 AI Blueprint 技术生态，聚合创新力量，驱动智能定制化内容精准触

探索媒体和娱乐行业如何运用 AI 实现更智能、更个性化、更具感染力的内容交付。NVIDIA Media2 以 RTX 光线追踪及神经渲染技术为基石，依托 NVIDIA NIM 微服务及 AI Blueprint 技术生态，聚合创新力量，驱动智能定制化内容精准触达用户，加速行业变革。

中文观看派对：AI 如何变革内容创作、个性化与分享方式

会议时间：3 月 24 日下午 4:00 - 5:00（北京时间）

演讲嘉宾：

Richard Kerris | NVIDIA 副总裁兼总经理

会议主持人：

Maggie Jiang | NVIDIA 中国及亚太地区媒体和娱乐总监

会议内容：

AI 正在通过改变我们创作、处理和分享内容的方式，为媒体制作行业带来变革。它可以帮助艺术家和作家生成脚本、音乐和视觉效果。现在，该行业正在使用自然语言处理和 Transformer 模型创建对话和故事大纲，帮助故事讲述者构思故事。音乐制作人员使用 AI 创作和改进作品；视觉特效人员将 AI 用于提高转描、调整色彩、创建计算机生成图像等任务的效率；媒体传播人员使用 AI 优化内容分发和个性化。AI 驱动的推荐系统可以通过分析用户数据推荐符合个人喜好的内容，提高观众的参与度。另外，AI 在管理数字版权、检测版权侵权和确保遵守许可协议方面也发挥着重要作用。随着 AI 的不断进化，它将继续改变传统的媒体制作工作流。但它在为创作带来新的可能性的同时，也引发了关于真实性和内容操纵的重要伦理问题。本会议将重点介绍这个新领域在技术和软件产品方面的最新进展。

本会议将重点介绍这个新领域在技术和软件产品方面的最新进展AI 在为创作带来新的可能性的同时，也引发了关于真实性和内容操纵的重要伦理问题AI 在管理数字版权、检测版权侵权和确保遵守许可协议方面也发挥着重要作用

AI 如何变革我们创建、个性化和共享内容的方式

会议代码：S73742

会议时间：3 月 20 日凌晨 12:00 - 12:40（北京时间）

演讲嘉宾：

会议内容：

重塑 AI 赋能电影制作的未来

会议代码：S72649

会议时间：3 月 20 日凌晨 2:00 - 2:40（北京时间）

演讲嘉宾：

Haohong Wang | TCL 总经理

会议内容：

在快速发展的电影制作行业，AI 与数字化的融合正在解放非凡的创造力。本会议将首先探讨Sora、Runway、Kling、Luma Dream Machine等 AI 驱动的工具如何改变传统的电影制作工作流。然后，将介绍数字化如何提高 AI 辅助制作的可指导性和视觉质量。会上将使用 MineStudio 这一基于 AI 的创新电影制作流程，演示如何将高斯泼溅、稳定扩散和风格转移等先进的 AI 技术无缝集成到喜剧片、科幻片、恐怖片、纪录片、爱情片、动画片等不同类型的电影制作中。欢迎对 AI 驱动的电影制作感兴趣的开发者参与 MineStudio 计划并做出贡献，推动有助于塑造该行业未来的创新。

直播媒体的未来:体育直播中的 AI

会议代码：S72512

会议时间：3 月 21 日凌晨 2:00 - 3:00（北京时间）

演讲嘉宾：

Sepi Motamedi | NVIDIA 媒体直播解决方案高级产品营销经理

Marta Mrak | Sky 首席 AI 架构师

Javier Gil Fernandez | 西班牙足球职业联盟 AI 应用和开发主管

Dave Lehanski | 美国职业冰球联盟业务开发与创新执行副总裁

Marc Hodakowski | 美国职业橄榄球联盟高级项目经理

Neil Boland | 美国职业棒球大联盟技术高级副总裁兼首席信息安全官

会议内容：

这场充满真知灼见的会议将介绍 AI 在体育直播行业的现状和未来趋势，展示这项技术将如何从赛场到客厅改变比赛的方方面面。专家小组成员将讨论 AI 在球迷互动、运营和球员表现方面的前沿应用，重点介绍 AI 如何深入改变人们实时体验、分析和与体育赛事互动的方式。

视频基础模型的规模化训练

会议代码：S73918

会议时间：3 月 18 日凌晨 4:00 - 4:40（北京时间）

演讲嘉宾：

Ersin Yumer | Adobe AI/ML 平台和数据高级总监

会议内容：

本会议将深入探讨如何使用生成式 AI 大规模地训练基础模型。

AI 对电影制作的影响：现实世界中的转变

会议代码：S73743

会议时间：3 月 19 日上午 6:00 - 6:40（北京时间）

演讲嘉宾：

Ed Ulbrich | Metaphysic 首席内容官兼制作总裁

会议内容：

与会者将深入了解 AI 为整个电影制作领域所带来的变革。本会议将通过来自电影大片和破纪录的音乐视频的突破性实例，展示 AI 在视觉效果之外的影响。会上还将探讨 AI 技术如何让导演能够在拍摄现场对角色表情和动作进行强大的实时控制，以及未来 AI 将如何提高人类艺术水平、实现高端制作技术的普及化和重新定义电影叙事的边界。

借助 AI 驱动的光线追踪技术改变虚拟制作

会议代码：S73751

会议时间：3 月 18 日上午 6:00 - 6:40（北京时间）

演讲嘉宾：

Vladimir Koylazov | Chaos 创新主管

Phillip Miller | Chaos 产品管理副总裁

会议内容：

与奥斯卡奖和艾美奖获奖软件开发商 Chaos 一起深入了解 Project Arena 的架构如何将光线追踪内容实时传输到 LED 墙，探索这一开创性的系统如何在多颗 GPU 上实现帧同步分布式渲染，同时保持生产级的图像保真度。本会议将展示直接数字内容创作（DCC）应用集成的优势，包括以交互式帧速率处理数万亿多边形的场景，以及 NVIDIA DLSS Ray Reconstruction 的 AI 降噪技术如何改写游戏规则。与会者将通过短片“Ray Tracing for the Win”中的实际案例，了解 Project Arena 如何克服传统虚拟制作的瓶颈，在拍摄现场实现更好的创意迭代并提升电影制作体验。

释放非结构化数据的潜力

会议代码：S72223

会议时间：3 月 20 日凌晨 1:00 - 1:40（北京时间）

演讲嘉宾：

Christophe Ponsart | Qvest 执行副总裁

会议内容：

在充斥着感官信息的世界中，我们的数字交互往往落后于丰富的体验。传统系统主要注重基于文本的数据，降低了我们发挥非结构化数据全部潜力的能力。本会议将探讨 NVIDIA 的 Transformer 模型和基础设施如何深入改变人们与计算机的交互方式，使用户能够将音频和视频输入转化为可深度探索的情境化知识。

使用 AI 工具将现场活动中的表演者数字化

会议代码：S72089

会议时间：3 月 20 日上午 5:00 - 5:40（北京时间）

演讲嘉宾：

Raed Al-Tikriti | Disguise 首席产品和技术官

会议内容：

AI 如何增强跨多重空间现实的体验？如今，2D、3D 甚至 2.5D 媒介让我们能够通过更多方式捕捉真人和真实环境，并在现场表演中将其转化为新的虚拟现实。我们需要一个中央工作流捕捉这些资产，然后将其可视化以便进行图形渲染和合成。与会者将全面了解基于 AI 的单目深度重建。本会议将深入探讨如何只用一台摄像机捕捉制作排练片段，并使用 AI 将这些片段转化成表演者的 2.5D 图像，然后在预可视化软件中播放。

通过量化大型 Transformer 扩散模型减少端到端延迟并降低推理成本

会议代码：S72556

会议时间：3 月 20 日上午 6:00 - 6:40（北京时间）

演讲嘉宾：

Maximilian Mueller | NVIDIA 开发者技术高级软件工程师

Allie Yang | Adobe 机器学习高级工程师

会议内容：

扩散模型的出现为艺术家带来了新的创意工作流，但其资源消耗巨大的特性给部署带来了巨大挑战。目前先进的图像扩散模型处理每张图像需要数十秒的时间，而视频扩散模型的计算成本更高。我们将使用 NVIDIA GPU 上的最新 fp8 张量核，展示从研究到部署生产就绪 TensorRT 的路径，这不仅减少了推理成本，还增加了每颗 GPU 可服务的用户数量。本会议将深入分析在 Adobe 示例中部署量化扩散器的性能和质量复杂性，适合想要在 NVIDIA GPU 上优化扩散模型部署的 AI 研究者和软件工程师。

使用 AI 为下一代内容制作流程部署移动专网和边缘计算

会议代码：S72513

会议时间：3 月 21 日凌晨 12:00 - 12:40（北京时间）

演讲嘉宾：

Scott Connolly | Verizon Innovation Labs 媒体技术主管

Tony Walasik | Monks 产品经理

会议内容：

本场会议将探讨如何通过集成本地运行的容器化云应用与 NVIDIA Holoscan for Media，驱动创新的广播工作流。借助 Verizon 的 5G 专网与企业 AI 解决方案，用户将能够在本地部署的硬件上使用云和软件驱动的工作流，在最大程度地减少所需专用硬件的情况下，将最先进的工作流部署到 IP 安全环境中。与会者将了解如何构建使用 NIM 以及 SMPTE 2110、5G 无线视频和 AI 分析等前沿技术的工作流，从而创建出令人期待的全新广播流程。

使用 Holoscan for Media 将 NIM 连接到无压缩音视频工作流

会议代码：S72563

会议时间：3 月 21 日上午 5:00 - 5:40（北京时间）

演讲嘉宾：

Gareth Sylvester-Bradley | NVIDIA 首席软件工程师

Pravin Sethia | NVIDIA 软件经理

会议内容：

Holoscan for Media 是在 AI 基础设施上运行的软件定义平台，它可以用于开发、部署和运行媒体直播应用。该平台支持未压缩的 IP 媒体并为直播公司提供 PTP 同步功能，同时使客户能够在经过集中认证的现成商用硬件上运行来自多家软件供应商的应用。它让服务器能够每天根据用户需求改变用途。NVIDIA 在 2024 年 9 月的 IBC 展会上展示了这项技术的最新进展和供应商使用情况，包括实时图形、视觉混合和实时 AI 字幕。本场会议将介绍该平台的最新改进及其为直播机构带来的优势，并详细介绍它如何使用 NIM 进行流媒体直播。

通过创新的 AI 应用增加大型 M&E 档案的变现机会

会议代码：S72715

会议时间：3 月 21 日上午 6:00 - 6:40（北京时间）

演讲嘉宾：

Lewis Smithingham | Monks 媒体、娱乐、游戏和体育执行副总裁

会议内容：

本会议将讲解如何在软件定义广播流程中使用基于 NIMS 的上下文分析提取元数据，以便根据每帧的视觉内容甚至其周围的上下文对激活的媒体和档案进行搜索。这些数据为变现和个性化定制带来了新的可能性。会上将讨论如何在时间可寻址媒体（TAMS）框架内生成和反复完善上下文元数据，从而在每次检索片段时添加和修改元数据。这些数据可用于生成检索增强生成模型，用于异常检测、预测/建议性编辑和 FAST 内容生成等。与会者将了解新闻机构如何使用元数据在其档案中进行查找，赛车公司如何使用上下文数据创建能够预测摄像机切换、提高安全性和生成特定用户叙述的模型，以及如何将媒体和娱乐（M&E）上下文数据流程用于避免与自动驾驶汽车相撞、声纳分析等行业外的用途。

为大规模视频分析设计基于 VLM 的 AI 智能体

会议时间：3 月 22 日凌晨 12:00 - 12:40（北京时间）

演讲嘉宾：

Oran Shayer | AppsFlyer AI 研究负责人

会议内容：

本场会议将深入探讨为大规模视频处理流程构建基于视觉语言模型（VLM）的 AI 智能体所需的创新架构。与会者将了解如何在兼顾计算效率的同时，最大程度地发挥视觉语言模型的优势及其全面的视觉理解能力。

视频压缩的未来：AI 驱动的时代

会议时间：3 月 18 日凌晨 12:00 - 12:40（北京时间）

演讲嘉宾：

Sharon Carmel | Beamr 首席执行官

会议内容：

与会者将了解 AI 如何通过提升效率和质量，重塑面向未来的视频工作流中的视频压缩。随着 AI 算法侧重于压缩工作并进一步优化压缩码率，视频本身将转变为 AI 视频。