a16z认为的下一个千亿赛道来了！你知道吗？

摘要：本文将深度剖析这一千亿级赛道的技术跃迁路径——从嘴型同步到全身动作捕捉，从情绪驱动到实时交互；揭示其商业落地场景如何覆盖C端UGC创作、B端广告自动化、企业级培训分身；并展望未来五年内可能突破的五大技术瓶颈。

本文将深度剖析这一千亿级赛道的技术跃迁路径——从嘴型同步到全身动作捕捉，从情绪驱动到实时交互；揭示其商业落地场景如何覆盖C端UGC创作、B端广告自动化、企业级培训分身；并展望未来五年内可能突破的五大技术瓶颈。

昨天的文章里讲了两个我做AI出海顾问期间遇到的两个“比较坑”的产品方向两个“特别坑”的AI产品创业方向，你知道吗，今天再来讲讲我遇到比较好的一个方向，就是AI视频这块。我合作过5家AI视频类的公司，有专门做视频生成的，也有做视频剪辑的。这两类算是不同赛道，但随着技术进步，从产品层面在逐渐融合。视频生成赛道比较典型的代表是Pika、Runway等产品，视频剪辑赛吧典型代表是HeyGen、Opus Clip等产品。生成赛道一开始吸引人的点还是在于新鲜感，而视频剪辑赛道，从AI虚拟人到长视频剪短视频、再到口型同步，还有直接生成AI UGC以及商品融合等等。

这个赛道很典型的特征就是市场足够大，用户需求很大，而且有不同人群的需求，比如纯粹的创作者有创造需求，做增长的有营销视频需求，做销售的有产品介绍视频需求，甚至在创作者领域还可以再细分，比如专门面向播客人群，面向二次元人群等等。竞争也激烈，绝对是一个红海赛道，但所幸市场足够大，我合作过的视频类产品，增长和营收都很不错，因为确确实实带来了新的生产力革命，整个用户使用是完全闭环的。

当AI不再只是“生成内容”，而是“成为内容”的一部分，一场内容生产的革命就此开启。

过去几年，AI已经能生成逼真的图片、视频和声音，悄然通过视觉和听觉的图灵测试。但2025年最令人激动的突破，毫无疑问是——AI虚拟人（AI Avatar）。

这些不再“恐怖”的AI角色，正以惊人的速度冲出“恐怖谷”，开始全面渗透内容创作、广告营销、企业培训等多个领域。这不仅是AI的一次技术跃迁，更是内容产业的一次范式转变。

今天正好看到a16z发了最新的一篇关于AI Avatar虚拟人这方面的报告，以下是精华信息总结，给大家分享。

一、AI虚拟人研究的演化轨迹：从嘴型匹配到全身互动

真正的挑战不是嘴巴动了，而是表情、头部和身体的每一处细节是否同步、自然。

生成一个“会说话的脸”并不简单。研究人员面临的最大难题是：语音（phoneme）到嘴型（viseme）的精准匹配，再加上面部肌肉、眼神、甚至上半身动作的自然联动。

AI虚拟人技术近几年突飞猛进，从最早的CNN、GAN，到NeRF、3DMM、Transformer、Diffusion模型，如今已发展到基于Transformer的扩散模型（DiT）。最新代表作如ByteDance的 OmniHuman 和Hedra的 Character-3，已可实现逼真的半身/全身动作、表情同步、甚至环境互动。