阿里发布的一款声音驱动人物动画的模型:EchoMimicV2

摘要:choMimicV2 是蚂蚁金服的研究团队提出的一种半身人物动画技术,它能够通过一个参考图像、一段音频片段和一系列手部姿势来生成高质量的动画视频,确保音频内容与人物半身动作的一致性。

choMimicV2 是蚂蚁金服的研究团队提出的一种半身人物动画技术,它能够通过一个参考图像、一段音频片段和一系列手部姿势来生成高质量的动画视频,确保音频内容与人物半身动作的一致性。

该方法通过音频 - 姿态动态协调策略,包括姿态采样和音频扩散,增强了半身动画的细节、面部和手势表情性,并减少了条件冗余。

体验地址:https://huggingface.co/spaces/fffiloni/echomimic-v2开源地址:https://github.com/antgroup/echomimic_v2项目主页:https://antgroup.github.io/ai/echomimic_v2

来源:AI工具箱一点号

相关推荐