AI 数字人模型 Hallo2：让图片开口说话，一键修复模糊人脸

360影视 2024-12-09 19:34 24

摘要：Hallo2 是由复旦大学 (Fudan University)、百度公司 (Baidu Inc) 和南京大学 (Nanjing University) 于 2024 年联合开发的一项先进技术，旨在生成长时间、高质量的唇形视频。该技术在原有的 Hallo 模型

Hallo2 是由复旦大学 (Fudan University)、百度公司 (Baidu Inc) 和南京大学 (Nanjing University) 于 2024 年联合开发的一项先进技术，旨在生成长时间、高质量的唇形视频。该技术在原有的 Hallo 模型基础上进行了多项创新和改进，使其能够应对长时间视频生成中的挑战，并实现高分辨率的视觉效果。Hallo2 不仅能生成高质量的唇形视频，还能修复输入视频中的人脸模糊问题。通过先进的图像处理技术，模型能够在生成过程中自动修复人脸的不清晰部分，提升最终视频的视觉效果。

教程链接：https://go.openbayes.com/c9fv8

http://openbayes.com/console/signup?r=sony_0m6v

登录到 OpenBayes 平台后，打开「公共教程」，找到「Hallo2 高清长时音频驱动图像生成 Demo」的教程。

进入到教程界面后，点击右上角「克隆」。

平台在克隆过程中以自动为我们配置好了模型文件，直接进入到选择算力界面。平台会自动选择合适的算力资源和镜像版本，按照需求选择「按量付费」或「包日/周/月」。这里使用的是英伟达 RTX 4090 的算力和 PyTorch 的镜像，点击「继续执行」。可以使用文章开头的邀请链接，获得 RTX 4090 使用时长！

稍等片刻，待系统分配好资源，状态栏显示为「运行中」后，点击「打开工作空间」进入模型。

1.安装虚拟环境及相关依赖

进入到工作空间后，我们新建一个「终端」，然后运行「chmod +x setup_environment.sh」，为配置环境的脚本添加可执行权限。

之后运行「./setup_environment.sh 」，以安装运行配置环境的脚本。当提示出「All steps completed successfully.」时表示安装完成。

接着运行「conda activate hallo」来激活虚拟环境。看到左边的（base）变为了（hallo）则代表虚拟环境成功激活了。

最后运行「pip install --upgrade gradio」更新 gradio 包。

2.模型运行

在终端中输入并运行「python app.py」，待出现 8080 端口后，点击「API 地址」的箭头处即可前往 gradio 界面。进入 API 地址需要先进行实名认证~

该模型拥有两个功能：唇形生成功能和高分辨率人脸修复功能。

点击「Generate Video」，这里我们上传了一段嬛嬛的语音和一张图片，点击「Generate Video」生成。

点击「Video Super Resolution」，我们上传一段视频，点击「Run Super Resolution」进行高分辨率人脸修复。

来源：邢邢科技智慧

标签：模型 hallo2 hallo

本文地址：https://news.43u.com.cn/a/162115.html

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!