位置: IT常识 - 正文

嘴型融合 wav2lip 升级版

编辑:rootadmin
嘴型融合 wav2lip 升级版 环境

推荐整理分享嘴型融合 wav2lip 升级版,希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:,内容如对您有帮助,希望把文章链接给更多的朋友!

windows 10 64bit

wav2lip-hq

pytorch 1.12.1+cu113

前言

前面的博文 嘴型同步模型Wav2Lip,介绍了嘴型同步模型,本篇介绍的是 wav2lip 的高清版,在原有基础上,使用了超分辨率图像和人脸分割技术,来提升整体效果。

嘴型融合 wav2lip 升级版

实践

首先,拉取源码

git clone https://github.com/Markfryazino/wav2lip-hq.gitcd wav2lip-hq# 创建个新的虚拟环境conda create -n wav2liphq python=3.8conda activate wav2liphq# 安装torchpip3 install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu113# 安装其它依赖库,将其中的torch、torchvision注释掉,前面已经安装了gpu版本pip install -r requirements.txt

然后去下载模型,这里需要3个模型,第一个下载地址:https://drive.google.com/file/d/1aB-jqBikcZPJnFrJXWUEpvF2RFCuerSe/view?usp=sharing ,下载后拷贝到目录 checkpoints 下面;第二个模型是人脸的模型,下载地址:https://www.adrianbulat.com/downloads/python-fan/s3fd-619a316812.pth,下载后拷贝到 face_detection/detection/sfd 目录下,并重命名为 s3fd.pth;第三个是脸部的 segmentation 模型,下载地址:https://drive.google.com/open?id=154JgKpzCPW82qINcVieuPH3fZ2e0P812,拷贝到 checkpoints 目录下,并重命名为 face_segmentation.pth

最后,我们准备一个音频文件和一个视频文件来进行测试,执行命令

python.exe inference.py --checkpoint_path checkpoints\wav2lip_gan.pth --segmentation_path checkpoints\face_segmentation.pth --sr_path checkpoints\esrgan_yunying.pth --face test.mp4 --audio test.mp3 --outfile output.mp4参考资料

https://github.com/Markfryazino/wav2lip-hq

https://github.com/zllrunning/face-parsing.PyTorch.git

https://github.com/xinntao/BasicSR.git

https://github.com/1adrianb/face-alignment

https://xugaoxiang.com/2021/03/05/wav2lip/

本文链接地址:https://www.jiuchutong.com/zhishi/287081.html 转载请保留说明!

上一篇:一头公牛站在皮库山前的田野中,亚速尔群岛皮科岛 (© Atmo-Sphere/Getty Images)(一头公牛和一头母牛,答五个字)

下一篇:vite配置postcss-autoprefixer,实现自动添加css属性前缀(vite配置详解)

  • 9步,最短时间内起好一个有传播力的标题(九步是多少米)

  • 手机太卡怎么清理(手机太卡怎么清理才能变快)

  • 华为三包包括什么内容(华为三包是指哪三包)

  • 微信红包怎么指定人抢(微信红包怎么指定一个人领)

  • vivo手机照片怎么传到另一个手机(vivo手机照片怎么备份到云端)

  • 拼多多怎么看好友列表(拼多多怎么看好友买了什么)

  • 京东发货多发了谁承担(京东多发货会叫我退吗)

  • nova3外屏可以单独换吗(华为nova3外屏)

  • 普通sim卡能转esim卡吗

  • 京东可以代付吗(京东可以代付吗支付宝吗)

  • 局域网的硬件组成(局域网硬件组成包括主机传输介质和网络连接设备)

  • ap面板是什么意思(啥是ap面板)

  • 华为p30pro声音忽大忽小(华为p30pro声音忽大忽小怎么解决)

  • 苹果的勿扰模式打电话过去会怎样(苹果的勿扰模式的作用)

  • 一代和二代外观区别(一代和二代有啥区别)

  • qq没有访问操作权限是什么意思(qq没有访问操作权限是怎么回事)

  • 分享到微信的在哪里找(分享到微信里)

  • ipad可以边充边玩吗(ipad可以边充电边玩吗安全吗)

  • mate9充电器多少w(mate9充电器参数多少w)

  • word文档怎么取消标注(word文档怎么取消自动编号)

  • 电脑黑屏按哪三个键(电脑黑屏按哪三个键关机)

  • vue可以添加几张照片(vue引入多张图片)

  • 华为mate30新机有保护膜吗(华为mate 30新机多少钱)

  • 手机电池显示怎么变成彩色(手机电池显示怎么是黄色的)

  • 华为解锁后新闻怎么关(华为解锁后出现新闻中心如何解除)

  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设 电脑维修 湖南楚通运网络