设为首页
点击收藏
手机版

手机扫一扫访问
迪恩网络手机版
关注官方公众号

微信扫一扫关注
迪恩网络公众号

登陆注册

快速发帖
客服电话

点击联系客服
在线时间：8:00-16:00

客服电话

132-9538-2358

电子邮件
[email protected]
APP下载

迪恩网络APP

随时随地掌握行业动态
官方微信

扫描二维码

关注迪恩网络微信公众号
问题反馈
返回顶部

OGeek|极客世界-中国程序员成长平台 › 门户 › 开源›人工智能

wav2lipHD: 基于wav2lip，增添了高分辨率模型，在私人单人数据集中表现良好 ...

原作者: [db:作者] 来自: 网络收藏邀请

开源软件名称：

wav2lipHD

开源软件地址：

https://gitee.com/justverman/wav2lip-hd

开源软件介绍：

该仓库基于wav2lip（https://github.com/Rudrabha/Wav2Lip），基础wav2lip仅支持96*96分辨率，本仓库修改了model，使其支持288*288,192*192和384*384，其训练和推理方式与wav2lip完全一致。

训练单个中文人物过程（供参考）：

数据集准备 ：一个五分钟左右的单人人物说话视频（无背景声音，纯人声，确保每一帧有且只有一个目标人物，这为了保证在后续步骤裁剪人脸素材时能检测到每一帧的人脸，若出现人脸丢失，需要进行人脸序列和音频序列对齐，这个过程很麻烦且很容易出错，所以尽量在数据集准备时避开这个麻烦）将五分钟左右的长视频裁剪成单个一秒一份的短视频

未完待续。。。

该文章已有0人参与评论

请发表评论

全部评论

专题导读

上一篇：

nniefacelib: nniefacelib是一个在海思35xx系列芯片上运行的人脸算法库 ...发布时间：2022-03-24

下一篇：

zwhx: 职位画像系统发布时间：2022-03-24

热门推荐

热门话题

阅读排行榜

扫描微信二维码

查看手机版网站

随时了解更新最新资讯

139-2527-9053

在线客服（服务时间 9:00～18:00）

在线QQ客服

地址：深圳市南山区西丽大学城创智工业园

电邮：jeky_zhao#qq.com

移动电话：139-2527-9053

Powered by 互联科技 X3.4© 2001-2213 极客世界.|Sitemap