开源软件名称:wav2lipHD
开源软件地址:https://gitee.com/justverman/wav2lip-hd
开源软件介绍:
该仓库基于wav2lip(https://github.com/Rudrabha/Wav2Lip),基础wav2lip仅支持96*96分辨率,本仓库修改了model,使其支持288*288,192*192和384*384,其训练和推理方式与wav2lip完全一致。 训练单个中文人物过程(供参考):数据集准备 :一个五分钟左右的单人人物说话视频(无背景声音,纯人声,确保每一帧有且只有一个目标人物,这为了保证在后续步骤裁剪人脸素材时能检测到每一帧的人脸,若出现人脸丢失,需要进行人脸序列和音频序列对齐,这个过程很麻烦且很容易出错,所以尽量在数据集准备时避开这个麻烦)将五分钟左右的长视频裁剪成单个一秒一份的短视频 未完待续。。。 |
请发表评论