首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >【CVPR2023】高保真自由可控的说话头视频生成

【CVPR2023】高保真自由可控的说话头视频生成

作者头像
数据派THU
发布2023-05-11 17:46:25
发布2023-05-11 17:46:25
4000
举报
文章被收录于专栏:数据派THU数据派THU
代码语言:javascript
复制
来源:专知本文为论文介绍,建议阅读5分钟本文提出一种新的模型,可以产生高保真的头部视频,可以自由控制头部姿态和表情。

说话头生成是根据给定的源身份和目标运动生成视频。然而,目前的方法面临着一些挑战,限制了生成视频的质量和可控性。首先,生成的人脸往往存在意想不到的变形和严重的失真。其次,驾驶图像没有明确地解缠运动相关信息,如姿态和表情,这限制了在生成过程中对不同属性的操作。第三,由于相邻帧之间提取的地标不一致,生成的视频往往存在闪烁伪影。本文提出一种新的模型,可以产生高保真的头部视频,可以自由控制头部姿态和表情。该方法利用自监督学习路标和基于3D人脸模型的路标来建模运动。本文还提出了一个新的运动感知多尺度特征对齐模块,以有效地迁移运动而不产生面部失真。用特征上下文自适应和传播模块增强了合成的说话人视频的平滑性。在具有挑战性的数据集上评估了该模型,并展示了其最先进的性能。更多信息请访问https://yuegao.me/PECHead。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-05-08,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据派THU 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档