首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >姿态可控的Talking Face Generation隐式模块化 Audio-Visual 表征 (CVPR 2021)

姿态可控的Talking Face Generation隐式模块化 Audio-Visual 表征 (CVPR 2021)

作者头像
AI算法与图像处理
发布2021-05-07 11:04:54
8390
发布2021-05-07 11:04:54
举报

https://github.com/Hangz-nju-cuhk/Talking-Face_PC-AVS

https://arxiv.org/abs/2104.11116

摘要:

提出了一种姿态可控的视听系统(PC-AVS),该系统实现了任意语音人脸的自由姿态控制。我们没有从音频中学习姿势运动,而是利用另一个姿势源视频来仅补偿头部运动。关键是设计一个不含口型和身份信息的隐式低维姿态编码。通过这种方式,视听表示被模块化为三个关键因素的空间:语音内容、头部姿势和身份信息。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2021-04-27,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AI算法与图像处理 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档