首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

【CVPR2023】高保真自由可控的说话头视频生成

来源:专知本文为论文介绍,建议阅读5分钟本文提出一种新的模型,可以产生高保真的头部视频,可以自由控制头部姿态和表情。 说话头生成是根据给定的源身份和目标运动生成视频。然而,目前的方法面临着一些挑战,限制了生成视频的质量和可控性。首先,生成的人脸往往存在意想不到的变形和严重的失真。其次,驾驶图像没有明确地解缠运动相关信息,如姿态和表情,这限制了在生成过程中对不同属性的操作。第三,由于相邻帧之间提取的地标不一致,生成的视频往往存在闪烁伪影。本文提出一种新的模型,可以产生高保真的头部视频,可以自由控制头部姿态和

02

ICML 23' | 对多重图进行解耦的表示学习方法

无监督多重图表示学习(UMGRL)受到越来越多的关注,但很少有工作同时关注共同信息和私有信息的提取。在本文中,我们认为,为了进行有效和鲁棒的UMGRL,提取完整和干净的共同信息以及更多互补性和更少噪声的私有信息至关重要。为了实现这一目标,我们首先研究了用于多重图的解缠表示学习,以捕获完整和干净的共同信息,并设计了对私有信息进行对比约束,以保留互补性并消除噪声。此外,我们在理论上分析了我们方法学到的共同和私有表示可以被证明是解缠的,并包含更多与任务相关和更少与任务无关的信息,有利于下游任务。大量实验证实了所提方法在不同下游任务方面的优越性。

04
领券