首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

1张照片 + 一段录音 = 能说话的视频!(AniTalker)

想象一下,你有一张好友的照片,突然间,这张照片里的人开始对你说话,表情丰富,就像真人一样。

这听起来像是科幻电影中的场景,但现在这已经成为现实。又有开源的AI模型能做到一段录音+一张照片=一个能说话的视频了

什么是AniTalker?

AniTalker它不仅仅关注嘴唇同步这样的口型动作,还能捕捉到面部表情和头部动作等非语言提示的复杂动态。这意味着,AniTalker生成的视频不仅嘴型准确,而且表情自然,动作流畅。

AniTalker如何工作?

AniTalker使用了一种称为“通用运动表示”的技术。通过自监督学习策略,AniTalker能够学习和重建目标视频帧中的微妙运动表现,同时通过度量学习发展一个身份编码器,有效地将身份信息和运动信息分离。这样做的好处是,生成的动画不会包含特定个体的身份信息,使得动画更加多样化和可控制。

项目地址:

https://x-lance.github.io/AniTalker/

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OpYMJAF_r_c2Cul1qKLFnNkg0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券