首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

分享一个最近很火的! 开源!视频对口型AI模型:LatentSync

AI对口型在短视频平台有很多有趣的玩法,比如让小猫唱歌!让小朋友玩梗。除此之外无论是电影、短视频,还是直播,口型同步(lip sync)技术也是AI很重要的发展领域。

今天给大家分享一个字节开源的AI对口型模型:LatentSync !

目前在github上已收到2k⭐

什么是 LatentSync?

LatentSync 是基于音频条件的潜在扩散模型(latent diffusion models)的端到端口型同步框架。

它利用了强大的 Stable Diffusion 技术,直接建模复杂的音视频相关性,而无需任何中间运动表示。这与以往基于像素空间扩散或两阶段生成的扩散基口型同步方法截然不同。

简单来说,LatentSync 能够让视频中的人物口型完美地与音频同步,而且效果非常自然、逼真。

它不仅能够处理真实人物的视频,还能应对动漫角色的口型同步,这在以往是非常难以实现的。(大家这时候是不是想到了各种整活的点子了!)

惊艳的演示效果

LatentSync 的演示视频展示了其强大的功能。无论是真实人物的视频,还是动漫角色的视频,口型同步的效果都非常出色。

你可以看到,人物的口型与音频完美匹配,而且整个视频看起来非常自然,没有丝毫的违和感。

效果看起来还是很不错的,最重要的是这个是开源的,想自己玩玩整活的朋友快来试试吧!

地址:

https://github.com/bytedance/LatentSync

好了,今天的内容就分享到这里希望你们喜欢!欢迎关注、点赞和分享

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OLyCC8OpxVqPhyqhoH2M0PIg0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券