前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >2.3k Star!腾讯又悄悄地开源了一款音频驱动的真实肖像动画合成框架!

2.3k Star!腾讯又悄悄地开源了一款音频驱动的真实肖像动画合成框架!

作者头像
Python兴趣圈
发布2024-04-13 20:12:13
1310
发布2024-04-13 20:12:13
举报
文章被收录于专栏:翩翩白衣少年翩翩白衣少年

图像和视频处理技术的发展日新月异,每时每刻都在变化,都在进步,也激发了各大研究人员和AI实验室的创造力和可能性。

而近日发现了一款开源项目: AniPortrait,可以实现肖像到视频的生成。看开源作者标注机构是Tencent,它又一次悄摸摸的开源了一款AI项目。

该项目仅上线不到一周,即揽获了2.3k Star。相当的爆火了。

项目介绍

AniPortrait 是一个由音频驱动的真实肖像动画合成框架,能够生成高质量的面部动画,并提供人脸再现功能。

GitHub:https://github.com/Zejun-Yang/AniPortrait

通过使用多种预训练模型,包括 StableDiffusion V1.5、sd-vae-ft-mse、image_encoder和wav2vec2-base-960h,该项目实现了从音频和参考肖像图像驱动的高质量动画生成。

通过提取音频中的3D中间表现形式并转换为2D面部标志,进而利用扩散模型和运动模块生成逼真且时间上连贯的肖像动画。

重点功能:
  • • 自我驱动的视频生成
  • • 面部再现
  • • 音频驱动的视频生成

使用方法

通过下载官方项目包,并完成python环境和cuda相应版本的安装。

下载好项目依赖的预训练模型,然后根据自己的需求输入相关指令生成。具体可查看项目文档。

应用场景

AniPortrait 框架在计算机视觉、模式识别、图形学以及图像和视频处理等多个学科领域具有广泛的应用前景。

其优越的面部动画生成能力可在影视制作、虚拟人物设计、面部运动编辑等领域发挥重要作用。

总结

AniPortrait 的推出为音频驱动的真实肖像动画合成领域注入了新的活力,展现了出色的技术实力和创新能力。

其强大的功能和广泛的应用前景使其成为当前数字图像处理领域的一项重要工具。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-03-31,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Python兴趣圈 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 项目介绍
    • 重点功能:
    • 使用方法
    • 应用场景
    • 总结
    相关产品与服务
    媒体处理
    媒体处理(Media Processing Service,MPS)是一种云端音视频处理服务。基于腾讯多年音视频领域的深耕,为您提供极致的编码能力,大幅节约存储及带宽成本、实现全平台播放,同时提供视频截图、音视频增强、内容理解、内容审核等能力,满足您在各种场景下对视频的处理需求。
    领券
    问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档