首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

LivePortrait:让照片人物表情动起来的开源图生视频模型,不使用SD,10秒钟就能生成人物表情动画

快手开源了其先进的图生视频模型LivePortrait,该模型使用了一种创新的隐式关键点框架技术,能在仅需10秒的时间内生成高质量的动态视频,这一突破性的速度显著降低了数字化人物创建的门槛,预示着实时视频处理领域的巨大潜力。

LivePortrait模型结合了外观特征提取器、规范隐式关键点检测器、头部姿势估计网络、表情变形估计网络、扭曲场估计器和生成器等多个关键组件。这些组件协同工作,能够将源图像的特征与驱动视频的动态特征结合,生成逼真的动画视频。与传统的稳定扩散方案相比,LivePortrait的生成方法不仅速度更快,还能更精确地控制动画中的细节,如眼角、嘴角等关键部位的运动,使得生成的人物动作和表情更为自然、流畅。

快手的这一开源举措不仅吸引了大量网友试用,更在技术和应用层面推动了图生视频技术的快速发展。用户可以利用开源代码轻松部署模型,生成自己的数字化人物视频,这种超快的生成速度使得LivePortrait在视频会议、社交媒体直播以及实时游戏动画等多个实时应用场景中展现了巨大的应用潜力。

此外,LivePortrait在训练过程中采用了先进的策略。模型的训练分为两个阶段:基础模型训练和拼接及重定向模块的优化训练。第一阶段从零开始,全面训练模型,使用8个NVIDIA A100 GPU进行了约10天的训练;第二阶段则专注于训练缝合和重定向模块,以确保生成的动画能够无缝融入原始图像,增强动画的逼真度。模型的训练数据极为丰富,覆盖了各种姿势和表情的高清视频,确保了生成动画的高质量和泛化能力。

然而,随着技术的发展,也引发了关于AI生成内容可能带来的社会风险的讨论。例如,腾讯近期宣布将进一步限制使用数字人进行直播的行为,明确将其列入低质量内容。这反映出市场对AI技术生成内容的潜在风险持续关注,尤其是在内容可控性和误导消费者方面的问题。因此,平台对于AI生成技术的应用政策也在不断收紧。

总的来看,快手开源的LivePortrait模型不仅在技术上取得了重要进展,也对图生视频的商业应用和社会影响提出了新的思考。随着技术的进一步成熟和社会应用的深入,未来图生视频技术将在多个领域展现更广阔的应用前景。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OpITSMMMRAMKIPmCjXZrWmLw0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券