前往小程序,Get更优阅读体验!
立即前往
发布
社区首页 >专栏 >开源的神!可灵平替 SkyReels: 混元升级版 图生视频

开源的神!可灵平替 SkyReels: 混元升级版 图生视频

作者头像
疯狂的KK
发布2025-02-25 10:08:20
发布2025-02-25 10:08:20
2180
举报
文章被收录于专栏:Java项目实战

SkyReels 是一个昆仑万维开源的,支持文本到视频(Text-to-Video)和图像到视频(Image-to-Video)的生成。它基于高质量的影视片段数据进行微调,并在性能和效率上表现出色,在文生视频模型中实现了最先进的 (SOTA) 性能,可与 Kling 和 Hailuo 等专有模型相媲美。

SkyReels V1 提供了两种模型:

  • SkyReels-V1-Hunyuan-I2V:图像到视频模型,分辨率为 544x960,视频长度为 97 帧,帧率为 24fps。
  • SkyReels-V1-Hunyuan-T2V:文本到视频模型,分辨率为 544x960,视频长度为 97 帧,帧率为 24fps。

本地工作流视频

SkyReels V1 是第一个也是最先进的开源、以人为本的视频基础模型。SkyReels V1 对 O(10M) 高清影视剪辑进行精细调优,提供三大关键优势:

  1. 开源领导力:我们的文本到视频模型在开源模型中实现了最先进的 (SOTA) 性能,可与 Kling 和 Hailuo 等专有模型相媲美。
  2. 高级面部动画:捕捉 33 种不同的面部表情和 400 多种自然动作组合,准确反映人类情绪。
  3. 电影照明和美学:根据高质量的好莱坞级电影和电视数据进行训练,生成的每个帧在构图、演员定位和摄像机角度方面都表现出电影级质量。

SkyReels V1 在开源文本到视频模型中表现出色,整体得分为 82.43,高于其他模型(如 VideoCrafter-2.0 VEnhancer 和 CogVideoX1.5-5B)。它在动态程度和多目标处理等关键指标上得分最高,表明其在复杂视频生成任务中的优越性。

SkyReels加上混元Video则可以实现图生视频的高精度视频和加速模型,并且实际测试的话,很低的分辨率就可以实现图生视频加上目前本地测试的时长也是完全可以接受的,而且测试的图生视频超级的清晰,不会出现扭曲,模糊的场景,过多的我们就不介绍,直接安装。

1.首先拖入工作流

2.下载对应的模型

a.官方的图生视频模型,相当于大模型,需要放在大模型unet的文件夹

b.对应的VAE,这里搭配的也是跟官方精度一致的混元F16 Vae,放在vae文件夹即可

c.Lora用到了两个,放在Lora文件夹即可

整个过程并没有太多的模型需要下载,已经为大家整理好,直接拖入使用

3.参数设置

由于官方推荐的分辨率就是544x960,长度需要看本地的显卡显存大小,虽然说是97帧,但是为了速度,我们缩小到50帧左右就可以,所以我给到了57帧,但是视频的帧率我给到了30帧,希望更清晰一点

实际测试开了多个AI应用的前提下,846S完事,目前测试多图多次测试,确实从表现来说完全可以追的上可灵,增加帧率和时长后,顶多就是消耗点时间而已。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-02-22,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 赵KK日常技术记录 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档