随着科技的不断发展,视频创作工具也在不断升级。6月21日,快手可灵大模型又进行了一次重大更新,引入了两项新功能:图生视频和视频续写。这些功能的出现,为视频创作领域带来了新的可能性。我们都知道快手方面在 6 月 6 日正式发布旗下可灵视频生成大模型,率先开放的是 " 文生视频 " 能力,不但效果对标 Sora、且在快影 App 同步开放邀测体验,目前累计已有约 14 万人排队申请。 现在仅仅过去半个多月又进行了新一轮更新,进度不可谓不快!
快手可灵官网
地址:详情请点击此处进入可灵官网
快手可灵大模型又更新2项新功能
1.可灵图生视频功能:
图生视频功能支持将任意静态图像转化为5秒钟的动态视频。这个过程可以通过添加不同的文本提示词来控制图像中物体的运动,从而实现丰富的视觉叙事。例如,用户可以上传一张蒙娜丽莎的图片,通过提示词控制,让蒙娜丽莎戴上墨镜并进行眼神交流。
2.视频续写功能:
视频续写功能则允许用户对已生成的视频(包括文生视频和图生视频)进行一键续写。每次续写可以生成约5秒的内容,通过多次续写,最终可以生成最长约3分钟的视频。这个功能的亮点在于集成了文本控制机制,让用户可以通过自定义提示词为每段视频续写注入个性化创意。例如,用户可以控制视频中的场景变换,如让古堡视频片段在日夜之间变换,并添加灯光效果。
快手可灵大模型:DiT架构提升视频生成质量和真实感
快手可灵大模型使用了DiT架构,并在隐空间编/解码、时序建模等方面进行了升维处理。这使得模型能够精确捕捉视频帧内的局部空间特征以及跨帧的时间动态特征,从而更全面地理解和再现视频中的运动信息。因此,从快速移动的物体、剧烈变化的场景,到复杂的人物动作,可灵都能精确捕捉,生成的视频内容动态性十足,同时具有很高的物理世界真实感。
总结
快手可灵大模型的新功能升级为视频创作领域带来了新的可能性。图生视频和视频续写功能的出现,不仅提升了模型的创作能力,还扩展了其在视频生成领域的应用范围。这些创新功能的出现,为用户提供了更多的创作自由度和创意空间,开启了视频创作的新纪元。
领取专属 10元无门槛券
私享最新 技术干货