今天为大家分享几组重要的人工智能新闻:
海螺视频更新
本周,海螺图像转视频功能正式发布,允许同时输入图像和提示词,确保生成的结果符合用户的预期。和其他模型不同的是,海螺可以精确识别图像中的主要物体,并根据指令生成精确的动作和多样化的镜头移动方式。此外,用户还可以选择不同的艺术风格,生成富有创意的视频。
海螺模型每次可生成一段持续6秒钟的短视频,使用连续画面则可以生成一段连续完整的视频。在和Runway、Gen3、Luma AI等模型的对比中,海螺模型能够生成更加生动和真实的动作。在对真实世界运动规律模拟方面,海螺和Gen3模型都具备行业领先的水平。
Video Ocean
登录到后台,可以选择三种视频生成模式,或者参考社区优秀的作品。例如选择角色生成视频模式,上传一张人物图像作为参考,图像的大小和位置均可调整。然后添加一段提示词,设置创新强度,点击生成视频即可。Video Ocean支持同时生成多段视频,风格强度和动作强度也可手动设置。此外该模式还支持添加反向提示词。
图像转视频功能可以将静态图转换为动态画面,且可以调整动作幅度。文本转视频功能仅支持英文提示词输入,且可以生成不同风格的视频。
Runway
本周,Runway Gen3推出了首尾帧功能,用户只需提供两张图像即可生成带有过渡效果的视频。登录到Runway,分别添加两张图像作为首帧和尾帧,点击生成视频即可。使用风格类似且连续的图像就能够合成一段炫酷的视频。
Rendernet更新
本周,虚拟网红生成平台Rendernet推出了Video Anyone功能,用户只需提供一张图像即可生成连续一致性的视频。目前该功能已经发布,登录到Rendernet即可尝试上传一张制作好的网红图像,输入和图像相符合的提示词,点击生成视频即可。通过设置镜头的移动方式和人物的动作,即可输出一段超真实的短视频。该功能可以基于静态图像合成生动的网红视频,大家可以尝试。
该功能基于图像转视频模型创建,每次可生成一段5秒钟的视频。使用Rendernet的提示词结构样本,则可以生成更真实的效果。
Pyramid Flow
近期,北大和快手开源了新的视频模型Pyramid Flow,可生成1280p分辨率、持续10秒、24FPS的视频。Pyramid Flow基于流匹配的高效自回归视频生成模型,支持文本生视频、图像生视频。该模型使用公开数据训练,性能可与先进的商业视频模型相媲美。目前该模型已经在Hugging Face发布,大家可以了解详情。
Inworld
近期,AI游戏引擎开发公司Inworld向外界展示了一段游戏画面。本段游戏基于人工智能组件开发,也将引领未来游戏的方向。之前游戏中,NPC的动作和行为都会按照固定路线触发攻击和事件,而Inworld开发的游戏引擎则允许敌对角色根据战场形势动态调整战术,让游戏体验不再单调。也就是说,NPC将成为具有思考能力的角色,通过决策算法、感知系统和自适应学习让自己变得更聪明。此外,AI代理还可以为队友提供协助和战术支持,让游戏变得更加有趣。
神笔马良
领取专属 10元无门槛券
私享最新 技术干货