2024年2月16日凌晨,OpenAI发布文本生成模型Sora,并附上视频和提示词。Sora 是一个AI模型,可以根据文本指令创建现实且富有想象力的场景。发布的博客文章中称,Sora能够根据文本指令生成长度长达 60 秒的视频,并能够提供具有多个角色、特定类型的运动和详细背景细节的场景。
OpenAI发布的技术报告称,OpenAI探索了对视频数据的生成模型进行大规模训练。具体来说,OpenAI联合训练了文本条件下的扩散模型,在不同持续时间、分辨率和宽高比的视频和图像上进行,并利用了一种变压器架构,该架构能够操作视频和图像潜在代码的时空补丁。Sora大模型能够生成一分钟的高保真视频,而且结果表明,扩大视频生成模型的规模是朝向构建物理世界通用模拟器的一个有前景的路径。
请欣赏由Sora模型生成的AI视频。
视频提示语:“美丽的雪覆盖的东京城市熙熙攘攘。摄像机穿过繁忙的城市街道,跟随着几个人享受美丽的雪景和在附近摊位购物。美丽的樱花瓣随风飘飞,与雪花一同飞舞。”
视频提示词:参观艺术画廊,里面有许多不同风格的美丽艺术品。
视频提示词:一位时髦的女士走在东京的街道上,街道被温暖发光的霓虹灯和动态的城市标志填满。她穿着一件黑色皮夹克,一条长红裙和黑色靴子,手拿一个黑色手提包。她戴着太阳镜和红色口红。她走路时既自信又随意。街道潮湿且具有反射性,创造出五彩斑斓灯光的镜面效果。许多行人在街上来来往往。
小编留言:AI已经具备仿真潜力,“以假乱真”的时代已经开启,你的智商准备好了吗?
领取专属 10元无门槛券
私享最新 技术干货