21世纪经济报道记者 章驰 实习生 左永川
当地时间 8 月 5 日,谷歌 DeepMind 发布了其“世界模型”(World Model)的最新版本——Genie 3。这是首个实时交互的通用世界模型,仅需一句话就能生成动态3D虚拟环境,支持长达数分钟的沉浸式探索。负责人表示,Genie 3可以用文本生成交互式世界,实现24fps实时交互,720p分辨率,还能持续数分钟一致性。
与前代模型(如 Genie 1/2)和视频生成模型相比,Genie 3是第一个允许实时交互的世界模型,同时其一致性和真实感也得到了提升。