近日,据科技媒体The Verge爆料,谷歌DeepMind正组建专业团队,致力于开发“世界模型”以模拟真实物理环境,目标直指通用人工智能(AGI)。
前OpenAI Sora项目联合负责人Tim Brooks已被任命为谷歌视频生成和世界模拟器工作的负责人。他曾在X平台上公布了两个面向研究工程师和科学家的职位空缺,旨在招募人才解决“大规模”训练、数据整理以及与多模态语言模型集成等关键问题。
这一举措被视为谷歌在AGI领域的重要一步。新团队将与谷歌的其他AI团队,如Gemini、Veo和Genie合作,共同解决挑战性问题。其中,Veo是谷歌的视频生成模型,Gemini可以分析图片、生成文本,模拟游戏和3D环境,而Genie则可以生成巨大多变的可玩性3D世界。
在世界模型开发领域,谷歌并非孤军奋战。其他公司,如李飞飞创建的World Labs、以色列的Decart和Odyssey等也在积极开发世界模型。这些模型具有巨大的潜力,可以用于创建交互性媒体内容,如游戏和电影,以及为机器人提供逼真的模拟环境。
据悉,世界模型是一种能够理解和模拟现实世界的AI系统。通过预训练扩展视频和多模态数据,并集成多模态语言模型,世界模型可用于为视频游戏和电影创建实时交互式媒体环境,为机器人和其他AI系统提供逼真的训练场景,甚至可能推动通用人工智能的发展。
领取专属 10元无门槛券
私享最新 技术干货