华裔科学家李飞飞创立的空间智能先锋企业 World Lab 近期公布了一项突破性进展:仅凭单张图像,即可构建并探索三维世界。该公司的人工智能系统赋予用户前所未有的能力,使他们能够踏入任何图像内部,以三维视角自由探索其内在世界。
值得注意的是,这个由 AI 生成的 3D 世界不仅限于图像本身的内容,更是一个充满交互性的全新空间。虽然目前主要通过 WASD 键和鼠标进行导航,但未来用户或许能借助 XR 头显,享受更加沉浸式的探索体验。
该 3D 场景在浏览器中实时渲染,用户可自由调整相机效果和模拟景深,甚至能够改变色彩、动态调节背景光影,并在场景中自由添加新元素。与以往生成模型仅预测像素不同,该系统直接预测并构建出完整的 3D 场景。因此,一旦场景生成,其状态将保持稳定,无论用户如何转身或回望,背后的景色都保持不变。
这些 3D 世界遵循着 3D 几何的基本物理规则,呈现出一种坚实且深邃的真实感,与以往 AI 生成的视频所带有的梦幻色彩截然不同。
目前,这仅是项目的早期预览阶段。李飞飞及其团队正致力于提升生成世界的大小、保真度,并探索更多用户交互的新方式,以期为用户带来更加丰富、真实的 3D 探索体验。
领取专属 10元无门槛券
私享最新 技术干货