在前段时间 Sora 掀起的 AI 生成视频内容热潮中,关于元宇宙终于将在 Sora 正式发布后迎来新生的讨论也甚嚣尘上。但就像每次关于元宇宙的 " 变革 " 都雷声大雨点小一样,随着 Sora 正式上线的时间久久未定,这轮因大饼而短暂兴起的讨论也逐渐开始消退。Sora 等平台生成的内容究竟可以算作元宇宙吗?真正符合元宇宙内容生成需求的解决方案是什么?现阶段的 AI 技术又能在多大程度上推动元宇宙的发展?
在视频领域,AI 对算力的要求远超以往的大型语言模型,因为视频数据不仅包含更高的时间维度和空间维度,而且为了捕捉视频中的动态信息,通常需要更为复杂的模型结构,所以算力资源首先就成为 AI 视频发展的重要门槛。
除此之外,视频大模型的开发通常需要跨领域合作,涉及图像识别、目标检测、图像分割、语义理解等多种技术的整合。而除了这些现实问题,此类产品在元宇宙内容生成上的局限性更是短时间内难以克服——最关键的问题就是,这些 AI 生成的视频内容是否真正符合元宇宙的定义?
元宇宙的核心体验依赖于用户的互动性和沉浸感,但 Sora 所生成的视频内容大多为线性且缺乏互动性,这与元宇宙追求的可互动的虚拟环境存在明显差异。此外,元宇宙的另一个显著特点是高度的用户参与度,用户可以在虚拟世界中自由创造、交易和体验。但目前由 AI 主导生成的内容主要源于机器,用户的个性化创作究竟占到了多少比例,始终存在争议。同时对已生成内容的定制化修改也是一大痛点。
领取专属 10元无门槛券
私享最新 技术干货