首页
学习
活动
专区
圈层
工具
发布

地瓜机器人牵头发布DreamLifting:3D生成“跃新”

在影视特效、游戏开发、自动驾驶仿真等领域对高质量3D资产需求激增的当下,传统人工建模成本高、效率低的痛点日益凸显。

11月3日,地瓜机器人联合地平线机器人实验室、南开大学正式发布3D生成新范式DreamLifting,通过创新的轻量级高斯资产适配器(LGAA),首次实现端到端的材质与几何协同生成,不仅攻克了真实感材质生成难题,更将高保真3D资产的生成效率压缩至30秒内。目前项目官网已上线,核心代码即将开源,此举被业内视为开启3D内容生产“降本增效”革命的关键突破。

从“分治生成”到“协同创作”

长期以来,3D资产生成陷入“几何与材质难以兼顾”的困境。原生3D几何生成方法仅能产出简单顶点色资产,应用场景受限;依赖2D扩散模型生成材质贴图的方案,则频繁出现贴图错位、光照不匹配等问题。地瓜机器人算法负责人指出,传统方案本质是“几何与材质分治生成”,而DreamLifting的核心创新在于构建了“先验知识协同利用”的新路径。

该技术以多视图扩散模型为基础,通过LGAA模块实现2D大模型知识向3D生成能力的高效迁移。LGAA包含三大核心组件:Wrapper模块负责从多视图图像、材质扩散模型中挖掘几何与材质先验;Switcher模块实现不同先验的逐层精准对齐;Decoder模块则解耦出带有物理渲染材质的2D高斯资产。这种设计让模型在仅使用69k多视图样本训练的情况下,就能直接输出带UV贴图、支持物理渲染的高保真3D资产,彻底告别“先做几何再贴材质”的繁琐流程。

地瓜机器人主导:以“轻量创新”撬动行业效率革命

作为此次技术突破的牵头方,地瓜机器人在项目中承担了核心框架设计与工程化落地任务。据介绍,DreamLifting的“轻量级”特性极具颠覆性——通过克隆并冻结预训练2D扩散模型层结构,仅插入零初始化可学习卷积层,既最大程度保留了现有大模型的先验知识,又大幅降低了训练成本。

据悉,DreamLifting兼容MVDream、DreamView等多种多视图扩散模型基座,企业可根据现有技术栈灵活适配。目前团队已完成从模型训练到资产导出的全流程工具链开发,用户生成的3D资产可直接用于Blender、Unreal Engine等主流创作软件,无需额外调整。

在业内专家看来,DreamLifting的问世将对多个行业产生连锁反应。在游戏行业,以往需要数名美术师耗时数天制作的高精度角色、场景资产,未来通过文本或参考图输入,30秒即可生成初稿,开发成本有望降低50%以上。自动驾驶领域,该技术可快速生成大量带真实材质的交通场景、障碍物模型,加速仿真测试数据集的构建效率。影视特效制作中,物理渲染材质的端到端生成能力,将大幅减少后期光照调整的工作量,缩短特效制作周期。

业内专家指出,DreamLifting的价值不仅在于技术突破,更在于开创了“借力2D大模型生态发展3D生成”的新范式。“当前2D扩散模型的生态已非常成熟,DreamLifting相当于为3D生成搭建了‘借船出海’的桥梁。”

  • 发表于:
  • 原文链接https://page.om.qq.com/page/O1IVx0tLcL1YVIDtKN3e8OgQ0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

领券