转载自:港中深网络与AI系统实验室


论文速递
CVPR'26——面向高反光、透明与弱纹理物体3D重建的大规模数据集
近日,香港中文大学(深圳)网络与人工智能系统实验室(NAIS Lab)团队在 CVPR 2026 上发表的研究《3DReflecNet: A Large-Scale Dataset for 3D Reconstruction of Reflective, Transparent, and Low-Texture Objects》获得了所有审稿人满分评价被大会以oral规格录用。这一成绩反映了学术社区对于解决复杂非漫反射材质 3D 重建难题的迫切需求与高度共识。 本论文第一作者为博士生梁志成,指导老师为理工学院王方鑫教授、崔曙光教授。研究团队成员还包括港中深余昊毅、李博言、曹子健、龚天翼,首都师范大学张大猷,以及南加州大学刘俊华。
1
会议介绍
IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR) 是全球计算机视觉与模式识别领域的顶级学术会议,在全球人工智能学术界和工业界享有盛誉。CVPR 2026 将于美国丹佛举办。本届大会共收到创纪录的 16,092 篇投稿,其中 4,090 篇被接收,录取率为 25.42%。
2
论文速览
背景介绍
近年来,多视角3D重建技术(如SfM, MVS, NeRF, 3DGS)取得了显著进展,极大提升了数字孪生与场景渲染的保真度 。然而,现有主流算法的成功大多建立在两大核心物理假设之上:“光度一致性”(Photometric Consistency)和“存在独特的几何纹理特征”。 当处理现实世界中极具代表性的高反光金属、透明玻璃以及光滑无纹理的陶瓷等复杂材质时,这些假设会被瞬间打破。算法往往会出现位姿估计失败、几何结构扭曲或严重的渲染伪影。虽然工业界与学术界对此备受关注,但当前主流的数据集(如DTU, CO3D等)多以漫反射物体为主,难以全面支撑非漫反射材质的算法评估与模型迭代 。

图 1 在反射或透明表面上,轻微的位姿估计误差也会导致多视角下几何结构的不一致与显著的渲染伪影。
核心发现
传统研究常将重建失败归因于算法调参或特征提取能力不足,而本研究通过物理模型推演指出:算法失效的根本原因在于其简化的特征匹配逻辑与现实世界复杂的全局光线传输机制之间存在结构性冲突 。 如图2所示,研究团队系统梳理了材质特性对现有算法基础假设的破坏路径:

图 2 随着材质金属度(Metallic)、粗糙度(Roughness)、折射率(IOR)和透射率(Transmission)的变化,现有算法在重建质量上出现了系统性的衰退。
研究介绍
为填补这一领域的空白,团队推出了 3DReflecNet 框架。如图3所示,这是一个体量达 22 TB 的合成-真实混合(Hybrid)超大规模数据集,专为应对非漫反射物体的感知与重建挑战而设计。

图 3 3DReflecNet 包含极其丰富的几何拓扑与逼真的物理材质组合
实验结果
在 3DReflecNet 的支持下,团队对五大核心 3D 视觉任务进行了基准测试,客观展现了当前技术的性能瓶颈。

图4 相机姿态估计结果

图5 新视角合成结果:我们的数据集在Diffuse材质上表现良好的算法,在Transparent和Metallic材质上出现了严重的结构缺失和悬浮物堆砌。
研究意义和展望
团队提出的 3DReflecNet 首次系统化、规模化地将复杂材质物体的光学特性与 3D 重建算法的结构性短板进行了量化映射。该满分工作的核心意义在于:它不仅为社区提供了一个高质量的数据基座,更明确指出了下一代 3D 视觉系统必须从单纯的“像素色彩拟合”向融合全局光线传输机制的“物理感知(Physically-aware)”方向演进。
此外,基于大型视觉-语言模型(VLLM)构建的高达 12.6 万条精细物理与语义结构化标注,使该数据集能够平滑支持未来的生成式 3D 视觉任务(如材质感知的 Text-to-3D、图像重光照编辑等),为构建更具鲁棒性的现实世界数字孪生系统铺平了道路 。
参考文献
港中深NAIS Lab介绍
香港中文大学(深圳)网络与人工智能系统实验室(NAIS Lab)成立于2021年,致力于网络通信,人工智能与系统的前沿研究,主要研究方向包括多媒体网络与系统,人工智能赋能网络与通信,云边端协同计算等等,在SIGCOMM、NSDI、CVPR、TMC、TON、TVCG、INFOCOM、AAAI等顶级会议期刊发表论文100余篇。实验室主页详见:https://naislab.cn/ 及
https://mypage.cuhk.edu.cn/academics/wangfangxin/.
本文系学术转载,如有侵权,请联系CVer小助手删文