深度估计已经成为计算机视觉中一个快速发展的领域,最近有两个项目值得关注:一个是苹果开源的 Depth Pro,基于 Transformer 架构单目深度估计模型,可在 0.3 秒内生成一张 225 万像素的深度图。
另一个是基于扩散模型的 LOTUS,在两个关键几何感知任务(即零样本深度和法线估计)中实现了 SoTA 性能,在复杂场景下表现突出,并且完整代码和模型全部开源。
深度估计的应用场景非常广泛,能用于各种需要理解图像深度的应用,像是自动驾驶汽车、虚拟现实、3D 建模等行业都需要该技术的参与。
领取专属 10元无门槛券
私享最新 技术干货