每个视频的深度基础真实存储在16位灰度PNG图像中: 深度值是从z缓冲区获得的相机平面距理(https://en.wikipedia.org/wiki/Z-buffering)。它们对应于摄像机坐标空间中每个像素的z坐标(而不是与摄像机光学中心的距离)。我们使用了一个655.35米的固定远平面,即像天空像素这样的无穷远点被限制在655.3米的深度。这允许我们将Z值截断并归一化为[0; 2 ^ 16 - 1]整数范围,使得我们的单通道PNG16深度图像中的像素强度为1对应于距摄像机平面1cm的距离。以厘米为单位的深度图可以通过单线程(假设“import cv2”)以numpy和OpenCV直接加载到Python中 ref http://www.europe.naverlabs.com/Research/Computer-Vision/Proxy-Virtual-Worlds
图片内容如下:
彩色图到学习的深度图到学习回彩色图; 深度图到学校的彩色图到学习回深度图