前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >从深度图到点云的构建方式

从深度图到点云的构建方式

作者头像
3D视觉工坊
发布2020-11-19 16:46:32
2.3K0
发布2020-11-19 16:46:32
举报

本期我们将一起讨论如何将RGBD图像转换为3D空间中的点

我们将介绍什么是相机的内参矩阵,以及如何使用它将RGBD(红色、蓝色、绿色、深度)图像转换为3D空间。获取RGBD图像的方式有很多种,例如Kinect相机之类的系统,这些系统通过测量红外光的飞行时间来计算深度信息。但也有传闻称iPhone 12将LiDAR集成到其相机系统中。对于无人驾驶汽车而言,最重要的数据来源与汽车上的LiDAR以及标准RGB摄像头。在本文中,我们不会详细介绍如何获取数据。

图1 :(左)以u,v坐标表示的图像平面。每个像素都有指定的颜色和深度。(右)笛卡尔坐标x,y,z中的3D视图。

如果要了解3D环境中每个像素对应的内容,那么了解相机的属性就非常重要。相机的关键参数之一是焦距,它帮助我们将像素坐标转换为实际长度。大家可能看到过像“ 28 mm”这样的焦距,这其实是镜头与胶片/传感器之间的实际距离。

通过简单的几何关系(“相似的三角形”),我们可以轻松地从每个像素的u和d得出位置x。下图仅显示了x和u,但对y和v可以完全相同。对于针孔相机模型,x和y方向的焦距相同。对于带镜头的相机这个结论可能就不一定成立了,我们将在以后的文章中对此进行讨论。

图2:显示xz平面的投影(顶视图)。左侧是针孔照相机,镜头前有一个物体(从上方是相同的蓝色球),并在屏幕上显示。世界坐标系与照相机对齐,因此z轴延伸到照相机所看的方向。在右侧,从左侧开始的两个部分重叠的三角形分开以更加清楚。

从类似的三角方法中,我们立即获得:

通常fₓ和fᵧ是相同的。但是对于例如图像传感器的非矩形像素,镜头变形或图像的后处理,它们可能会有所不同。

综上所述,我们可以仅使用几何参数编写一段很短的Python代码,以将屏幕的坐标系转换为笛卡尔坐标系。

代码语言:javascript
复制
def convert_from_uvd(self, u, v, d):
    d *= self.pxToMetre
    x_over_z = (self.cx - u) / self.focalx
    y_over_z = (self.cy - v) / self.focaly
    z = d / np.sqrt(1. + x_over_z**2 + y_over_z**2)
    x = x_over_z * z
    y = y_over_z * z
    return x, y, z

在代码中(cₓ,cᵧ)是摄像机传感器的中心。请注意相机属性pxToMetre常数,利用这些参数可以在一定比例尺下以3D形式精确地显示图片。

当然,有一种更通用的方法可以完成所有这些操作。输入内参矩阵!这是一个包含先前讨论的相机属性(相机传感器的焦距和中心以及偏斜)的单个矩阵。在这里,我们要讨论如何使用它为我们完成上述转换。在下文中,我们将大写粗体字用于矩阵,将小写粗体字用于矢量,将普通脚本用于标量。

接下来,我们介绍齐次坐标。齐次坐标有助于我们将各种不同变换(平移,旋转和倾斜)编写为具有相同维数的矩阵。

以这种方式考虑它。在图2中,我们可以将图像平面移动到任何其他距离,例如从fₓ→2fₓ,并注意我们将其平移的因子h = 2。移位引入了简单的缩放比例,我们总是可以通过将u和v除以h作为返回值。

现在我们可以在齐次坐标上定义各种不同的操作,但是这些操作都保持最后一个维度值不变。

旋转矩阵R,平移矢量t和本征矩阵K组成了相机投影矩阵。它定义为从世界坐标转换为屏幕坐标:

注意[ R | t ]表示块符号,表示我们将R和列向量t = transpose {t₀,t₁,t 2}连接起来,或者换句话说,将其添加到R的右侧。如果我们想以另一种方式进行转换,则会遇到问题。我们对3x4矩阵求逆。但是大家会发现该矩阵的方阵扩展是可以求逆的。为此,我们必须在左侧增加1 / z(视差)才能满足方程式。4x4矩阵称为满秩本征/非本征矩阵。

让我们用最简单的情况验证上面所说的:相机原点和世界原点对齐,即Rt可以忽略,偏斜S为0,图像传感器居中。现在,相机矩阵的逆就是:

只看第一行就可以得出与开始时(方程1)完全相同的结论。使用等式的第二行和第三行对y和z同样适用。对于更复杂的内在矩阵,大家需要在进行此转换之前计算逆。由于它是一个上三角矩阵,因此有很多简单的办法可以处理这个问题:

现在,我们拥有了将深度图或RGBD图像转换为3D场景的所有工具,每个像素代表一个点(图3)。我们在此过程中有一些假设。其中之一是简化的相机模型:针孔相机。但是在现实世界中使用的相机会使用镜头,并且通常只能通过针孔模型进行估算。

图3:根据深度图(灰度)计算出的点云(绿色)

本文仅做学术分享,如有侵权,请联系删文。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-11-11,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 3D视觉工坊 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
图像处理
图像处理基于腾讯云深度学习等人工智能技术,提供综合性的图像优化处理服务,包括图像质量评估、图像清晰度增强、图像智能裁剪等。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档