首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

2017-CVPR-PointNet:Deep Learning on Point Sets for 3D Classification and Segmentation

这篇文章[1]主要提出了一种用于点云数据的神经网络模型,即 PointNet。点云在 3D 视觉中是一种重要的数据结构,其主要分为几何数据和属性数据。几何数据就是每个点的 x,y,zx,y,zx,y,z 坐标,而属性数据则是每个点的颜色等信息。这篇文章主要针对几何数据进行处理。由于 3D 点云这种不规则的数据格式,之前大多数深度学习方法都是将点云几何数据变换成规则的体素网格或者一系列 2D 图像的集合,但是这些方法的复杂度都太高,增加了很多不必要的计算。在这篇文章中,作者提出了一种新的用于处理点云几何数据的神经网络,它直接在点云数据上进行处理,并且很好地考虑了输入点的排列不变性。本文提出的 PointNet 模型,是一个统一的架构,可以用于各种点云任务,比如物体分类、语义分割等。虽然 PointNet 结构比较简单,但却是非常高效且有用的。从实验上来看,PointNet 展现出相当或超越 SOTA 的性能;从理论分析上来看,作者给出了 PointNet 的设计理念以及解释了 PointNet 为什么对扰动和噪声是鲁棒的。

02

Transformer是如何进军点云学习领域的?

这个工作来自于牛津大学、中国香港大学、中国香港中文大学和Intel Labs,发表于ICCV2021。我们知道,Transformer在近两年来于各个领域内大放异彩。其最开始是自然语言处理领域的一个强有力的工具。后来,在图像处理领域,Transformer由于其可以感知远距离的像素,从而学习到更全面的特征表示。并且这项工具已经被应用在多个二维图像处理任务中,例如目标检测、语义分割等。而将Transformer应用于三维点云相关的任务是一个必然的趋势。由于三维点云的不规则性和密度多样性,Transformer在点云数据上甚至具有更大的潜力。实际上,在早期的工作中就已经有将Transformer应用到点云相关的任务中,例如DCP利用Transformer对源点云和目标点云的互信息进行建模,实现输入点云对的同时感知。但是,彼时的Transformer并不是一个重点。这篇Point Transformer则是将Transformer应用到点云学习的一个标志性成果,其设计了一个Point Transformer网络,并展现了其在点云点特征提取和全局特征提取的优势作用。这使得这篇论文的工作有着更广阔的应用范围和潜力,为后续很多点云相关任务的研究提供了一个有力的工具和参考。

02
领券