首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

PointNet分享_1

这类方法首先在三维形状上提取手工特征, 进而将这些特征作为深度神经网络的输入,用以学习高层特征表示。其优势在于可以充分利用现有的低层特征描述深度学习模型。比如, Bu 等人首先将热核特征和平均测地距离等构成的低层特征通过 Bag-of-Feature 模型转化为中层特征,接着采用深度置信网络(DBN)从中层特征中学习高层特征表示, 并成功应用于三维形状检索与识别。 Xie 等人首先提取三维形状 Heat Kernel Signature 特征的多尺度直方图分布作为自编码机的输入,然后在每个尺度上训练一个自编码机并将多个尺度隐含层的输出连接得到特征描述子, 并在多个数据集上测试了该方法用于形状分类的有效性。这类方法的缺陷在于,其仍然依赖手工特征的选择与参数优化,因此在某种程度上损失了深度学习的优势,无法从根本上克服手工特征存在的问题。

01

[深度学习概念]·CNN卷积神经网络原理分析

本章将介绍卷积神经网络。它是近年来深度学习能在计算机视觉领域取得突破性成果的基石。它也逐渐在被其他诸如自然语言处理、推荐系统和语音识别等领域广泛使用。我们将先描述卷积神经网络中卷积层和池化层的工作原理,并解释填充、步幅、输入通道和输出通道的含义。在掌握了这些基础知识以后,我们将探究数个具有代表性的深度卷积神经网络的设计思路。这些模型包括最早提出的AlexNet,以及后来的使用重复元素的网络(VGG)、网络中的网络(NiN)、含并行连结的网络(GoogLeNet)、残差网络(ResNet)和稠密连接网络(DenseNet)。它们中有不少在过去几年的ImageNet比赛(一个著名的计算机视觉竞赛)中大放异彩。虽然深度模型看上去只是具有很多层的神经网络,然而获得有效的深度模型并不容易。有幸的是,本章阐述的批量归一化和残差网络为训练和设计深度模型提供了两类重要思路。

03

CVPR 2020 | 一种频域深度学习

深度神经网络在计算机视觉任务中取得了显著的成功。对于输入图片,现有的神经网络主要在空间域中操作,具有固定的输入尺寸。然而在实际应用中,图像通常很大,必须被降采样到神经网络的预定输入尺寸。尽管降采样操作可以减少计算量和所需的通信带宽,但它会无意识地移除冗余和非冗余信息,导致准确性下降。受数字信号处理理论的启发,我们从频率的角度分析了频谱偏差,并提出了一种可学习的频率选择方法,可以在不损失准确性的情况下移除次相关的频率分量。在下游任务中,我们的模型采用与经典神经网络(如ResNet-50、MobileNetV2和Mask R-CNN)相同的结构,但接受频域信息作为输入。实验结果表明,与传统的空间降采样方法相比,基于静态通道选择的频域学习方法可以实现更高的准确性,同时能够减少输入数据的大小。具体而言,在相同的输入尺寸下,所提出的方法在ResNet-50和MobileNetV2上分别实现了1.60%和0.63%的top-1准确率提升。当输入尺寸减半时,所提出的方法仍然将ResNet-50的top-1准确率提高了1.42%。此外,我们观察到在COCO数据集上的分割任务中,Mask R-CNN的平均精度提高了0.8%。

04

[计算机视觉论文速递] 2018-04-23

Abstract:我们介绍和解决了Zero-Shot 目标检测(ZSD)的问题,它旨在检测训练期间未观察到的物体类别。我们与一组具有挑战性的对象类一起工作,而不是将我们限制在类似和/或细粒度的类别中。之前的zero-shot classification工作。我们遵循一个原则性的方法,首先适应ZSD的视觉语义嵌入。然后我们讨论与选择背景类相关的问题,并激发两种背景感知方法来学习鲁棒检测器。其中一个模型使用固定的背景类,另一个基于迭代的潜在分配。我们还概述了与使用有限数量的训练类别相关的挑战,并提出了基于使用大量类别的辅助数据对语义标签空间进行密集采样的解决方案。我们提出了两种标准检测数据集 - MSCOCO和VisualGenome的新型分割,并讨论了广泛的实证结果,以突出所提出的方法的优点。我们提供有用的insights into the algorithm,并通过提出一些开放问题来鼓励进一步的研究。

02
领券