在目标检测中使用步幅为1的最大池层的目的是什么 - 腾讯云开发者社区

您找到你想要的搜索结果了吗？

是的

没有找到

业界 | OpenMMLab 第二版发布：吸引业界「目光」的史上最完整的目标检测工具箱

一文搞懂卷积神经网络（CNN）的原理（超详细）

卷积神经网络（Convolutional Neural Network，CNN）是一种在计算机视觉领域取得了巨大成功的深度学习模型。它们的设计灵感来自于生物学中的视觉系统，旨在模拟人类视觉处理的方式。在过去的几年中，CNN已经在图像识别、目标检测、图像生成和许多其他领域取得了显著的进展，成为了计算机视觉和深度学习研究的重要组成部分。

04.卷积神经网络 W3.目标检测

对整张图片进行卷积操作，一次得到所有预测值，如果足够幸运，神经网络便可以识别出目标的位置

详细介绍卷积神经网络（CNN）的原理！！

卷积神经网络（Convolutional Neural Network，CNN）是一种在计算机视觉领域取得了巨大成功的深度学习模型。它们的设计灵感来自于生物学中的视觉系统，旨在模拟人类视觉处理的方式。在过去几年中，CNN已经在图像识别、目标检测、图像生成和许多其他领域取得了显著的进展，成为了计算机视觉和深度学习研究的重要组成部分。

卷积神经网络CNN（convolutional）

卷积运算：原图像*卷积核=新图像，经常用来做边缘检测人造核：手动指定权重，改善效果

【个人整理】faster-RCNN的核心构件——RPN区域推荐网络（二）

前言：faster-RCNN是区域卷积神经网络（RCNN系列）的第三篇文章，是为了解决select search方法找寻region proposal速度太慢的问题而提出来的，整个faster-RCNN的大致框架依然是沿袭了fast-RCNN的基本能结构，只不过在region proposal的产生上面应用了专门的技术手段——区域推荐网络（region proposal network，即RPN），这是整个faster最难以理解的地方，本文也将以他为重点进行说明。鉴于篇幅较长，本次系列文章将分为3篇来说明：

Anchor Free的目标检测方法--FCOS

全卷积的 one-stage目标检测器（FCOS)，对每个像素进行预测的方式来解决目标检测问题，类似于语义分割。FCOS 不需要 anchor box，同时也不需要 proposals，由于消除了对预定义 anchor 的依赖，因此避免了与 anchor box相关的复杂计算，同时还避免了与 anchor相关的所有超参数，例如：尺寸、宽高比、数量等，通常这些参数对最终检测性能非常敏感。FCOS 优于之前的 anchor-based one-stage detectors。

值得收藏！基于激光雷达数据的深度学习目标检测方法大合集（下）

这是一个称为FVNet的框架，从点云生成3D前视图提议和目标检测。它包括两步：生成前视图提议和估计3D边框参数。

deeplearning.ai课程笔记--目标检测

这篇是看完吴恩达老师的 deeplearning.ai 课程里目标检测课程的学习笔记，文章的图片主要来自课程。

Encoder-Decoder with Atrous SeparableConvolution for Semantic Image Segmentation

深度神经网络采用空间金字塔池化模块或编解码器结构进行语义分割。前者通过多速率、多有效视场的过滤或池化操作，能够编码多尺度背景信息;后者通过逐步恢复空间信息，能够捕获更清晰的物体边界。在本研究中，我们建议结合这两种方法的优点。具体来说，我们提出的模型DeepLabv3+扩展了DeepLabv3，通过添加一个简单但有效的解码器模块来细化分割结果，特别是沿着对象边界。我们进一步探索了Xception模型，并将深度可分离卷积应用于Atrous空间金字塔池和解码器模块，从而获得更快、更强的编码器-解码器网络。我们在PASCAL VOC 2012和Cityscapes数据集上验证了该模型的有效性，在没有任何后处理的情况下，测试集的性能分别达到了89.0%和82.1%。

地平线提出AFDet：首个Anchor free、NMS free的3D目标检测算法

在嵌入式系统上运行的高效点云3D目标检测对于许多机器人应用（包括自动驾驶）都非常重要。大多数以前的工作试图使用基于Anchor的检测方法来解决它，这有两个缺点：后处理相对复杂且计算量大；调整Anchor点参数非常棘手，并且是一个tricky。本文是第一个使用AFDet（ anchor free and Non-Maximum Suppression free one stage detector）来解决这些缺点的公司。借助简化的后处理环节可以在CNN加速器或GPU上高效地处理整个AFDet。并且，在KITTI验证集和Waymo Open Dataset验证集上，AFDet无需花哨的技巧，就可以与其他Anchor-based的3D目标检测方法竞争。

Spatial Attention Pyramid Network for Unsupervised Domain Adaptation

无监督域适配在各种计算机视觉任务重很关键，比如目标检测、实例分割和语义分割。目的是缓解由于域漂移导致的性能下降问题。大多数之前的方法采用对抗学习依赖源域和目标域之间的单模式分布，导致在多种场景中的结果并不理想。为此，在本文中，我们设计了一个新的空口岸注意力金字塔网络来进行无监督域适配。特别的，我们首先构建了空间金字塔表示来获得目标在不同尺度的内容信息。以任务指定的信息为引导，在每个尺度上，我们组合了密集的全局结构表示和局部纹理模式，有效的使用了空间注意力截止。采用这种方式，网络被强迫关注内容信息由区别力的地方来进行域适配。我们在各种由挑战性的数据集上进行了昂贵的实验，对目标检测、实例分割和语义分割进行了域适配，这证明了我们的方法比最佳的方法有了很大的提升。

R-FCN: Object Detection via Region-based Fully Convolutional Networks

我们提出了基于区域的全卷积网络，用于精确和有效的目标检测。与之前的基于区域的检测器(如Fast/Faster R-CNN)相比，我们的基于区域的检测器是全卷积的，几乎所有计算都在整个图像上共享。为了实现这一目标，我们提出了位置敏感的分数映射来解决图像分类中的平移不变性与目标检测中的平移方差之间的矛盾。因此，我们的方法可以很自然地采用完全卷积的图像分类器骨干网络，如最新的残差网络(ResNets)，用于目标检测。我们使用101层ResNet在PASCAL VOC数据集上显示了很有竞争的结果(例如，在2007年的集上显示了83.6%的mAP)。同时，我们的结果在测试时的速度为每张图像170ms，比Faster R-CNN对应图像快2.5-20倍。

技巧只能源码找？李沐带你纵览卷积网络实战中的惊艳技艺

作者：Tong He、Zhi Zhang、Hang Zhang、Zhongyue Zhang、Junyuan Xie、Mu Li

亚马逊：用CNN进行图像分类的Tricks

自 2012 年 AlexNet 大展神威以来，研究者已经提出了各种卷积架构，包括 VGG、NiN、Inception、ResNet、DenseNet 和 NASNet 等，我们会发现模型的准确率正稳定提升。

YOLO v4：物体检测的最佳速度和精度

您只需看一次（YOLO）是快速、准确的单阶段目标检测器。最近发布的YOLO v4与其他目标检测器相比，显示出非常好的结果。

[深度学习概念]·理解NLP的卷积神经网络

当我们听说卷积神经网络（CNN）时，我们通常会想到计算机视觉。CNN负责图像分类方面的重大突破，是目前大多数计算机视觉系统的核心，从Facebook的自动照片标签到自动驾驶汽车。

目标检测算法之CVPR 2018 RefineDet

今天为大家介绍一篇CVPR 2018的一篇目标检测论文《Single-Shot Refinement Neural Network for Object Detection》，简称为RefineDet。RefineDet从网络结构入手，结合了one-stage目标检测算法和two-stage目标检测算法的优点重新设计了一个在精度和速度均为SOTA的目标检测网络。论文的思想值得仔细推敲，我们下面来一起看看。论文源码和一作开源的代码链接见附录。

一招检验10大深度学习框架哪家强！

来源：机器之心本文长度为2698字，建议阅读4分钟本文通过构建同一个神经网络，对比当前最流行的 10 种深度学习框架。 [ 导读 ]近日，Ilia Karmanov 在 Medium 发表了一篇题为《Neural Net in 10 Frameworks (Lessons Learned)》的文章，其内容源自一个 GitHub 项目，其中作者通过构建同一个神经网络，对比了当前最流行的 10 种深度学习框架，其中 Caffe2 和 MXNet 在准确度和训练时长上处于领先位置。该项目甚至还得到了 FA

从Caffe2到TensorFlow，十种框架构建相同神经网络效率对比

选自Medium 作者：Ilia Karmanov 机器之心编译参与：路雪、黄小天近日，Ilia Karmanov 在 Medium 发表了一篇题为《Neural Net in 10 Frameworks (Lessons Learned)》的文章，其内容源自一个 GitHub 项目，其中作者通过构建同一个神经网络，对比了当前最流行的 10 种深度学习框架，其中 Caffe2 和 MXNet 在准确度和训练时长上处于领先位置。该项目甚至还得到了 FAIR 研究者、各大框架创始人（比如贾扬清）的支持。机器

从Caffe2到TensorFlow，十种框架构建相同神经网络效率对比

近日，Ilia Karmanov 在 Medium 发表了一篇题为《Neural Net in 10 Frameworks (Lessons Learned)》的文章，其内容源自一个 GitHub 项目，其中作者通过构建同一个神经网络，对比了当前最流行的 10 种深度学习框架，其中 Caffe2 和 MXNet 在准确度和训练时长上处于领先位置。该项目甚至还得到了 FAIR 研究者、各大框架创始人（比如贾扬清）的支持。机器之心对该文进行了编译。项目GitHub链接：https://github.com/i

卷积神经网络特征图的可视化(CNN)

卷积神经网络(CNN)是一种神经网络，通常用于图像分类、目标检测和其他计算机视觉任务。CNN的关键组件之一是特征图，它是通过对图像应用卷积滤波器生成的输入图像的表示。

谷歌——DeepLab v1

临近中国的春节，Google 团队也不休假，趁着中国人每年一度大迁徙，他们在 arXiv 放出了 DeepLabv3+，在语义分割领域取得新的 state-of-the-art 水平。那今天就开始好好说说这一系列的操作，有兴趣的您，我们一起去进行深入学习讨论！今天先讲讲DeepLab v1的那些知识。原文地址：Semantic image segmentation with deep convolutional nets and fully connected CRFs 收录：ICLR 2015 (In

数据科学家目标检测/实例分割指南

原标题 | Demystifying Object Detection and Instance Segmentation for Data Scientists

04.OCR学习路径之文本检测（中2）FCN算法简介

FCN是基于深度学习的语义分割的开山之作，尽管现在很多方法都超越了FCN，但它的思想仍然有很重要的意义。

Deep Residual Learning for Image Recognition

更深层次的神经网络更难训练。我们提出了一个残差学习框架来简化网络的训练，这些网络比以前使用的网络要深入得多。我们显式地将层重新表示为参考层输入的学习剩余函数，而不是学习未引用的函数。我们提供了全面的经验证据表明，这些剩余网络更容易优化，并可以从大幅增加的深度获得精度。在ImageNet数据集上，我们评估了高达152层的剩余网—比VGG网[41]深8×，但仍然具有较低的复杂性。这些残差网的集合在ImageNet测试集上的误差达到3.57%，该结果在ILSVRC 2015年分类任务中获得第一名。我们还对CIFAR-10进行了100层和1000层的分析。在许多视觉识别任务中，表征的深度是至关重要的。仅仅由于我们的深度表示，我们获得了28%的相对改进的COCO对象检测数据集。深度残差网是我们参加ILSVRC & COCO 2015竞赛s1的基础，并在ImageNet检测、ImageNet定位、COCO检测、COCO分割等方面获得第一名。

SPPNet（2015）

RCNN首次将卷积操作引入检测领域用于提取特征，然而现有的深度卷积网络需要输入固定尺寸的图片，这个需求可能会导致对于任意scale/size的图片的识别精确度下降。【深度卷积神经网络由卷积层和全连接层组成，卷积层对于任意大小的图片都可以进行卷积运算提取特征，输出任意大小的特征映射，而全连接层由于本身的性质需要输入固定大小的特征尺度，所以固定尺寸的需求来自于FC层，即使对输入图片进行裁剪、扭曲等变换，调整到统一的size，也会导致原图有不同程度失真、识别精度受到影响】SPPNet提出了**“空间金字塔池化”**消除这种需求，不管图像大小是多大，在整张图片上只需要计算一次，就可以得到整幅图像的特征图，经过池化都会输出一个固定长度的表征。

[ECCV 2018]CornerNet: Detecting Objects as Paired Keypoints解读

本文提出一种使用单个卷积神经网络的新型物体检测方法: CornerNet. 本文通过将目标定义为成对关键点，消除了单阶段检测网络中对anchor box的需要. 除了新颖的网络形式外,本文还介绍了角落池化(corner pooling):一种新的池化方式,它可以帮助网络更好地定位物体的边角。实验表明，CornerNet在MS COCO上实现了42.1％的AP，优于所有现有的单阶段检测模型。

Center-based 3D Object Detection and Tracking

三维物体通常表示为点云中的三维框。这种表示模拟了经过充分研究的基于图像的2D边界框检测，但也带来了额外的挑战。 3D世界中的目标不遵循任何特定的方向，基于框的检测器很难枚举所有方向或将轴对齐的边界框匹配到旋转的目标。在本文中，我们提出用点来表示、检测和跟踪三维物体。我们的框架CenterPoint，首先使用关键点检测器检测目标的中心，然后回归到其他属性，包括3D尺寸、3D方向和速度。在第二阶段，它使用目标上的额外点特征来改进这些估计。在CenterPoint中，三维目标跟踪简化为贪婪最近点匹配。由此产生的检测和跟踪算法简单、高效、有效。 CenterPoint在nuScenes基准测试中实现了最先进的3D检测和跟踪性能，单个模型的NDS和AMOTA分别为65.5和63.8。在Waymo开放数据集上，Center-Point的表现远远超过了之前所有的单一模型方法，在所有仅使用激光雷达的提交中排名第一。

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐