论文发表:CVPR2017 论文链接:CVPR2017 open access
@inproceedings{lin2017feature,
title={Feature pyramid networks for object detection},
author={Lin, Tsung-Yi and Doll{\'a}r, Piotr and Girshick, Ross and He, Kaiming and Hariharan, Bharath and Belongie, Serge},
booktitle={Proceedings of the IEEE conference on computer vision and pattern recognition},
pages={2117--2125},
year={2017}
}
Name | Value |
---|---|
标签 | #多尺度 |
目的 | 针对目标检测任务中,目标尺度变化的问题,设计了特征金字塔网络 |
方法 | 构建多层特征图之间的联系,合理利用高层语义信息和底层位置信息 |
总结 | 是目标检测模型的标配,较好地解决了多尺度检测问题 |
作者提到,在2017年以前,目标检测中的一个基本挑战就是目标检测模型在处理目标多尺度变化问题的不足,因为在当时很多网络都使用了利用单个高层特征,(比如说Faster R-CNN利用下采样四倍的卷积层——Conv4,进行后续的物体的分类和bounding box的回归),但是这样做有一个明显的缺陷,即小物体本身具有的像素信息较少,在下采样的过程中极易被丢失,而之前的图像金字塔结构虽然也能解决多尺度问题,但计算量大,内存消耗大,因此作者提出了特征金字塔结构,能在增加极小的计算量的情况下,处理好物体检测中的多尺度变化问题。
针对上诉问题,提出了一个利用深度卷积神经网络固有的多尺度金字塔结构来以极小的计算量构建特征金字塔的网络结构,即FPN。
作者对比了多种金字塔结构,其中:
下图是FPN的网络结构:
其主要包含两个部分:
图片来自【论文笔记】FPN —— 特征金字塔 - 知乎 (zhihu.com)
可参考Pytorch官方的代码https://github.com/pytorch/vision