有人提出在基于普通滑动的目标检测方法中有很多小的样本图片中是空的是没有意义的,所以通过 图像分割 技术将原始图像分割成上千个子图片,然后在这上千个子图片中使用分类算法实现目标检测技术 (这个思想早于基于滑动窗口目标的卷积神经网络目标检测方法,所以在 NG 认为还是 YOLO 方法更加的有效)“Girshick, Ross, et al. "Rich feature hierarchies for accurate object detection and semantic segmentation." Proceedings of the IEEE conference on computer vision and pattern recognition. 2014.
“Girshick, Ross. "Fast r-cnn." Proceedings of the IEEE international conference on computer vision. 2015.
但是 R-CNN 的算法,现在来看还是太慢了,所以有专家提出了 Fast R-CNN 算法/R-CNN 算法是逐一对图像分割的区域进行目标检测的,而 Fast R-CNN 使用了滑动窗口的卷积方法,这显著提高了 R-CNN 的速度。
但是 Fast R-CNN 得到候选区域的聚类步骤仍然非常缓慢
Faster R-CNN
为了解决 Fast R-CNN 选取候选区域缓慢的问题 ,提出了 Faster R-CNN 算法
“Ren, Shaoqing, et al. "Faster r-cnn: Towards real-time object detection with region proposal networks." Advances in neural information processing systems. 2015.
Faster R-CNN 中使用的是 CNN 方法而不是传统的图像分割方法,来获取候选区块。结果比 Fast R-CNN 快很多