目标检测--Training Region-based Object Detectors with Online Hard Example Mining

Training Region-based Object Detectors with Online Hard Example Mining

code: https://github.com/abhi2610/ohem

本文针对 Fast R-CNN 检测系统,从样本训练的策略提出改进方法。

首先来看一下 Fast R-CNN

3 Overview of Fast R-CNN

FRCN(Fast R-CNN)的输入是图像和对应的一组候选区域,FRCN 网络可以分为两个子网络:一个是卷积子网络(由卷积层和最大池化层构成),另一个是 RoI 网络(由 RoI-pooling层,全链接层,两个误差损失层)。

在推理阶段,卷积子网络对输入图像进行卷积,得到一个卷积特征图,其尺寸依赖于输入图像尺寸。对于每个候选区域,RoI-pooling 层 将该候选区域映射到卷积特征图上面对应的区域,提取出一个固定长度的特征向量。每个特征向量输入到全链接层,给出两个输出:1)含有物体及物体类别的概率,2)包含物体的矩形框回归坐标。

3.1. Training FRCN 和大多数深度网络一样,使用 SGD 随机梯度下降算法训练。每个样本的 RoI 的损失函数是分类log误差 加上 定位误差。

为了实现在 RoI 之间 共享卷积网络计算,SGD 最小批通过分等级创建。对每个最小批,N幅图像从数据库中采样,然后 B/N 个 RoI 从每个图像中采样。 这里设定 N=2, B=128。在 RoI 采样过程中使用了几个探索方法。本文主要的贡献就是取消了它们中的一些。

4 Our approach

the online hard example mining algorithm (OHEM) proceeds as follows: 对于一幅图像在 SGD t 步 迭代中,我们使用卷积子网络计算得到 卷积特征图,然后 RoI 网络使用这个特征图和该图像对应所有的候选区域进行前向计算,主要这一步主要涉及 RoI 池化, 几个全链接层, 每个RoI损失函数计算。这个损失误差表示当前网络对每个RoI 的处理能力。 难得样本可以通过对 所有 RoI 的损失误差进行排序,取当前网络表现最差的 前 B/N 个 RoI 样本。因为大部分前向计算通过卷积图共享计算。所以额外增加的计算很少。然后我们对这些难得样本进行后向计算,调整网络参数,使整个网络可以更好的处理这些难样本。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏数据科学与人工智能

应用|使用正则化线性模型和XGboost对价格建模

好消息是我们有很多特征可以使用(81),坏消息是有19个特征有缺失值,其中4个特征缺失值超过80%。对于任何一个特征,如果它缺失了80%的值,那么它就没有那么重...

21420
来自专栏大数据文摘

是的,你的AI技能正在“贬值”

我们正处于AI创业热潮之中,机器学习专家的薪资水平水涨船高,投资者也乐于对AI初创公司慷慨解囊。AI的普及成为推动社会生产力标志,必将改变我们的生活。

10810
来自专栏新智元

危险!一张贴画就能迷惑AI,对抗补丁或让自动驾驶车毁人亡

来自北京航空航天大学(Beihang University)、悉尼大学(University of Sydney)和剑桥大学(University of Cam...

11440
来自专栏AI科技评论

观点 | 通往通用人工智能的路上,我们少不了无监督学习

在过去十年中,机器学习在很多领域都取得了前所未有的进展,如图像识别,自动驾驶汽车、和玩复杂游戏如「GO」等。这些成就在很大程度上都是通过采用监督学习和强化学习两...

10920
来自专栏AI研习社

使用概率编程和Pyro进行财务预测

今天我会用略微不同的方法拟合之前的算法。从概率角度进行处理,通过数据本身进行正则化,估计预测的确定性,使用较少的数据,将概率依赖引入到模型中。这里主要讲概况,我...

17510
来自专栏磐创AI技术团队的专栏

GitHub标星2.6万!Python算法新手入门大全

几个印度小哥,在GitHub上建了一个各种Python算法的新手入门大全,现在标星已经超过2.6万。这个项目主要包括两部分内容:一是各种算法的基本原理讲解,二是...

11320
来自专栏ATYUN订阅号

量子机器学习简介与应用前景分析

人工智能指的是机器在一定程度上展示人类所认为的智能的能力。机器学习的快速发展推动了这一过程:让机器自己思考,而不是用绝对的概念对它们进行预编程。

15040
来自专栏AI科技评论

学界 |《nature》杂志:我们有义务搞懂我们所创造出来的技术

AI 科技评论按:一个跨学科的研究小组希望创建一个名为「机器行为」的新学科,以了解人工智能将如何对我们的社会、文化、经济与政治造成影响。

11120
来自专栏AI科技评论

干货 | 如何学习SVM(支持向量机)以及改进实现SVM算法程序

AI 科技评论按,本文为韦易笑在知乎问题如何学习SVM(支持向量机)以及改进实现SVM算法程序下面的回复,AI 科技评论获其授权转载。

13320
来自专栏杨熹的专栏

CMU Neural Nets for NLP 2019 (4):CNN for NLP

CMU Neural Nets for NLP 2019 (4): Convolutional Neural Networks for Language

12120

扫码关注云+社区

领取腾讯云代金券

年度创作总结 领取年终奖励