在大量不同数据集的实验下, 使用级联的ResNet分类器, 我们证明我们的方法比标准的训练好的ResNets要表现出色, 并且只需要少于20%和50%的FLOPs耗费在CIFAR-10/100数据集上,...其他的考虑了级联分类器在目标检测中快速地拒绝更进一步, 如果能够简单判断的情况下....从第一个分类开始累计的资源消耗, 即
?
.
实际上, 我们也包括累计的停止策略
?
对于相应的
?
的计算代价, 重要的是, 一旦我们在
?
个分类器处停止, 我们便不再运行比
?...动作:
基于当前分类器的输出概率, 我们的停止策略模块决定在当前时间步以概率
?
, 如果它最终在
?
步停止, 我们使用当前模型
?
来预测Label, 即,
?...是用来在训练数据的mini-batch上来最小化梯度估计器的变化
整理一下当前的内容
现在我们知道了整个模型的大致架构, 流程是这样的:
首先是图片的输入, 传到当前的分类器, 并且得到结果
接着将结果