当我想到最大池化层时,我想到的是检测在其接受域中的任何位置,但位置不可知的特征。
似乎最大池化的这种空间不变性应该意味着它丢失了关于原始图像中特征的确切位置的信息。
那么,具有多层最大池的CNN如何准确地预测图像中对象的边界框?一个快速的Google展示了许多CNN的例子,最大池化被推荐用于边界框回归问题。
谢谢你的帮助。
发布于 2018-08-29 20:07:24
因为你认为它会丢失关于确切位置的信息是错误的。最大池化不会稀释最大像素的位置-相反,可以将其视为一种缩小大小的方法。最大池化只是一种降低问题维度的方法,以便您的问题适合设备内存。一个很好的属性是它汇集了你的功能图中最强的激活度。
在bbox预测的情况下,它还减少了bbox的建议区域数量。这在稍后的非最大抑制步骤中将杀死所有冗余的建议bbox位置。
https://stackoverflow.com/questions/51942071
复制相似问题