我正在读效率网:卷积神经网络的再思考模型缩放的报纸,我无法理解这句话:
从直觉上看,复合缩放方法是有意义的,因为如果输入图像较大,那么网络需要更多的层来增加接收域,需要更多的通道来捕获更大图像上更细粒度的模式。
我觉得我好像错过了/误解了一些显而易见的东西。
发布于 2020-02-11 16:09:19
接收域是指卷积滤波器将在其上工作的输入像素数。对于如何计算过滤器的接收字段大小有一个很好的提取文章 (可以很好地可视化接收字段大小),如果您只是好奇接收字段大小如何随着深度和过滤器大小的变化而增长的话,则使用这里的交互式计算器。
可接受字段大小的增加通常来自添加层和增加内核大小。一个更大的内核运行在更多的像素上,这就增加了接收域。增加网络的深度是指增加额外的卷积层。这些下游过滤器在初始conv生成的特征映射上工作。网络层,这增加了这些额外层中过滤器的接收字段(如果不清楚的话,这是个很好的指南)。本文还详细介绍了其他操作对接收字段大小的影响。
至于被捕获的细粒度模式的数量增加的说法,更符合直觉的是,更多的过滤器将为网络提供更多的方法来学习数据的特定特性。请参阅关于可视化卷积过滤器的文章,了解捕获了哪些类型的特性(这个对象检测教程链接到一个很好的可视化功能)。
希望这能有所帮助!
https://datascience.stackexchange.com/questions/67898
复制相似问题