首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >EfficientNet:复合标度法直觉

EfficientNet:复合标度法直觉
EN

Data Science用户
提问于 2020-02-11 14:46:01
回答 1查看 512关注 0票数 3

我正在读效率网:卷积神经网络的再思考模型缩放的报纸,我无法理解这句话:

从直觉上看,复合缩放方法是有意义的,因为如果输入图像较大,那么网络需要更多的层来增加接收域,需要更多的通道来捕获更大图像上更细粒度的模式。

  1. 在大图像的情况下,为什么网络需要更多的层来增加接收域?增加接受场意味着什么?增加它的宽度/高度?如果是这样的话,我们可以直接做到这一点而不增加网络中的层数吗?
  2. “细粒度模式”指的是我们在可视化卷积输出后可以看到的噪声形状吗?

我觉得我好像错过了/误解了一些显而易见的东西。

EN

回答 1

Data Science用户

回答已采纳

发布于 2020-02-11 16:09:19

接收域是指卷积滤波器将在其上工作的输入像素数。对于如何计算过滤器的接收字段大小有一个很好的提取文章 (可以很好地可视化接收字段大小),如果您只是好奇接收字段大小如何随着深度和过滤器大小的变化而增长的话,则使用这里的交互式计算器

可接受字段大小的增加通常来自添加层和增加内核大小。一个更大的内核运行在更多的像素上,这就增加了接收域。增加网络的深度是指增加额外的卷积层。这些下游过滤器在初始conv生成的特征映射上工作。网络层,这增加了这些额外层中过滤器的接收字段(如果不清楚的话,这是个很好的指南)。本文还详细介绍了其他操作对接收字段大小的影响。

至于被捕获的细粒度模式的数量增加的说法,更符合直觉的是,更多的过滤器将为网络提供更多的方法来学习数据的特定特性。请参阅关于可视化卷积过滤器的文章,了解捕获了哪些类型的特性(这个对象检测教程链接到一个很好的可视化功能)。

希望这能有所帮助!

票数 3
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/67898

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档