首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >如何处理ResNet50层类型

如何处理ResNet50层类型
EN

Data Science用户
提问于 2018-06-12 12:19:13
回答 2查看 13.3K关注 0票数 3

我试图从头开始重新创建ResNet50,但我不太明白如何解释这些层的矩阵。

例如:[1x1,64 1x1,4] x3

我知道它应该是一个卷积层,但是每个数字代表什么呢?

EN

回答 2

Data Science用户

发布于 2018-06-12 13:45:01

为了解释清楚,我将使用34层的例子:

  • 首先,您有一个卷积层,64个过滤器,内核大小为7x7 (表中的conv1),然后是最大池层。请注意,在这两种情况下,步长都指定为that =2。
  • 接下来,在conv2_x中有前面提到的池层和下面的卷积层。在这里,层通常是成对分组的(更大的体系结构中的三层),因为残差是如何连接的(每两层的箭头跳跃)。第一个矩阵:\begin{方程}\begin{b矩阵} 3x3,& 64 \x3,& 64结束{b矩阵}*3\end{等式}

这意味着您有两个层的kernel_size = 3x3,num_filters = 64,这些都是重复的x3。这些对应于池、/2和过滤器之间的层128个,总共6层(1对乘以3)。

  • 下面是conv3_x:\begin{方程}\begin{b矩阵} 3x3,& 128 \ 3x3,& 128结束{b矩阵}*4\end{等式}

2层kernel_size = 3x3,num_filters =128个,这些也是重复的,但在这一次是4次。图中是下面的8个绿色层。

这种情况一直持续到avg_pooling和softmax。

请注意,除非过滤器大小增加,否则步幅始终为1。在中对此进行了讨论:

平原网络:我们的平原基线主要受VGG网理念的启发。卷积层大多采用3×3滤波器,并遵循两个简单的设计规则:(1)对于相同的输出特征映射大小,各层具有相同的滤波器数;(2)如果特征映射的大小减半,则滤波器的数目增加一倍,以保持每层的时间复杂度。残差网络:基线结构与上述平面网相同,期望在每对3×3滤波器中加入一个快捷连接。

这就是为什么每次滤镜数量翻一番的原因,您将看到不同颜色的第一层指定num_filter/2。

票数 3
EN

Data Science用户

发布于 2019-03-18 02:13:57

我希望笔记本能帮助你更好地理解。实现在Keras中,所以它是快速掌握的!

票数 2
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/33022

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档