我试图从头开始重新创建ResNet50,但我不太明白如何解释这些层的矩阵。
例如:[1x1,64 1x1,4] x3
我知道它应该是一个卷积层,但是每个数字代表什么呢?
发布于 2018-06-12 13:45:01
为了解释清楚,我将使用34层的例子:
这意味着您有两个层的kernel_size = 3x3,num_filters = 64,这些都是重复的x3。这些对应于池、/2和过滤器之间的层128个,总共6层(1对乘以3)。
2层kernel_size = 3x3,num_filters =128个,这些也是重复的,但在这一次是4次。图中是下面的8个绿色层。
这种情况一直持续到avg_pooling和softmax。
请注意,除非过滤器大小增加,否则步幅始终为1。在纸中对此进行了讨论:
平原网络:我们的平原基线主要受VGG网理念的启发。卷积层大多采用3×3滤波器,并遵循两个简单的设计规则:(1)对于相同的输出特征映射大小,各层具有相同的滤波器数;(2)如果特征映射的大小减半,则滤波器的数目增加一倍,以保持每层的时间复杂度。残差网络:基线结构与上述平面网相同,期望在每对3×3滤波器中加入一个快捷连接。
这就是为什么每次滤镜数量翻一番的原因,您将看到不同颜色的第一层指定num_filter/2。
发布于 2019-03-18 02:13:57
我希望这笔记本能帮助你更好地理解。实现在Keras中,所以它是快速掌握的!
https://datascience.stackexchange.com/questions/33022
复制相似问题