在ResNet 木瓜中,第一剩余块的输入大小为56x56x64,这是由第一层的7x7x64滤波器引起的。但是,在本文中,它们显示了具有56x56x256输入大小的剩余块。如何将56x56x64更改为56x56x256?

发布于 2020-01-31 10:16:50
我不确定答案,但我假设"256-d“指的是快捷连接,而不是输入。由于3的输出维数。图层在您的右手图片(图)。5)为256,捷径由深度64转换为深度256。
以下第4页的段落解释了如何做到这一点:
残余网络在上述平面网络的基础上,我们插入快捷连接(图3,右),将网络转换为对应的剩余版本。当输入和输出具有相同的尺寸时,可以直接使用标识快捷键(Eqn.(1)) (图3中的实线快捷键)。当维度增加时(图3中的虚线快捷键),我们考虑两个选项:(A)快捷方式仍然执行标识映射,并为增加维度添加了额外的零项。此选项不引入额外的参数;(B) Eqn中的投影快捷方式。(2)用于匹配尺寸(由1×1卷积完成)。对于这两个选项,当快捷键跨越两种大小的功能映射时,它们将以2的步幅执行。
对于ResNet-34,对于图中所示的第一个构建块来说,这不是必需的。5但以后的街区也是如此。图3中的虚线显示了这一点:

发布于 2021-08-24 14:03:14
在这里,256-d可以来自论文中所称的三种事物之一,即A、B、C。
哪里,
一种→零填充投影
B→投影快捷键用于增加尺寸,而其他快捷方式是标识。
C→所有快捷键都是投影。
(如文件第6页所述)
在下面的Resnet块可视化中,应用了一个并行1x1操作,它将64个过滤器转换为256个过滤器。

https://datascience.stackexchange.com/questions/67310
复制相似问题