首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >ResNet瓶颈架构的输入大小如何可能从56x56x64变为56x56x356?

ResNet瓶颈架构的输入大小如何可能从56x56x64变为56x56x356?
EN

Data Science用户
提问于 2020-01-31 05:43:20
回答 2查看 868关注 0票数 4

在ResNet 木瓜中,第一剩余块的输入大小为56x56x64,这是由第一层的7x7x64滤波器引起的。但是,在本文中,它们显示了具有56x56x256输入大小的剩余块。如何将56x56x64更改为56x56x256?

EN

回答 2

Data Science用户

发布于 2020-01-31 10:16:50

我不确定答案,但我假设"256-d“指的是快捷连接,而不是输入。由于3的输出维数。图层在您的右手图片(图)。5)为256,捷径由深度64转换为深度256。

以下第4页的段落解释了如何做到这一点:

残余网络在上述平面网络的基础上,我们插入快捷连接(图3,右),将网络转换为对应的剩余版本。当输入和输出具有相同的尺寸时,可以直接使用标识快捷键(Eqn.(1)) (图3中的实线快捷键)。当维度增加时(图3中的虚线快捷键),我们考虑两个选项:(A)快捷方式仍然执行标识映射,并为增加维度添加了额外的零项。此选项不引入额外的参数;(B) Eqn中的投影快捷方式。(2)用于匹配尺寸(由1×1卷积完成)。对于这两个选项,当快捷键跨越两种大小的功能映射时,它们将以2的步幅执行。

对于ResNet-34,对于图中所示的第一个构建块来说,这不是必需的。5但以后的街区也是如此。图3中的虚线显示了这一点:

票数 0
EN

Data Science用户

发布于 2021-08-24 14:03:14

在这里,256-d可以来自论文中所称的三种事物之一,即A、B、C。

哪里,

一种→零填充投影

B→投影快捷键用于增加尺寸,而其他快捷方式是标识。

C→所有快捷键都是投影。

(如文件第6页所述)

在下面的Resnet块可视化中,应用了一个并行1x1操作,它将64个过滤器转换为256个过滤器。

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/67310

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档