我正在重建EfficientNet由Tan等人(2019).在宽度缩放因子中,有些东西我不明白。在论文中,他们试图最大限度地提高给定资源约束的模型精度,具体如下:
基于上述公式,应该是d.w.r^2。尽管如此,在下一节中:
因此,触发器增加了(α.β^2.γ^2)^φ,等于d.w^2.r^2
我.我猜对了吗?
发布于 2022-03-12 03:20:05
卷积运算值为V(输入)x V(滤波器)触发器。因此,与形状的图像(Hx,Wx,Cx)和第i型滤波器(Hf(i),Wf(i))。如果所有滤波器的宽度增加w,然后使用i == 1,则触发器超过w,但随后滤波器中的输入也增加了w。X(1) = (Hx,Wx,Cx.w)。因此,从i == 2到卷积结束,输入通道的触发器实际上增加了w,滤波器通道的滤波器通道增加了w,从而导致方程中的w^2。
https://stackoverflow.com/questions/71433150
复制相似问题