使用不同的网络宽度(W)、深度(D)和分辨率(R)系数放大基线模型。更大的网络具有更大的宽度、深度或分辨率,可以获得更高的精度,但精度达到80%后会迅速饱和,这说明了单维尺度的局限性。...ɸ是一个指定的系数,控制多少资源可用,而α,β,γ指定如何将这些资源分配给网络深度、宽度和分辨率。
但是这里你可能会有两个疑问:首先,为什么α平方不一样呢?第二,为什么要把这三个数的乘积限制为2?...这是很好的问题。在CNN中,Conv层是网络中计算开销最大的部分。同时,失败的卷积运算几乎正比于d, w², r²,即增加深度将加倍失败而增加宽度或决议增加失败几乎是四倍。...EfficientNet-B0基线网络
MBConv块只是一个反向剩余块(在MobileNetV2中使用),有时注入一个挤压和激发块。
现在我们有了基本网络,我们可以为缩放参数寻找最优值。...基线网络B0,结果最优值α= 1.2,β= 1.1,γ= 1.15,βα*²*γ²≈2
现在修复α,β和γ常量(在以上步骤中找到的值)和尝试不同的ϕ的值实验。