Alexnet图像输入的转换如下:
transforms.Resize(256),
transforms.CenterCrop(224),为什么我们首先将图像大小调整为256,然后将中心裁剪调整到224?我知道224x224是ImageNet的默认图像大小,但是为什么我们不能直接将图像调整到224x224呢?
发布于 2022-03-03 19:24:39
也许这是最好的视觉说明。考虑以下图像(128x128px):

假设我们将它直接调整为16x16px,我们最终会得到:

但如果我们先把它调整到24x24px,

然后把它切成16x16px,看起来是这样的:

正如你所看到的,它正在摆脱边界,而在中心保留细节。请同时注意这些差异:


这同样适用于224 at vs 256 at,但这是在一个更大的分辨率。
https://stackoverflow.com/questions/71341354
复制相似问题