首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >CNN:为什么我们首先把图像调整到256,然后把中间的裁剪调整到224?

CNN:为什么我们首先把图像调整到256,然后把中间的裁剪调整到224?
EN

Stack Overflow用户
提问于 2022-03-03 17:33:01
回答 1查看 802关注 0票数 0

Alexnet图像输入的转换如下:

代码语言:javascript
复制
transforms.Resize(256),
transforms.CenterCrop(224),

为什么我们首先将图像大小调整为256,然后将中心裁剪调整到224?我知道224x224是ImageNet的默认图像大小,但是为什么我们不能直接将图像调整到224x224呢?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2022-03-03 19:24:39

也许这是最好的视觉说明。考虑以下图像(128x128px):

假设我们将它直接调整为16x16px,我们最终会得到:

但如果我们先把它调整到24x24px,

然后把它切成16x16px,看起来是这样的:

正如你所看到的,它正在摆脱边界,而在中心保留细节。请同时注意这些差异:

这同样适用于224 at vs 256 at,但这是在一个更大的分辨率。

票数 5
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/71341354

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档