我有7类图像,我需要分类。每个类都有不同数量的样本。
最后,我删除了所有类中的所有图像,直到70幅图像(50次培训和20次验证)。使用Keras、生成器和flow_from_directory方法,我能够对它们进行分类,但很明显,我不会获得很好的精度。我有个计划以后再增加数据。
我的问题是,我是否可以使用flow_from_directory方法为每个类使用不同数量的培训数据?这种方法有什么潜在的缺点吗?
例如:
谢谢
发布于 2017-02-15 15:53:55
你可以,但是最好是平衡每个类中训练样本的数量,或者分类器可能倾向于将图像分类到训练样本最多的类中。
比如说,也许你可以把第二班的训练样本翻一番(通过复制和粘贴)?
对于数据增强,您可以添加噪声到您的训练样本,例如添加高斯噪声,裁剪和调整图像大小,等等。通过这样做,该模型将更加健壮。
https://stackoverflow.com/questions/42253627
复制相似问题