我正在使用InceptionV3模型进行培训。下面是代码(https://github.com/maxmelnick/tensorflow/blob/no_随机/tensorflow/示例/图像_再培训/再培训)的链接,最初我有一个小的数据集。因此,我使用了增强技术来增加数据集的大小。
培训阶段数据集分为培训、验证和测试。在训练阶段,11个班的准确率为96%。但当我预测任何新的输入图像(未见数据)时,它的准确率为56%。模型有什么问题?
我已经使用了Dropout,交叉验证,OverSampling技术,但在新的输入图像上没有取得好的效果。
训练时使用的参数。
训练样本-每班800张图片
测试样本(训练样本以外的未见数据)-每类51幅图像
历代- 10,000
发布于 2020-09-01 09:52:56
听起来你的训练数据有点过份了,所以你应该研究一些神经网络调整的方法。我看你用过辍学,这就是其中之一,但可能还不够。
您还可以考虑将培训数据划分为培训集和验证集,并在验证集上的性能停止改进时停止培训。这就是所谓的早期停止
https://datascience.stackexchange.com/questions/81067
复制相似问题