我正在查看位于here的Keras CNN示例,我看到输入数据具有随机混洗的正面和负面情绪训练样本。我想知道CNN是否对训练数据的排序敏感。
为了清晰起见:如果我的y_train是100x1的形状,其中0-50表示所有积极情绪,50-100表示负面情绪,那么与每个偶数指数都有正面情绪而奇数指数都有负面情绪时相比,结果会有所不同吗?
发布于 2019-12-19 05:34:46
在批量训练神经网络时对数据进行混洗可能对模型的性能至关重要。关于这个主题的更详细的讨论在数据科学stackexchange上呈现。例如,我只想补充说,当你进行交叉验证时,混洗通常对模型的评估是有益的。在每个训练测试折叠中,你希望有随机的样本,这样你就可以确保你的模型可以很好地推广。
发布于 2019-12-19 06:14:11
从理论上讲,对于上一个时期,如果样本的后半部分只是正的,那么你的模型可能会稍微偏向于正的。然而,这就是为什么Keras的fit()函数有一个混洗功能,所以它对每个时期的训练样本进行混洗,以确保没有偏差,并且您的模型可以在不同的批次上进行训练,从许多不同的角度查看您的问题。除非你有理由相信你不应该这样做,否则我绝对推荐你这样做。
https://stackoverflow.com/questions/59399878
复制相似问题