我试图运行一个MLP回归器在我的数据集与一个隐藏层。我正在对我的数据进行标准化,但我想弄清楚,如果我在培训和测试集中拆分数据集之后还是之前进行标准化,是否重要。我想知道,如果在数据分割之前进行标准化,我的预测值是否会有任何差异。
发布于 2018-09-23 14:42:45
是也不是。如果训练和测试集的均值和方差不同,标准化会导致不同的结果。
尽管如此,一个好的训练和测试集应该足够相似,以便数据点以相似的方式分布,而分离后的标准化应该给出同样的结果。
发布于 2018-09-23 14:40:18
在分手之前你绝对应该这么做。
假设有1, 2,3,4,5,6, 7,8, 9,10作为输入,它们被分成1,2,3,4,5,7,9,10和6,8进行测试。
很明显,最小-最大值范围,以及两个样本的均值和标准差是完全不同的,因此,通过采用标准化的“后分离”,你将在第一组和第二组中完全混淆这些值之间的关系。
https://stackoverflow.com/questions/52467127
复制相似问题