我有以下数据:
如果我想对测试和控制进行规范化和比较,我应该分别对测试和控制样本进行规范化,还是对整个矩阵进行规范化?
发布于 2020-05-03 18:57:45
实验样本是一组在实验中接收被测变量的组。控制组是使用相同的实验过程不接收正在测试的变量的实验中的组。因此,未接受干预的对照组被用作比较组和评估干预效果的基线。
我把这作为一个客观的教训来说明,测试和控制必须通过一个类似的实验过程联系起来。所以,是的,如果你要正常化,然后使用整个矩阵。
额外积分(奖金轮)
数据转换的目的是使数据更易于建模和理解。转换数据的目的之一是找出离群点,减少倾斜量等。
从数据的一小部分来看,似乎值在0-100之间,这表明正常化并不是完全必要的,IMHO。
https://datascience.stackexchange.com/questions/73468
复制相似问题