为什么我们在stats
包的model.matrix
函数公式中提到-1
。
training_matrix <-model.matrix(Survived ~.-1, data = training)
在这种情况下使用标准的titanic
数据集。
还有一些文档说,只要我们在数据集中正确地声明了因子和数字,就可以使用带有-1
表示法的model.matrix
执行一次热编码。
代码如下
data_1_matrix <-model.matrix(~.-1, data = data_1)
这个-1
到底是做什么的?
发布于 2020-11-23 18:24:55
-1确保模型矩阵中没有常量。如果您要使用
training_matrix <-model.matrix(Survived ~., data = training)
在模型矩阵中包含了一列,并省略了一个类别,以确保您的模型不会受到多重共线性的影响。
这取决于用户的喜好:如果你使用一个常量,你的模型中就会有一个“参考类”。如果不这样做,就没有引用类。
https://stackoverflow.com/questions/64966412
复制相似问题