我正在设计一个考虑n维的支持向量机。在每个维度上,值的范围都在0-1之间。现在,如果由于各种原因,我无法从原始数据集确定特定维度上的值,对于特定数据点,SVM沿该维度的值应该是什么?我能不能把它设为-1,表示缺失值?
谢谢Abhishek S
发布于 2012-06-12 03:41:26
如果维度不能对机器的空间分区做出贡献,那么将缺失值完全去掉会更好。这是因为SVM唯一能做的就是在分类能力范围内对该维度赋予零权重,因为该维度中的所有点都在同一位置。
因此,每次遍历该维度都只是浪费计算资源。如果恢复这个值很重要,您可以使用某种类型的回归模型来尝试恢复估计值,但是如果该估计值是从其他数据中生成的,那么它实际上不会对SVM做出贡献,因为该估计维度中的数据只不过是您用来生成它的数据的汇总(我假设它已经在您的SVM模型中了)。
https://stackoverflow.com/questions/10974463
复制相似问题