我正在浏览维基百科关于支持向量机的文章,并发现了以下公式:
上面写着:
通过规范化或标准化的数据集,我们所需的超平面wx+b=0的平行超平面可以用方程wx+b=1和wx+b=-1来描述。
这里的标准化和标准化数据是什么意思?如果数据不标准化,应该使用什么公式?
发布于 2019-06-10 12:43:00
训练支持向量机分类器需要归一化/标准化数据。在运行支持向量机之前,您应该始终对变量进行缩放:可以通过最小-最大缩放或标准化(在统计中称为Z-分数)来实现。
这是一个基本的数据恢复操作,如果没有它,像SVM这样的分类器就不会有用。这是因为如果变量不是在相同的尺度上,方差较大的变量将主导所有其他的训练。
你引用的方程是支持向量。在它们旁边的图像中:虚线,其距离必须通过支持向量机分类器最大化。1和-1的值是模型赋予目标类的标签(在二进制分类问题中)。
希望这能帮上忙,否则让我知道。
https://datascience.stackexchange.com/questions/53524
复制相似问题