如何知道线性回归、多元线性回归、多项式回归中需要进行特征缩放?因为在某些地方,我得到了一个点,特征缩放是不需要的,因为系数是存在的,而在某个地方,我得到了需要的特征缩放,那么实际的答案是什么。
发布于 2020-07-19 01:25:13
假设我们有重量和价格两个特征,如下表所示。“权重”不能与“价格”进行有意义的比较。因此假设算法使得由于“权重”>“价格”,因此“权重”比“价格”更重要。link
当数据列的范围变化较大时,需要进行特征缩放。获取每列中数据的min
、max
和mean
是一种很好的方法
下一步是绘制数据。这很容易识别数据的不同维度的范围。
发布于 2020-07-20 11:23:11
这两种说法都是正确的,但都不完整。
如果您使用简单的线性模型,如y = w1 * x1 + w2 * x2
,则不需要特征缩放。由于系数w1
和w2
将相应地学习或调整。
但如果你用正则化项或定义变量约束来修改上面的表达式,那么系数将偏向于具有更大幅度的特征,而不是特征缩放。
结论:Feature scaling is important when we modify the expression for simple linear model
。此外,在应用任何算法之前对特征进行归一化也是一个很好的实践。
https://stackoverflow.com/questions/62971248
复制相似问题