-方差膨胀系数(VIF)
1、✌ 原理:
方差膨胀系数是衡量多元线性回归模型中多重共线性严重程度的一种度量。...它表示回归系数估计量的方差与假设自变量间不线性相关时方差相比的比值。
2、✌ 多重共线性:
是指各特征之间存在线性相关关系,即一个特征可以是其他一个或几个特征的线性组合。...如果存在多重共线性,求损失函数时矩阵会不可逆,导致求出结果会与实际不同,有所偏差。...例如:
x1=[1,2,3,4,5]
x2=[2,4,6,8,10]
x3=[2,3,4,5,6]
# x2=x1*2
# x3=x1+1
上述x2,x3都和x1成线性关系,这会进行回归时,影响系数的准确性...分数有所上升,而AUC值下降了一点,不过影响不大,那么删除了共线性的特征是对我们模型的准确性是有作用的
但是我们发现删除累计交易佣金这列特征时,准确性反倒有所下降,这是为什么?