首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    多重共线性检验-方差膨胀系数(VIF)-相关系数(机器学习)sklearn

    存在较强的多重共线性,当VIF>=100,存在严重多重共线性 # 导入计算膨胀因子的库 from statsmodels.stats.outliers_influence import variance_inflation_factor...# get_loc(i) 返回对应列名所在的索引 vif=[variance_inflation_factor(x.values,x.columns.get_loc(i)) for i in x.columns...sklearn.datasets import make_blobs # VIF膨胀因子 from statsmodels.stats.outliers_influence import variance_inflation_factor...'股票客户流失'.xlsx) # 提取特征矩阵和标签 x=data.drop(columns=['是否流失']) y=data['是否流失'] 4.3 ✌ 计算膨胀因子 vif=[variance_inflation_factor...x_test)[:,1]) 4.8.2 ✌ 删除 累计交易佣金 x=x.drop(columns=['累计交易佣金(元)']) x=pd.DataFrame(x) y=y vif=[variance_inflation_factor

    2.7K10

    用 VIF 方法消除多维数据中的多重共线性

    pandas as pd import statsmodels.api as sm from statsmodels.stats.outliers_influence import variance_inflation_factor...VIF全称是Variance Inflation Factor,即方差扩大因子,我们对自变量X作中心标准化,则X变为Xs,然后可以得到Xs’ Xs = (rij),这个就是自变量的相关阵。...sm.add_constant(X) def process(data, col): data = data.loc[:, col] #读取对应列标数据 vif = [variance_inflation_factor...在process函数中,data = data.loc[:, col]就是读取只含有col列标的那些数据, vif = [variance_inflation_factor(data.values, i...) for i in range(data.shape[1])][1:]这行代码就是计算vif的过程,variance_inflation_factor函数需要输入两个参数,分别是数据和每列数据的标号,

    1.5K30

    ICLR 2024 | 鸡生蛋蛋生鸡?再论生成数据能否帮助模型训练

    在近期 ICLR 2024 工作中,北大王奕森团队针对这一「数据扩充」(Data Inflation)问题展开了深入研究。...为了区分,本文将生成数据视为数据扩充(Data Inflation),二者的区别是,数据扩充是扩大原始数据集的大小,而数据增广是对每个原始样本,在训练过程中进行随机增强。...图 5 数据扩充和数据增广对 labeling error 和图 的连通性的影响 基于以上的理解,论文提出自适应的数据扩充 Adaptive Inflation(AdaInf),根据生成数据的质量、大小...表 1 不同模型和不同数据集下的对比学习线性探测性能 本文在图像识别任务上表 1 表明,AdaInf 在不同的对比学习模型和不同数据集上的性能显著好于没有数据扩充(No Inflation)或者直接进行数据扩充...(Vanilla Inflation)。

    13510
    领券