首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >我使用的是statsmodel statsmodels.stats.outliers_influence.variance_inflation_factor吗?

我使用的是statsmodel statsmodels.stats.outliers_influence.variance_inflation_factor吗?
EN

Stack Overflow用户
提问于 2019-08-01 04:37:15
回答 1查看 101关注 0票数 0

目前,我正在使用VIF检测多重共线性。然而,网上几乎没有我可以作为参考的例子,因此我尝试自己使用它。

代码语言:javascript
运行
AI代码解释
复制
cat_var = df[["BsmtExposure","MSZoning","Exterior1st","MSSubClass","GarageType","GarageFinish"]].apply(preprocessing.LabelEncoder().fit_transform)
dfX = df[["OverallQual","ExterQual","GrLivArea","1stFlrSF","GarageCars","BsmtQual","HeatingQC","YearBuilt"]]
data_categorical = dfX.join(cat_var)
sm_data_categorical = sm.add_constant(data_categorical)
vifDf = sm_data_categorical
vifDf = vifDf.drop(["OverallQual","YearBuilt"],axis=1)
feature = vifDf.columns
print(feature)
vif = [variance_inflation_factor(vifDf[feature].values,feature.get_loc(var)) for var in feature]
print(vif)

Output:
[139.09182494163923, 1.9269169697717614, 1.794083234373851, 1.828696948899336, 1.6357605533337554, 1.680843256052908, 1.4734276288799137, 1.2599932369972506, 1.0704636681342352, 1.1139451723386682, 1.2658662212832537, 1.4714527943918547, 1.2728931548738207]

我也用过statsmodels.add_constant。

EN

回答 1

Stack Overflow用户

发布于 2019-08-01 06:22:38

Aaron,有一个名为mcTest的R包,它对变量进行多重共线性诊断。有关实现的更多信息,请单击此处链接(http://rfaqs.com/mctest-r-package-detection-collinearity-among-regressors)。希望能有所帮助。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/57301903

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文