前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >R-L模型算法的优缺点_审计重要性特征

R-L模型算法的优缺点_审计重要性特征

作者头像
全栈程序员站长
发布2022-11-07 10:20:26
6450
发布2022-11-07 10:20:26
举报
文章被收录于专栏:全栈程序员必看

1.特征重要性的意义

LR模型也就是逻辑回归模型,作为一个简单的常用的模型,其有非常多的优点,除了模型简单,容易实现分布式,还有一个重要的优点就是模型的可解释性非常好。因为每个特征都对应一个模型参数 w i w_{i} wi​,该参数越大,那么该特征对模型预测结果的影响就会越大,我们就说该特征就越重要,因此LR模型的特征重要性评估方式就是 w i w_{i} wi​的大小。

2.逻辑回归模型特征重要性及排序

Talk is cheap,Show me the code,直接亮代码

代码语言:javascript
复制
from sklearn import linear_model
import pandas as pd
data_dir = 'dir_name/'
train_data_file = 'train_data_file_name'
test_data_dile = 'test_data_dile_name'
df_train = pd.read_csv(data_dir+train_data_file)
df_test = pd.read_csv(data_dir+test_data_dile)
tr_data = df_train_train.as_matrix()
va_data = df_train_validation.as_matrix()
# 训练数据,每一行的第一列为样本label
tr_x_data = tr_data[:, 1:] # 训练样本特征
tr_y_data = tr_data[:, 0] # 训练样本真实label
mod = linear_model.LogisticRegression()
mod.fit(tr_x_data, tr_y_data)
col_name = list(df_train.columns)[1:]
m = { 
}
for i in range(len(col_name)):
m.setdefault(col_name[i], 0)
m[col_name[i]] = mod.coef_[i]
sorted(m.items(), key=lambda x: x[1], reverse=True)

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/184320.html原文链接:https://javaforall.cn

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2022年10月8日 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1.特征重要性的意义
  • 2.逻辑回归模型特征重要性及排序
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档