专栏首页机器学习AI算法工程xgboost输出特征重要性排名和权重值

xgboost输出特征重要性排名和权重值

在机器学习实践中,我们要经常用到xgboost框架去训练数据,然后用训练得到的模型再去预测其他未知的数据的标签。 在判断训练得到的模型是否合理时,一个很重要的步骤就是查看xgboost模型的特征重要性排序。如果观察得到模型的排名前几的特征都不符合我们正常的思维,那么模型很可能是不稳定或者有问题的。在训练得到模型文件及特征映射文件后,可以通过下面一段代码查看特征排名、特征名称、特征权重值

基本思想

根据结构分数的增益情况计算出来选择哪个特征的哪个分割点,某个特征的重要性,就是它在所有树中出现的次数之和。

参考链接

https://blog.csdn.net/q383700092/article/details/53698760

https://blog.csdn.net/oppo62258801/article/details/81212854

本文分享自微信公众号 - 机器学习AI算法工程(datayx)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-07-14

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 欺诈预测机器学习模型设计:准确率和召回率

    Airbnb网站基于允许任何人将闲置的房屋进行长期或短期出租构建商业模式,来自房客或房东的欺诈风险是必须解决的问题。irbnb信任和安全小组通过构建机器学习模型...

    机器学习AI算法工程
  • 用户贷款风险预测:Stacking模型融合

    近7万贷款用户的基本身份信息、消费行为、银行还款等数据信息,需要参赛者以此建立准确的风险控制模型,来预测用户是否会逾期还款。

    机器学习AI算法工程
  • XDeepFM 模型,字节跳动短视频内容理解和推荐系统

    一图胜千言,仅一张图片就包含大量信息,难以用几个词来描述,更何况是短视频这种富媒体形态。面对短视频内容理解的难题,字节跳动作为一家拥有海量短视频素材和上亿级用户...

    机器学习AI算法工程
  • 数据科学特征选择方法入门

    让我们从定义特征开始。特征是数据集中的X变量,通常由列定义。现在很多数据集都有100多个特征,可以让数据分析师进行分类!正常情况下,这是一个荒谬的处理量,这就是...

    AiTechYun
  • 谷歌机器学习白皮书全解析 43条黄金法则

    from http://3g.163.com/touch/article.html?docid=CBMPFGTL00098GJ5&qd=pc_adaptatio...

    用户1908973
  • 机器学习读书笔记系列之正则化与模型选择

    链接:https://wei2624.github.io/MachineLearning/

    用户2769421
  • 教你简单解决过拟合问题(附公式)

    作者:Ahmed Gad 翻译:韩海畴 校对:丁楠雅 本文带大家认识了什么是过拟合,并且示范了用正则化的方法来避免过拟合的问题。 ? 多项式回归&过拟合 你可...

    数据派THU
  • 大众点评搜索基于知识图谱的深度学习排序实践

    本文介绍了大众点评搜索核心排序层模型的演化之路,包括结合知识图谱信息构建适合搜索场景的Listwise深度学习排序模型LambdaDNN以及特征工程实践和相关工...

    数据猿
  • 大众点评搜索基于知识图谱的深度学习排序实践

    本文介绍了大众点评搜索核心排序层模型的演化之路,包括结合知识图谱信息构建适合搜索场景的Listwise深度学习排序模型LambdaDNN以及特征工程实践和相关工...

    美团技术团队
  • 大众点评搜索基于知识图谱的深度学习排序实践

    本文介绍了大众点评搜索核心排序层模型的演化之路,包括结合知识图谱信息构建适合搜索场景的Listwise深度学习排序模型LambdaDNN以及特征工程实践和相关工...

    石晓文

扫码关注云+社区

领取腾讯云代金券