xgboost特征选择

机器学习AI算法工程

发布于 2018-03-15 14:01:39

2.6K0

发布于 2018-03-15 14:01:39

Xgboost在各大数据挖掘比赛中是一个大杀器，往往可以取得比其他各种机器学习算法更好的效果。数据预处理，特征工程，调参对Xgboost的效果有着非常重要的影响。这里介绍一下运用xgboost的特征选择，运用xgboost的特征选择可以筛选出更加有效的特征代入Xgboost模型。

这里采用的数据集来自于Kaggle | Allstate Claims Severity比赛，

https://www.kaggle.com/c/allstate-claims-severity/data

这里的训练集如下所示，有116个离散特征（cat1-cat116）,14个连续特征（cont1 -cont14），离散特征用字符串表示，先要对其进行数值化：

xgboost的特征选择的代码如下：

http://blog.csdn.net/qq_34264472/article/details/53363384

本文参与腾讯云自媒体分享计划，分享自微信公众号。

原始发表：2017-10-06，如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自大数据挖掘DT数据分析微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体分享计划，欢迎热爱写作的你一起参与！

登录后参与评论

0 条评论

热度