XGBoost以列列表而不是图的形式获取要素重要性

腾讯云

开发者社区

文档建议反馈控制台

首页

文章/答案/技术大牛

发布

1回答

、、

我想知道您是否可以将特征重要性表示为列的列表而不是曲线图。这就是我的东西 xg_reg = xgb.train(params=params, dtrain=data_dmatrix, num_boost_round=10)plt.rcParams['figure.figsize'] = [5,5] plt.show() 这就给了我

浏览 16提问于2020-07-24得票数 1

回答已采纳

1回答

特征重要性绘图使用xgb和护林员。最好的比较方法

、、

根据基于rmse的最佳性能，其中一种或另一种用于针对搁置数据进行测试。> xgb.importance(model = regression_model)然后我就可以把它画成这样 > xgb.importance(model = regression_mode

浏览 2提问于2020-01-13得票数 0

回答已采纳

1回答

xgboost与H2o梯度提升

、

我有一个数据集有大量的缺失值(超过40%的缺失值)。在xgboost和H2o gradient boosting中生成一个模型-在这两种情况下都得到了一个像样的模型。然而，xgboost将此变量显示为模型的关键贡献者之一，但根据H2o，梯度提升该变量并不重要。xgboost会以不同的方式处理缺少值的变量吗？两个型号的所有配置都完全相同。

浏览 0提问于2017-06-21得票数 2

11回答

如何在xgboost中获取特性重要性？

、

我正在使用{}构建模型，并尝试使用xgboost查找每个特性的重要性，但它返回xgboostdtrain = xgb.DMatrix(X, label=Y)num_round = 200那么我的火车上有什么差错吗如何在xgboost中获取

浏览 1提问于2016-06-04得票数 52

1回答

在特征重要性和特征选择之后重建和训练新的深度学习Python模型以减少特征量？

、、、

我有一个427名患者的数据集，在这些患者的遗传标记(2687列)上，甲基化速率被确定为从0到1 (0 =未甲基化，1=完全甲基化)。我使用了xgboost，我得到了一个节点图，并通过xgboost重命名了特征(所以我的第一个问题是，我不知道这些xgboost图的标签真正代表了什么标记(显然有3个测试(6个“是”或“不是”决策树，图.a)，xgboost可以确定患者

浏览 20提问于2019-05-18得票数 1

3回答

当我绘制特征重要性图时，我得到了这个混乱的图。我有超过7000个变量。我知道内置函数只选择最重要的部分，尽管最终的图形是不可读的。array[:,0:7803]from xgboost import XGBClassifier from sklearn.model_selection importX_train, X_test, y_train, y_test = train_test_split(X,Y,test

浏览 3提问于2018-08-18得票数 12

回答已采纳

3回答

如何在不重新训练模型的情况下获得XGBoost特征重要性图中的实际特征名称？

、、

我已经训练了我的XGBoost模型，但使用的是预处理数据(使用MinMaxScaler的中心和尺度)。因此，我遇到了列名/功能名丢失的类似情况。因此，当我尝试使用plot_importance(my_model_name)时，它会导致绘制特征重要性图，但只有f0、f1、f2等特征名称，而不是数据集中的实际特征名称，这一点必须很明显。大多数关于SO的答案都与以一种不丢失特征

浏览 1提问于2019-03-01得票数 17

3回答

确定为什么特征在决策树模型中很重要

、、、、

当我们检查xgboost或sklearn梯度增强模型的特征重要性时，我们可以确定特征的重要性。但我们不明白为什么这些功能是重要的，对吗？我被告知要使用，但即使运行一些样板示例也会引发错误，因此我正在寻找替代方法(甚至只是一种检查树和收集洞察力的过程方法，而不是plot_importance()图)。我希望看到代码(而不是理论)，您将如何检查实际模型并确定每个特性的

浏览 11提问于2017-11-04得票数 10

回答已采纳

1回答

如何使用category_encoder包获取二进制编码的原始值

、、、、

我想将这些包含在XGBoost模型中，以进行分类预测。我知道One热编码是解决这个问题的首选方法，但我宁愿做一些不会增加太多维数并且对新值有弹性的事情，所以我尝试使用category_encoders包进行二进制分类。http://contrib.scikit-learn.org/categorical-encoding/binary.html 使用此编码帮助我的模型摆脱了使用基本的one-hot编码，但编码后如何返回到原始标签towardsdat

浏览 25提问于2019-05-29得票数 5

4回答

如何为每个类找到最重要的属性

、、、、

我有一个有28个属性和7个类值的数据集。我想知道是否有可能找到最重要的属性(S)来决定每个类的类值。例如，一个答案可以是:属性2对1类最重要，属性6对2类最重要，或者更明智的答案是:属性2< 0.5对第1类最重要，属性6> 0.75对第2类最重要等等。我最初的方法是在数据上构建一个决策树，并找到每个类的信息增益/增益比最大的节点，这将是该类最重要的决定因素。问题在于，我发现的决策树实现没有给出每个节点的<

浏览 0提问于2018-10-16得票数 2

1回答

addPolylines需要数字经度值/纬度值-但我的值是经纬度/lng数值

、

这是一个简短的(我希望)。我正试着用传单画出我所在城市的自行车路线。但是addPolylines()不喜欢我的代码。这里有什么问题？

浏览 12提问于2021-09-02得票数 0

回答已采纳

1回答

ML模型的重要性信息来自因果图的距离或接近程度如何？

、

标题很大程度上涵盖了我的问题，但为了详细说明它:对于二进制分类问题(同样，对于简单性，并给出处理和控制组的“感觉”)，如果我们使用机器学习模型(例如随机森林)，我们最终会从经过训练的模型中获得特征重要性该培训利用上下采样或其他方法处理数据不平衡，并使用适当的样本，如在训练和验证期间分层，以模拟随机对照试验。我们还假设特性列表中有所有的混淆，即不再有其他混淆。我知道，ML模型只希望了解相关性，而不希望了解特性之间的因果关系。特征

浏览 0提问于2020-06-06得票数 1

2回答

从连接表中以行的形式获取列，而不是以相邻列的形式获取列

、、

我希望得到这样的输出，即A_PRODUCT表中的行后面是A_MODEL表中的行，然后是产品的A_AREA表中的行。以下是用于创建示例数据的SQL： CREATE TABLE A_PRODUCTPRODUCT_ID NVARCHAR(30),); VALUES ('A

浏览 14提问于2019-06-26得票数 1

回答已采纳

1回答

SharePoint使用查找下拉列表和获取值

、、、

我似乎在从下拉查找字段中获取返回值时遇到了一些问题。我有下面的代码，它从我要查找的列表中获取值： }} 它执行得很好，给了我下拉列表

浏览 11提问于2017-01-26得票数 1

回答已采纳

1回答

Python - Scikit找到分类变量的变量重要性

、、、、

我正在尝试使用python中的scikit learn来做一些不同的分类器问题(RF，GBM等)。除了建立模型和进行预测之外，我还希望看到变量的重要性。我知道有一种方法可以让你print(importances) 但是，我如何才能得到与变量名(即R中的summary(gbm)或R中的varImp(randomForest) )相关的更精确的东西，特别是如果它是一个多层<em

浏览 1提问于2015-03-20得票数 8

1回答

用KMeans解释集群中实例之间的相似之处

、

如果我使用KMeans中的聚类算法创建集群，有什么方法可以找到哪些属性用于将这些实例分组到集群中？示例:我有一个列为1-10的汽车数据集。我得到了3个集群，如何知道使用了哪些属性来生成它们？是因为集群1中的所有实例在第2列和第3列中都具有相同的值吗？

浏览 0提问于2021-04-05得票数 0

1回答

如何使用python在表中显示多个jpeg图像？

、、、、

我的目录里有一些jpeg。我想在窗口中以行和列的形式显示它们。例如，如果我有10幅图片，我想要显示2行5列表。2-如何使用matplotlib实现这一点？ 3-如何在浏览器中使用木星做这件事？

浏览 1提问于2018-10-01得票数 2

回答已采纳

1回答

以子图而不是顶点的形式获取结果: Gremlin - orient-db

、、

我正在使用java中的Gremlin和orient db。我能够使用可用的方法查询我的顶点和边，并获得结果。我使用back("Alias-name")来获得查询的结果顶点。我的问题是，我能否获得所有结果顶点的图(相关图和结果信息)，因为现在我可以获得顶点，但我希望在同一查询中获得结果顶点的整个“子图”信息。任何帮助都是非常感谢的。下面是一个包含通用示例的代码：

浏览 0提问于2014-04-07得票数 0

1回答

CGI/Ruby -将字符串转换为整数

、

下面是我的test.cgi文件。从html传入的参数是：为什么a.class没有显示为整数？即使是Ruby的.to_i也不能工作。 #!

浏览 0提问于2015-09-17得票数 0

1回答

R中的xgboost中的人类可读规则

、

我尝试在R中使用xgboost从我的数据中获取规则(gbtree)，这样我就可以在其他系统中使用这些规则(而不是带有‘predict’的预测数据)。输入数据有appr。具有二进制稀疏数据的1500列和40兆行，并且标签也是二进制列。library(xgboost) labels <- data.frame(labels = sample.int(2, m*1, TRUE)-1L

浏览 12提问于2017-03-09得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云