CatBoost LossFunctionChange中的负要素重要性值

文章/答案/技术大牛

发布

1回答

python、machine-learning、catboost

我正在使用CatBoost进行排名任务。我使用QueryRMSE作为我的损失函数。我注意到，对于某些功能，功能重要性值为负值，我不知道如何解释它们。它在文档中说，第i个特征重要性计算为损失(不包括第i个特征的模型)-损失(模型)之间的差值。因此，负的特征重要性值意味着该特征使我的损失增加？那么这意味着什么呢？

浏览 25提问于2019-04-21得票数 0

回答已采纳

1回答

CatBoost功能重要性的默认度量

catboost

我同时使用CatBoost分类和回归模型，很难弄清楚特征重要性使用的是什么度量标准。根据CatBoost文档，非排名指标为PredictionValuesChange，排名指标为LossFunctionChange。我不明白排名和不排名在这里意味着什么。您可以对任何模型生成的概率进行排名。在什么情况下，使用排名/非排名指标？

浏览 0提问于2019-12-10得票数 0

1回答

用于LightGBM和CatBoost的模型转储分析器(如XGBFI)

python、xgboost、lightgbm、catboost

目前，我的雇主在一个生活环境中有多个GLM。我感兴趣的是识别新特性和交互，以提高这些GLM的准确性；就目前而言，我仅限于GLM结构，因此不可能简单地部署一个自动解释交互的解决方案。在过去，我使用XGBoost通过使用XGBFI / XGBFIR来识别强大的特性交互。我现在正在考虑使用LightGBM和CatBoost来做同样的事情，但似乎找不到像XGBFI这样的工具，它可以在这些模型上工作。问题：是否存在类似于XGBFI的

浏览 0提问于2021-03-03得票数 0

1回答

Catboost python特性重要性缺失了一个必需的位置参数：'value‘

python、catboost

我试图在python文件中计算特性的重要性。我通过Submit运行这个python文件。由于我们的数据节点上没有安装catboost库，所以我在python中手动加载它们。然后加载模型文件，并尝试计算特征的重要性。在这里，我得到了跟随错误 abc = model.get_feature_importance(type=catBoost.EFstrType().FeatureImportance(), prettified", configFi

浏览 0提问于2021-04-23得票数 0

回答已采纳

2回答

如何获取CatBoost在pandas数据帧中的特征重要性？

python、pandas、xgboost、catboost

所以我用Python运行了一个Catboost模型，基本上很简单： from catboost import CatBoostClassifier, Pool, cv loss_function="Logloss", iterations=200, ) 所以我想知道特征的重要性使用XGBoost分类器，我可以准备

浏览 155提问于2020-11-24得票数 2

1回答

如何将logit shap值转换为概率

python、catboost、shap

我一直在尝试使用logit链接将shap值转换为数据集中所有要素的概率。model_output ='probability‘参数不适用于我的catboost模型。我想转换每个特征的形状值，这样当你对它们求和时，它们等于力图上显示的概率。我使用了一个预先编写的函数将对数赔率转换为概率，但在力图中，总和并不相等。有什么建议吗？explainer = shap.TreeExplainer(catboost) s

浏览 41提问于2021-03-05得票数 1

2回答

如何知道特征影响模型预测的因素

python、machine-learning、scikit-learn、decision-tree

我已经在一个数据集上训练了我的模型，我使用决策树来训练我的模型，它有3个输出类-是，完成和否，我通过检查分类器的特征重要性来了解在做出决策时最具决定性的特征。现在我已经找到了最具决定性的特征，我想知道该特征是如何贡献的，从这个意义上说，如果关系是正的，那么如果特征值增加，它就会导致是，如果它是负的，它就会导致否，依此类推，我也想知道同样的大小。我想知道这是否有一个解决方案，也想知道

浏览 3提问于2017-02-08得票数 0

1回答

Catboost预测概率为负

r、catboost

我是catboost的新手，我正尝试在R中的虹膜数据集上进行单次迭代。我从预测函数的输出中注意到负的概率。你知道为什么会这样吗？另外，有没有一种方法可以在R中绘制catboost树？Petal.Width")]train_pool <- <e

浏览 49提问于2020-07-13得票数 0

2回答

为什么当我用相同的数据集构建模型但使用catboost时，xgboost模型中最重要的特性一点也不重要？

machine-learning、predictive-modeling、xgboost、feature-engineering、correlation

'E', 0.0)('G', 4.4471968)('I', 4.1248) ('G', 7.5309680136560075)('I', 22.54539556854636) 正如你所看到<

浏览 0提问于2019-12-27得票数 1

1回答

模型特征重要性和形状摘要图的差异

catboost、shap

我一直在玩玩具数据集，以了解更多关于shap库和使用的信息。我发现，catboost回归模型的特性导入与shap库中来自summary_plot的特性导入不同。我从model.feature_importances_ on X_train集和shap explainer关于X_test集的概要图中分析了特性的重要性。这是我的源代码-from catboost imp

浏览 4提问于2022-02-12得票数 3

1回答

类不平衡的catboost分类器？

python、classification、catboost

我在二进制分类模型中使用catboost分类器，其中我有一个高度不平衡的数据集0 -> 115000和1 -> 10000。请有人指导我如何在分类器中使用以下参数：从文档中，我的印象是，我可以使用负类和比的正类之和，即115000/10000=11.5作为scale_pos_weight的输入，但我不确定。请让我知道这两个参数的确切值和导出该值<e

浏览 3提问于2020-01-15得票数 1

回答已采纳

2回答

R中带有潮汐模型的catboost模型的总结形状图

r、tidymodels、catboost、shap、vip

我正试图在tidymodel框架内构建一个catboost模型。下面给出了最小可重现性的例子。我可以使用DALEX和modelStudio软件包来获得模型解释，但我想为这个catboost模型创建VIP情节、和概要图形。我试过像fastshap，SHAPforxgboost这样的包，没有任何运气。我意识到，我必须从model对象中提取变量重要性和形状值，并使用它们生成这些图，但不知道如何做到这一点。library(tidymodels)library

浏览 17提问于2022-03-05得票数 2

1回答

在使用随机森林时，我是否应该包括具有高度预测性但出现次数非常少的功能？

random-forest

我试图在一个拥有大约25,000个观察值的数据集上运行一个二进制分类随机森林，我大约有300个特征。所有这些功能都至少出现一次，但相当多的功能总共只出现不到50次，有些甚至不到10次。如果我可以在运行任何东西之前删除它们，那么我的模型的训练时间就会减少很多。或者我应该只运行模型中的所有内容，并删除最不重要的功能？

浏览 3提问于2018-12-28得票数 0

2回答

使用集成投票分类器查找前3个特征重要性

python、machine-learning、scikit-learn、classification、ensemble-learning

我是一个初学者，我不知道如何使用投票分类器来获得特征重要性。=estimators,voting='hard') 例外:它应该给我使用投票分类器的变量的特征重要性

浏览 0提问于2019-10-30得票数 1

1回答

RFECV网格分数中的数字是否与所选特征相等？

pandas、computer-vision、classification、rfe

我正在寻求一些关于RFECV中与selector.grid_scores_相关的数字的澄清。estimator_RFECV.fit(X_train, y_train) 使用estimator_RFECV.ranking_，通过CV选择了27个特征，但是，当我查看estimator_RFECV.grid_scores_时，这里的值(精度)不是最高的。我对grid_scores_的解释是错误的吗?我不应该期望27具有最高的准确性？

浏览 8提问于2020-09-07得票数 0

3回答

scikit中的特征选择-学习大量特征

python-3.x、machine-learning、scikit-learn、classification、data-science

我是机器学习的初学者。我正在做基于49个特征的二进制分类。前7个特性是float64类型的。接下来的18个要素是多类类型，其余的是二进制类类型，即0或1。0.00000000e+00 1.49018368e-05 0.00000000e+00 0.00000000e+00因为它们都不重要，所以我在18个多类类型的要素的子集上进行了尝试0.02915153 0.02044009

浏览 1提问于2017-12-19得票数 2

1回答

CNN如何做包围盒回归，特征和权重代表什么？

cnn

我知道，在房价物流回归问题中，权重和特征分别代表了要素或特征变量系数的“重要性”，最小的LSR损失可以得到系数的值，问题是：在BBR中，特征和权重代表什么？我认为不可能是T、L、W和H，因为这些绝对值会因距离/规模和视角的不同而有很大差异，但是\frac{W}{H}的比率是一个

浏览 0提问于2019-01-20得票数 1

3回答

python中线性回归的主要特性

python

有没有办法查看哪些列对线性回归模型的贡献最大？谢谢。

浏览 0提问于2021-03-06得票数 0

1回答

错误:无法创建列车工作目录: catboost_info

python、catboost

我一直在按照链接的教程来构建catboost分类器模型： model.grid_search(grid,train_dataset)CatBoostError: catboost/libs/train_lib/dir_helper.cpp:20: Can't create train working dir: catboost_info

浏览 64提问于2021-09-02得票数 0

点击加载更多