腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
CatBoost
LossFunctionChange
中
的
负
要素
重要性
值
、
、
我正在使用
CatBoost
进行排名任务。我使用QueryRMSE作为我
的
损失函数。我注意到,对于某些功能,功能
重要性
值
为负值,我不知道如何解释它们。它在文档
中
说,第i个特征
重要性
计算为损失(不包括第i个特征
的
模型)-损失(模型)之间
的
差值。 因此,
负
的
特征
重要性
值
意味着该特征使我
的
损失增加?那么这意味着什么呢?
浏览 25
提问于2019-04-21
得票数 0
回答已采纳
1
回答
CatBoost
功能
重要性
的
默认度量
我同时使用
CatBoost
分类和回归模型,很难弄清楚特征
重要性
使用
的
是什么度量标准。根据
CatBoost
文档,非排名指标为PredictionValuesChange,排名指标为
LossFunctionChange
。 我不明白排名和不排名在这里意味着什么。您可以对任何模型生成
的
概率进行排名。在什么情况下,使用排名/非排名指标?
浏览 0
提问于2019-12-10
得票数 0
1
回答
用于LightGBM和
CatBoost
的
模型转储分析器(如XGBFI)
、
、
、
目前,我
的
雇主在一个生活环境中有多个GLM。我感兴趣
的
是识别新特性和交互,以提高这些GLM
的
准确性;就目前而言,我仅限于GLM结构,因此不可能简单地部署一个自动解释交互
的
解决方案。在过去,我使用XGBoost通过使用XGBFI / XGBFIR来识别强大
的
特性交互。我现在正在考虑使用LightGBM和
CatBoost
来做同样
的
事情,但似乎找不到像XGBFI这样
的
工具,它可以在这些模型上工作。 问题:是否存在类似于XGBFI
的
浏览 0
提问于2021-03-03
得票数 0
1
回答
Catboost
python特性
重要性
缺失了一个必需
的
位置参数:'value‘
、
我试图在python文件中计算特性
的
重要性
。我通过Submit运行这个python文件。由于我们
的
数据节点上没有安装
catboost
库,所以我在python
中
手动加载它们。然后加载模型文件,并尝试计算特征
的
重要性
。在这里,我得到了跟随错误 abc = model.get_feature_importance(type=
catBoost
.EFstrType().FeatureImportance(), prettified", configFi
浏览 0
提问于2021-04-23
得票数 0
回答已采纳
2
回答
如何获取
CatBoost
在pandas数据帧
中
的
特征
重要性
?
、
、
、
所以我用Python运行了一个
Catboost
模型,基本上很简单: from
catboost
import CatBoostClassifier, Pool, cv loss_function="Logloss", iterations=200, ) 所以我想知道特征
的
重要性
使用XGBoost分类器,我可以准备
浏览 155
提问于2020-11-24
得票数 2
1
回答
如何将logit shap
值
转换为概率
、
、
我一直在尝试使用logit链接将shap
值
转换为数据集中所有
要素
的
概率。model_output ='probability‘参数不适用于我
的
catboost
模型。我想转换每个特征
的
形状
值
,这样当你对它们求和时,它们等于力图上显示
的
概率。我使用了一个预先编写
的
函数将对数赔率转换为概率,但在力图中,总和并不相等。有什么建议吗?explainer = shap.TreeExplainer(
catboost
) s
浏览 41
提问于2021-03-05
得票数 1
2
回答
如何知道特征影响模型预测
的
因素
、
、
、
我已经在一个数据集上训练了我
的
模型,我使用决策树来训练我
的
模型,它有3个输出类-是,完成和否,我通过检查分类器
的
特征
重要性
来了解在做出决策时最具决定性
的
特征。现在我已经找到了最具决定性
的
特征,我想知道该特征是如何贡献
的
,从这个意义上说,如果关系是正
的
,那么如果特征
值
增加,它就会导致是,如果它是
负
的
,它就会导致否,依此类推,我也想知道同样
的
大小。我想知道这是否有一个解决方案,也想知道
浏览 3
提问于2017-02-08
得票数 0
1
回答
Catboost
预测概率为
负
、
我是
catboost
的
新手,我正尝试在R
中
的
虹膜数据集上进行单次迭代。我从预测函数
的
输出中注意到
负
的
概率。你知道为什么会这样吗?另外,有没有一种方法可以在R
中
绘制
catboost
树?Petal.Width")]train_pool <- <e
浏览 49
提问于2020-07-13
得票数 0
2
回答
为什么当我用相同
的
数据集构建模型但使用
catboost
时,xgboost模型中最重要
的
特性一点也不重要?
、
、
、
、
'E', 0.0)('G', 4.4471968)('I', 4.1248) ('G', 7.5309680136560075)('I', 22.54539556854636) 正如你所看到<
浏览 0
提问于2019-12-27
得票数 1
1
回答
模型特征
重要性
和形状摘要图
的
差异
、
我一直在玩玩具数据集,以了解更多关于shap库和使用
的
信息。我发现,
catboost
回归模型
的
特性导入与shap库
中
来自summary_plot
的
特性导入不同。我从model.feature_importances_ on X_train集和shap explainer关于X_test集
的
概要图中分析了特性
的
重要性
。这是我
的
源代码-from
catboost
imp
浏览 4
提问于2022-02-12
得票数 3
1
回答
类不平衡
的
catboost
分类器?
、
、
我在二进制分类模型中使用
catboost
分类器,其中我有一个高度不平衡
的
数据集0 -> 115000和1 -> 10000。请有人指导我如何在分类器中使用以下参数:从文档
中
,我
的
印象是,我可以使用
负
类和比
的
正类之和,即115000/10000=11.5作为scale_pos_weight
的
输入,但我不确定。请让我知道这两个参数的确切
值
和导出该
值
<e
浏览 3
提问于2020-01-15
得票数 1
回答已采纳
2
回答
R
中
带有潮汐模型
的
catboost
模型
的
总结形状图
、
、
、
、
我正试图在tidymodel框架内构建一个
catboost
模型。下面给出了最小可重现性
的
例子。我可以使用DALEX和modelStudio软件包来获得模型解释,但我想为这个
catboost
模型创建VIP情节、和概要图形。我试过像fastshap,SHAPforxgboost这样
的
包,没有任何运气。我意识到,我必须从model对象中提取变量
重要性
和形状
值
,并使用它们生成这些图,但不知道如何做到这一点。library(tidymodels)library
浏览 17
提问于2022-03-05
得票数 2
1
回答
在使用随机森林时,我是否应该包括具有高度预测性但出现次数非常少
的
功能?
我试图在一个拥有大约25,000个观察
值
的
数据集上运行一个二进制分类随机森林,我大约有300个特征。所有这些功能都至少出现一次,但相当多
的
功能总共只出现不到50次,有些甚至不到10次。如果我可以在运行任何东西之前删除它们,那么我
的
模型
的
训练时间就会减少很多。或者我应该只运行模型
中
的
所有内容,并删除最不重要
的
功能?
浏览 3
提问于2018-12-28
得票数 0
2
回答
使用集成投票分类器查找前3个特征
重要性
、
、
、
、
我是一个初学者,我不知道如何使用投票分类器来获得特征
重要性
。=estimators,voting='hard') 例外:它应该给我使用投票分类器
的
变量
的
特征
重要性
浏览 0
提问于2019-10-30
得票数 1
1
回答
RFECV网格分数
中
的
数字是否与所选特征相等?
、
、
、
我正在寻求一些关于RFECV
中
与selector.grid_scores_相关
的
数字
的
澄清。estimator_RFECV.fit(X_train, y_train) 使用estimator_RFECV.ranking_,通过CV选择了27个特征,但是,当我查看estimator_RFECV.grid_scores_时,这里
的
值
(精度)不是最高
的
。我对grid_scores_
的
解释是错误
的
吗?我不应该期望27具有最高
的
准确性?
浏览 8
提问于2020-09-07
得票数 0
3
回答
scikit
中
的
特征选择-学习大量特征
、
、
、
、
我是机器学习
的
初学者。我正在做基于49个特征
的
二进制分类。前7个特性是float64类型
的
。接下来
的
18个
要素
是多类类型,其余
的
是二进制类类型,即0或1。0.00000000e+00 1.49018368e-05 0.00000000e+00 0.00000000e+00因为它们都不重要,所以我在18个多类类型
的
要素
的
子集上进行了尝试0.02915153 0.02044009
浏览 1
提问于2017-12-19
得票数 2
1
回答
CNN如何做包围盒回归,特征和权重代表什么?
我知道,在房价物流回归问题中,权重和特征分别代表了
要素
或特征变量系数
的
“
重要性
”,最小
的
LSR损失可以得到系数
的
值
,问题是:在BBR
中
,特征和权重代表什么?我认为不可能是T、L、W和H,因为这些绝对
值
会因距离/规模和视角
的
不同而有很大差异,但是\frac{W}{H}
的
比率是一个
浏览 0
提问于2019-01-20
得票数 1
3
回答
python中线性回归
的
主要特性
有没有办法查看哪些列对线性回归模型
的
贡献最大?谢谢。
浏览 0
提问于2021-03-06
得票数 0
1
回答
错误:无法创建列车工作目录:
catboost
_info
、
我一直在按照链接
的
教程来构建
catboost
分类器模型: model.grid_search(grid,train_dataset)CatBoostError:
catboost
/libs/train_lib/dir_helper.cpp:20: Can't create train working dir:
catboost
_info
浏览 64
提问于2021-09-02
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
对象存储
云直播
实时音视频
活动推荐
运营活动
广告
关闭
领券