腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
XGBoost
对于
变量
选择
是否
有效
?
、
、
、
我知道
XGBoost
的用法,我知道这是一个业余问题
XGBoost
是否
可以像套索一样用于
变量
消除和
选择
目的,或者我们需要先使用套索来消除
变量
,然后再使用
XGBoost
来获得预测结果?
浏览 43
提问于2019-07-03
得票数 0
4
回答
在使用
XGBoost
时,特性工程仍然有用吗?
、
我正在读与
XGBoost
有关的材料。这种方法不需要任何
变量
缩放,因为它是基于树的,这种方法可以捕捉复杂的非线性模式,相互作用。它既可以处理数值
变量
,也可以处理范畴
变量
,并且似乎冗余
变量
对该方法没有太大影响。 通常,在预测建模中,您可以在所有的特性中进行一些
选择
,也可以从所拥有的一组特性中创建一些新的特性。因此,
选择
一个功能子集意味着您认为您的功能集中存在一些冗余;从当前功能集创建一些新特性意味着您对您的当前功能进行了一些功能转换。然后,这两点都应在
XGBoost
浏览 0
提问于2017-03-20
得票数 23
2
回答
利用Google引擎和
XGBoost
优化超参数
、
、
、
我从上面链接的例子中得到了什么:
XGBoost
是否
有一种将训练指标返回给ML引擎的方法?
对于
tensorflow来说,这一过程似乎是自动化的,如文档中所述: 您可能会注意到,本文档中没有说明如何将您的超参数度量传递给Cloud引擎培训服务。
对于
XGBoost
是否
有类似的机制? 现在,我可以在每次试验结束时将每个度量结果转储到一个文件中,然后手动分析它们以
选择
最佳参数。但是,
浏览 0
提问于2018-10-05
得票数 0
回答已采纳
1
回答
UseMethod("
xgboost
")出错:没有适用于"list“类的对象的”
xgboost
“方法。
我使用一个数据集,该数据集通过一个二进制
变量
显示公司的默认值。使用
xgboost
时,我遇到了这个问题。as.numeric(test.label)-1> system.time(xgb <-
xgboost
print_every_n = 5,Error in UseMethod("
xgboost
&qu
浏览 45
提问于2020-02-09
得票数 1
1
回答
解释XGB特性的重要性和SHAP值
、
、
、
、
对于
一个特定的预测问题,我观察到某个
变量
在生成(基于增益)的
XGBoost
特性重要性中排名很高,而在SHAP输出中排名相当低。 如何解读这一点?同样,
对于
我们的预测问题,
变量
是否
非常重要?
浏览 4
提问于2022-06-15
得票数 2
1
回答
为什么
XGBoost
只支持二进制分类
、
、
、
、
我注意到,在Python中,
XGBoost
的实现只支持分类目标
变量
的二进制分类。 为什么不能使用这种方法对来自多个类别的目标进行分类?
是否
可以对我的多类数据集进行调整,以便使用
XGBoost
?
浏览 6
提问于2020-01-22
得票数 0
1
回答
如何处理虚拟功能
、
、
、
、
我想建立
xgboost
和随机森林。我使用的包要求在
xgboost
构造中,应该创建伪
变量
。问题是,我
是否
应该使用虚拟集来构建两者?(即使森林可以处理计算并且不需要假人)?为了测试模型并进行比较,我还应该将训练集中的分类
变量
更改为虚拟
变量
,对吗?换句话说,我的训练集和测试集
对于
每个模型都必须是相同的?非常感谢您的帮助!
浏览 12
提问于2018-01-11
得票数 0
3
回答
XGBoost
的贪婪分裂查找算法如何确定不同特征类型的候选拆分值?
、
、
、
基于Chen & Guestrin (2016)
XGBoost
:一个可扩展的树增强系统的论文,
XGBoost
的“精确分割查找算法在所有特征上列举了所有可能的分裂,以找到最佳的分割”(第3页)。因此,我的理解是,
XGBoost
对所有特性进行枚举,并使用每个特性的唯一值作为候选拆分点,然后
选择
使分割准则最大化的拆分值(增益)。那么,我的问题是为什么
选择
的浮点类型特性的拆分值通常不是该特性的唯一值之一?例如,
对于
具有浮点值的数据中的某个特性,如下所示: 966.0、1234.0、23
浏览 0
提问于2018-08-02
得票数 6
3
回答
超调谐
XGBoost
参数
、
、
XGBoost
在处理分类
变量
和连续依赖
变量
方面做得很好。但是,如何为
XGBoost
问题
选择
优化的参数呢?watchlist, feval=RMPSE我所做的实验就是随机
选择
我
是否
自动
选择
了优化的(最佳)参数集? 答案可以是任何语言。我只是在找技术)
浏览 0
提问于2015-12-13
得票数 33
回答已采纳
2
回答
用于估计索赔成本的随机森林与
XGBoost
与MLP回归
、
、
、
、
我已经确定了三种算法来测试:随机森林,
XGBoost
和一个多层感知器.XGBRegressorx.fit(train_features, train_labels)我
是否
正确处理分类特征的管理?有了上面的分数,你觉得第一和第二型号是不是太合适了?为什么我必须在
XGBoost
(10,000)中添加更多的估
浏览 0
提问于2019-04-23
得票数 3
1
回答
多类分类问题的步骤
、
、
、
我应用的步骤如下:检查类
是否
平衡,如果出现不平衡,则纠正此问题。基于Pearson、Chi-2、RFE、logistic回归和
XGBoost
结果的特征
选择
从第二个步骤开始,实现步骤的正确顺序是什么,等等?我应该先平衡类,然后
选择
特性,然后应用
XGBoost
吗?此外,我应该把数据集分割成训练和测试,然后才应用简历,还是可以在整个数据集上将
XGBoost
与
浏览 0
提问于2021-10-04
得票数 0
回答已采纳
2
回答
不重要特征对模型性能的影响
、
、
使用
XGBoost
和RandomForests,不重要的特性(根据feature_importances_属性)
是否
会损害模型的性能? 我
是否
需要仔细
选择
高度相关和导入特性?还是我抛出所有内容,并希望它能够正确地添加一些关于目标
变量
的信息?
浏览 0
提问于2019-07-31
得票数 3
回答已采纳
2
回答
在windows .OSError:[WinError 127]上找不到指定的过程
、
、
、
、
我试图在windows 10 PC上安装
Xgboost
,我按照安装的每一步执行了每个步骤--所有安装过程都已经完成,但是导入库时遇到了一个错误: OSError: WinError 127无法找到指定的过程
浏览 1
提问于2018-06-03
得票数 1
1
回答
xgboost
和线性回归新特征分析
、
对于
线性回归,似乎一个新的特征必须是与目标
变量
的线性关系。 但是,如果您为
Xgboost
创建了新特性,那么您需要考虑什么才能为
xgboost
或lightgbm创建一个新特性?
浏览 0
提问于2019-04-17
得票数 0
2
回答
在
xgboost
中处理连续
变量
和分类
变量
的最好方法是什么?
、
、
、
、
我的数据集有从0到100的连续
变量
,比如年龄从0到100,数据还有类别
变量
,比如有50个类别的省份。因此,我不知道
是否
需要将continues
变量
处理到bin中。以及处理各省的最佳方法是什么。
Xgboost
无法处理
变量
的字符串类型。
对于
有这么多类型的省份,我应该使用one-hot编码吗?
浏览 1
提问于2016-12-11
得票数 0
1
回答
XGboost
分类器
我是
XGBoost
的新手,目前正在做一个项目,在这个项目中我们已经构建了一个
XGBoost
分类器。现在我们想运行一些特征
选择
技术。
对于
这一点,反向消除方法是一个好主意吗?我在回归中使用过它,但我不确定
是否
/如何在分类问题中使用它。任何线索都将非常感谢。 注意:我已经尝试过排列线重要性,并取得了很好的效果!寻找另一种方法来评估模型中的特征。
浏览 0
提问于2019-10-03
得票数 0
5
回答
进口巨蟒吗?
、
git clone --recursive https://github.com/dmlc/
xgboost
我使用官方文档在ubuntu上安装
xgboost
。没有错误,但是当我启动我的ipython笔记本(这是anaconda环境)时,导入
xgboost
会显示错误,这不是模块。 如何在我的anaconda python环境中导入
xgboost
?我
是否
需要在ubuntu中修改一些环境
变量
?
浏览 9
提问于2017-06-16
得票数 3
回答已采纳
1
回答
如何将
XGBoost
预测映射到相应的数据行?
、
、
XGBoost
为测试数据集生成预测列表。我的问题是,如何将生成的预测映射到实际的测试文件行?假设第n个预测对应于第n个数据行
是否
严格安全?
XGBoost
在其操作中利用了多线程。我正在使用这个例子,并使用
XGBoost
的DMatrix数据格式。
浏览 2
提问于2016-05-26
得票数 0
2
回答
如何获得等级特征的重要程度?
、
、
、
、
我知道下面的特征
选择
方法(但是不幸的是,
对于
b和c方法,它没有考虑特性交互。我说的对吗?它通过考虑目标
变量
的每一列来工作。 然而,
对于
方法a,它返回排名,但我们不确定它
浏览 0
提问于2019-12-18
得票数 0
回答已采纳
1
回答
xgboost
与H2o梯度提升
、
在
xgboost
和H2o gradient boosting中生成一个模型-在这两种情况下都得到了一个像样的模型。然而,
xgboost
将此
变量
显示为模型的关键贡献者之一,但根据H2o,梯度提升该
变量
并不重要。
xgboost
会以不同的方式处理缺少值的
变量
吗?两个型号的所有配置都完全相同。
浏览 0
提问于2017-06-21
得票数 2
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
从结构到性能,概述XGBoost、Light GBM和CatBoost的同与不同
机器学习能诊断病情,还能预测患者出院后的情况?
从结构到性能,一文概述XGBoost、Light GBM和CatBoost的同与不同
理解XGBoost机器学习模型的决策过程
生信篇:运用ROC曲线筛选生物标志物的策略
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
即时通信 IM
活动推荐
运营活动
广告
关闭
领券