XGBoost对于变量选择是否有效？_ngx分页对于firestore收集是否有效？_如何测试值对于QFlags是否有效 - 腾讯云开发者社区

、、、

我知道XGBoost的用法，我知道这是一个业余问题 XGBoost是否可以像套索一样用于变量消除和选择目的，或者我们需要先使用套索来消除变量，然后再使用XGBoost来获得预测结果？

浏览 43提问于2019-07-03得票数 0

4回答

在使用XGBoost时，特性工程仍然有用吗？

、

我正在读与XGBoost有关的材料。这种方法不需要任何变量缩放，因为它是基于树的，这种方法可以捕捉复杂的非线性模式，相互作用。它既可以处理数值变量，也可以处理范畴变量，并且似乎冗余变量对该方法没有太大影响。通常，在预测建模中，您可以在所有的特性中进行一些选择，也可以从所拥有的一组特性中创建一些新的特性。因此，选择一个功能子集意味着您认为您的功能集中存在一些冗余；从当前功能集创建一些新特性意味着您对您的当前功能进行了一些功能转换。然后，这两点都应在XGBoost

浏览 0提问于2017-03-20得票数 23

2回答

利用Google引擎和XGBoost优化超参数

、、、

我从上面链接的例子中得到了什么：XGBoost是否有一种将训练指标返回给ML引擎的方法？对于tensorflow来说，这一过程似乎是自动化的，如文档中所述：您可能会注意到，本文档中没有说明如何将您的超参数度量传递给Cloud引擎培训服务。对于XGBoost是否有类似的机制？现在，我可以在每次试验结束时将每个度量结果转储到一个文件中，然后手动分析它们以选择最佳参数。但是，

浏览 0提问于2018-10-05得票数 0

回答已采纳

1回答

UseMethod("xgboost")出错:没有适用于"list“类的对象的”xgboost“方法。

我使用一个数据集，该数据集通过一个二进制变量显示公司的默认值。使用xgboost时，我遇到了这个问题。as.numeric(test.label)-1> system.time(xgb <- xgboostprint_every_n = 5,Error in UseMethod("xgboost&qu

浏览 45提问于2020-02-09得票数 1

1回答

解释XGB特性的重要性和SHAP值

、、、、

对于一个特定的预测问题，我观察到某个变量在生成(基于增益)的XGBoost特性重要性中排名很高，而在SHAP输出中排名相当低。如何解读这一点？同样，对于我们的预测问题，变量是否非常重要？

浏览 4提问于2022-06-15得票数 2

1回答

为什么XGBoost只支持二进制分类

、、、、

我注意到，在Python中，XGBoost的实现只支持分类目标变量的二进制分类。为什么不能使用这种方法对来自多个类别的目标进行分类？是否可以对我的多类数据集进行调整，以便使用XGBoost?

浏览 6提问于2020-01-22得票数 0

1回答

如何处理虚拟功能

、、、、

我想建立xgboost和随机森林。我使用的包要求在xgboost构造中，应该创建伪变量。问题是，我是否应该使用虚拟集来构建两者？(即使森林可以处理计算并且不需要假人)？为了测试模型并进行比较，我还应该将训练集中的分类变量更改为虚拟变量，对吗？换句话说，我的训练集和测试集对于每个模型都必须是相同的？非常感谢您的帮助！

浏览 12提问于2018-01-11得票数 0

3回答

XGBoost的贪婪分裂查找算法如何确定不同特征类型的候选拆分值？

、、、

基于Chen & Guestrin (2016) XGBoost:一个可扩展的树增强系统的论文，XGBoost的“精确分割查找算法在所有特征上列举了所有可能的分裂，以找到最佳的分割”(第3页)。因此，我的理解是，XGBoost对所有特性进行枚举，并使用每个特性的唯一值作为候选拆分点，然后选择使分割准则最大化的拆分值(增益)。那么，我的问题是为什么选择的浮点类型特性的拆分值通常不是该特性的唯一值之一？例如，对于具有浮点值的数据中的某个特性，如下所示: 966.0、1234.0、23

浏览 0提问于2018-08-02得票数 6

3回答

超调谐XGBoost参数

、、

XGBoost在处理分类变量和连续依赖变量方面做得很好。但是，如何为XGBoost问题选择优化的参数呢？watchlist, feval=RMPSE我所做的实验就是随机选择我是否自动选择了优化的(最佳)参数集？答案可以是任何语言。我只是在找技术)

浏览 0提问于2015-12-13得票数 33

回答已采纳

2回答

用于估计索赔成本的随机森林与XGBoost与MLP回归

、、、、

我已经确定了三种算法来测试:随机森林，XGBoost和一个多层感知器.XGBRegressorx.fit(train_features, train_labels)我是否正确处理分类特征的管理？有了上面的分数，你觉得第一和第二型号是不是太合适了？为什么我必须在XGBoost (10,000)中添加更多的估

浏览 0提问于2019-04-23得票数 3

1回答

多类分类问题的步骤

、、、

我应用的步骤如下：检查类是否平衡，如果出现不平衡，则纠正此问题。基于Pearson、Chi-2、RFE、logistic回归和XGBoost结果的特征选择从第二个步骤开始，实现步骤的正确顺序是什么，等等？我应该先平衡类，然后选择特性，然后应用XGBoost吗？此外，我应该把数据集分割成训练和测试，然后才应用简历，还是可以在整个数据集上将XGBoost与

浏览 0提问于2021-10-04得票数 0

回答已采纳

2回答

不重要特征对模型性能的影响

、、

使用XGBoost和RandomForests，不重要的特性(根据feature_importances_属性)是否会损害模型的性能？我是否需要仔细选择高度相关和导入特性？还是我抛出所有内容，并希望它能够正确地添加一些关于目标变量的信息？

浏览 0提问于2019-07-31得票数 3

回答已采纳

2回答

在windows .OSError：[WinError 127]上找不到指定的过程

、、、、

我试图在windows 10 PC上安装Xgboost，我按照安装的每一步执行了每个步骤--所有安装过程都已经完成，但是导入库时遇到了一个错误： OSError: WinError 127无法找到指定的过程

浏览 1提问于2018-06-03得票数 1

1回答

xgboost和线性回归新特征分析

、

对于线性回归，似乎一个新的特征必须是与目标变量的线性关系。但是，如果您为Xgboost创建了新特性，那么您需要考虑什么才能为xgboost或lightgbm创建一个新特性？

浏览 0提问于2019-04-17得票数 0

2回答

在xgboost中处理连续变量和分类变量的最好方法是什么？

、、、、

我的数据集有从0到100的连续变量，比如年龄从0到100，数据还有类别变量，比如有50个类别的省份。因此，我不知道是否需要将continues变量处理到bin中。以及处理各省的最佳方法是什么。Xgboost无法处理变量的字符串类型。对于有这么多类型的省份，我应该使用one-hot编码吗？

浏览 1提问于2016-12-11得票数 0

1回答

XGboost分类器

我是XGBoost的新手，目前正在做一个项目，在这个项目中我们已经构建了一个XGBoost分类器。现在我们想运行一些特征选择技术。对于这一点，反向消除方法是一个好主意吗？我在回归中使用过它，但我不确定是否/如何在分类问题中使用它。任何线索都将非常感谢。注意:我已经尝试过排列线重要性，并取得了很好的效果！寻找另一种方法来评估模型中的特征。

浏览 0提问于2019-10-03得票数 0

5回答

进口巨蟒吗？

、

git clone --recursive https://github.com/dmlc/xgboost我使用官方文档在ubuntu上安装xgboost。没有错误，但是当我启动我的ipython笔记本(这是anaconda环境)时，导入xgboost会显示错误，这不是模块。如何在我的anaconda python环境中导入xgboost？我是否需要在ubuntu中修改一些环境变量？

浏览 9提问于2017-06-16得票数 3

回答已采纳

1回答

如何将XGBoost预测映射到相应的数据行？

、、

XGBoost为测试数据集生成预测列表。我的问题是，如何将生成的预测映射到实际的测试文件行？假设第n个预测对应于第n个数据行是否严格安全？XGBoost在其操作中利用了多线程。我正在使用这个例子，并使用XGBoost的DMatrix数据格式。

浏览 2提问于2016-05-26得票数 0

2回答

如何获得等级特征的重要程度？

、、、、

我知道下面的特征选择方法(但是不幸的是，对于b和c方法，它没有考虑特性交互。我说的对吗？它通过考虑目标变量的每一列来工作。然而，对于方法a，它返回排名，但我们不确定它

浏览 0提问于2019-12-18得票数 0

回答已采纳

1回答

xgboost与H2o梯度提升

、

在xgboost和H2o gradient boosting中生成一个模型-在这两种情况下都得到了一个像样的模型。然而，xgboost将此变量显示为模型的关键贡献者之一，但根据H2o，梯度提升该变量并不重要。xgboost会以不同的方式处理缺少值的变量吗？两个型号的所有配置都完全相同。

浏览 0提问于2017-06-21得票数 2

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云