在R中的Methyl450k数据集上实现XGBoost_xgboost算法在R中的实现--代码中标签的含义是什么？_在R中返回数据集的函数 - 腾讯云开发者社区

r、classification、xgboost

我正在尝试在Methyl450k数据集上实现XGBoost。数据包含大约特定于480000+的CpG站点，后续beta值在0到1之间。0.08036409 0.10395457 0.04063595 0.4014187 0.8026643 0.17762644 0.7194800 0.8156545 1 我已经尝试在R中实现

浏览 21提问于2019-03-18得票数 0

5回答

GBM对XGBOOST？关键的区别？

machine-learning、algorithms、xgboost、ensemble-modeling、gbm

我试图理解GBM和XGBOOST之间的关键区别。我试着搜索它，但是找不到任何好的答案来解释这两种算法之间的区别，以及为什么xgboost几乎总是比GBM表现得更好。是什么让XGBOOST这么快？

浏览 0提问于2017-02-11得票数 81

回答已采纳

1回答

将PMML模型导入Python (Scikit-learn)

python、r、scikit-learn、pmml

似乎有几种方法可以将PMML模型从scikit中导出，比如sklearn2pmml，但是向相反方向输出的信息却少了很多。我的例子是以前在R中构建的XGboost模型，并使用r2pmml保存到PMML，我想在Python中使用该模型。Scikit通常使用泡菜来保存/加载模型，但是是否也可以将模型导入到scikit中-使用PMML学习？

浏览 6提问于2016-10-14得票数 7

回答已采纳

2回答

使用大型(+15 gb) CSV数据集和Pandas/XGBoost

python、pandas、machine-learning、xgboost、dask

我正在尝试找到一种在Pandas中开始处理非常大的CSV文件的方法，最终能够使用XGBoost进行一些机器学习。我在使用mySQL或一些sqllite框架来管理我的数据块之间左右为难；我的问题是稍后的机器学习方面，还是一次加载块来训练模型。我的另一个想法是使用Dask，它是由off Pandas构建的，但也具有XGBoost功能。我不确定最好的

浏览 10提问于2017-07-26得票数 3

1回答

在R环境中部署Amazon sagemaker生成的XGBoost模型

python、r、xgboost、amazon-sagemaker

我正在尝试在R环境中部署一个使用Amazon sagemaker训练的XGBoost模型。sagemaker生成的模型存储为Python pickle对象。使用R中的{reticulate}包，我可以将模型导入R中。然而，与在相同的测试数据集上直接在Amazon sagemaker上使用模型相比，在</

浏览 18提问于2019-01-17得票数 0

2回答

在某些情况下，xgb.train和xgb.XGBRegressor之间的差异是

python、machine-learning、scikit-learn、regression、xgboost

我注意到在Python中有两种可能的XGBoost实现，如和所讨论的import xgboost as xgbimport xgboostimpo

浏览 5提问于2019-12-18得票数 1

1回答

多类分类问题的步骤

feature-selection、cross-validation、class-imbalance、gradient-boosting-decision-trees

因此，这个问题更多的是理论性的，而不是实践性的。我得到了4类汽车车身类型(如轿车、掀背车等)的数据。以及不同的特性(门、座椅、最大速度等)。目标是建立一个模型，通过提供的特性来预测类。我应用的步骤如下：检查类是否平衡，如果出现不平衡，则纠正此问题。基于Pearson、Chi-2、RFE、logistic回归和XGBoost结果的特征选择 在</e

浏览 0提问于2021-10-04得票数 0

回答已采纳

1回答

TypeError在解释XGBoost分类器权重时

python、xgboost、eli5

我正致力于在由XGBoost提供的泰坦尼克号数据集上实现。我在ELI 5( ELI5 )的正式文档中的这个链接上找到了包XGBoost和使用XGBoost在泰坦尼克号数据集中实现这个包的教程。在笔记本的第三部分，我尝试将show_weights()函数应用于

浏览 2提问于2021-04-30得票数 0

4回答

如何在xgboost中关闭静音=1？

r、xgboost

我正在尝试训练xgboost模型，并且训练似乎有效，但我无法将参数静默设置为0，即打印训练迭代。

浏览 1提问于2018-02-22得票数 2

回答已采纳

1回答

星火ML梯度提升树而不是使用所有节点

python、apache-spark、pyspark、apache-spark-ml

我正在使用 in pyspark在AWS集群上训练一个包含大约400 k行和~9k列的数据帧上的二进制分类模型。我将此与当前的解决方案进行比较，该解决方案是在一个可以容纳内存中整个数据帧的大型XGBoost上运行的。我希望我能在星火中更快地训练(并获得新的观测)，因为它将是分布/平行的。然而，当观察

浏览 1提问于2018-03-08得票数 4

回答已采纳

1回答

为什么我的助推车型在61款中只有4款适合呢？

machine-learning、neural-network、classification、predictive-modeling、xgboost

我的数据集大小是977，类比例是77:23。我的数据集中有61个特征。然而，经过大量的特征选择活动后，我得到了5个功能。但是，这5个特征是用RFECV、Borutapy等随机森林估计器来识别的。因此，有了5个特征，我认为我的Xgboost模型在测试集上不会过分适合，并且提供了更好的性能，但是Xgboost模型仍然适用于测试集，在</em

浏览 0提问于2022-03-04得票数 1

1回答

R保存xgb模型命令错误：“模型必须是xgb.Booster”

r、xgboost

‘'bst’是我在R中构建的xgboost模型的名称，它给出了使用这段代码的测试数据集的预测值。因此，它肯定是一个xgboost模型。predict(bst , xdtest) # get prediction in test sample现在，我想保存模型，以便另一个可以使用模型与他们的数据

浏览 11提问于2022-04-22得票数 0

1回答

有可能提取经过训练的ML模型的数学表达式吗？

python、r、machine-learning-model、mathematics

在Python & R中，线性回归模型在学习训练数据后给出了数学表达式，通常以截距、变量系数和p值/t值的形式表示。在训练数据集上对复杂模型进行训练后，可以提取基于决策树、随机森林、XGBoost等复杂模型的数学表示吗？

浏览 0提问于2022-11-11得票数 1

3回答

Xgboost处理不平衡分类数据

r、xgboost

我有一个大约20000个训练样本的数据集，我想对其进行二进制分类。问题是数据集严重不平衡，只有大约1000个属于正类。我正在尝试使用xgboost (in R)来做我的预测。我试着阅读了这篇关于如何在xgboost中调优参数的文章。但它只提到了哪些参数有助于不平衡的数据集，而没有提到如何调整它们。如果任何人对调整xgboost

浏览 2提问于2016-12-05得票数 8

回答已采纳

1回答

Keras基于图预测数，一点精度也没有

python、tensorflow、keras

我是神经网络世界的新手，我不慌不忙地用tensorflow/keras写了一篇预言algoritm。这段代码只是试图根据图表根据Alt和Temp来预测roc。Alt,Temp,Roc0.0,-40.0,9.62.0,-40.0,9.64.0,-40.0,9.62.5,30.0,5.54.

浏览 12提问于2022-09-23得票数 0

回答已采纳

1回答

初学者的XGBoost* : XGBoost中的3对特性有什么区别？*

xgboost

请你帮我区分一下XGBoost的一些特性好吗？非常感谢。 -xgb.fit 它们不都能防止过度适应吗？

浏览 1提问于2019-08-30得票数 1

2回答

是否使用正确的方法及早停止xgboost？

xgboost、model-selection

我在R中使用xgboost软件包，在75发子弹时就会提前停止。为了监控进度，算法在每一轮训练和测试后打印出F1成绩。在算法完成75轮后，xgboost返回测试集上得分最高的模型，而不是训练集。我的猜测是，这与xgboost的监视功能和监视列表参数有关。在训练期间，我打算允许算法访问测试集(使用监视列表参数)，目的是监视培训过程

浏览 0提问于2018-04-17得票数 6

3回答

在Python语言中为XGBoost指定tree_method参数

python、machine-learning、xgboost

我正在Python语言中使用XGBoost (PyPl上的最新版本: 0.6)开发一个预测模型，并且已经对大约一半的数据进行了训练。现在我有了我的最终模型，我用我所有的数据对它进行了训练，但得到了这条消息，这是我以前从未见过的：import numpy as np im

浏览 924提问于2017-05-19得票数 2

1回答

为什么XGBoost只支持二进制分类

python、machine-learning、decision-tree、xgboost、multiclass-classification

我注意到，在Python中，XGBoost的实现只支持分类目标变量的二进制分类。为什么不能使用这种方法对来自多个类别的目标进行分类？是否可以对我的多类数据集进行调整，以便使用XGBoost?

浏览 6提问于2020-01-22得票数 0

1回答

R中tree_method = 'hist‘的xgboost

r、xgboost、kaggle

根据gmvs.xgost vs.LightGBM (https://www.kaggle.com/nschneider/gbm-vs-xgboost-vs-lightgbm)的基准，可以使用该参数来实现xgboost。tree_method = 'hist' 在R.

浏览 0提问于2017-10-11得票数 1

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云