Xgboost 使用指南

8分钟

xgboost.XGBClassifier 和 xgboost.XGBRegressor 的方法

xgboost.XGBClassifier 和 xgboost.XGBRegressor 的方法：

.fit()：训练模型

fit(X, y, sample_weight=None, eval_set=None, eval_metric=None,
    early_stopping_rounds=None,verbose=True, xgb_model=None)

参数：

X：一个array-like，表示训练集
y：一个序列，表示标记
sample_weight：一个序列，给出了每个样本的权重
eval_set：一个列表，元素为(X,y)，给出了验证集及其标签。它们用于早停。如果有多个验证集，则使用最后一个
eval_metric：一个字符串或者可调用对象，用于evaluation metric
- 如果为字符串，则是内置的度量函数的名字
- 如果为可调用对象，则它的签名为(y_pred,y_true)==>(str,value)
early_stopping_rounds：指定早停的次数。参考xgboost.train()
verbose：一个布尔值。如果为True，则打印验证集的评估结果。
xgb_model：一个Booster实例，或者一个存储了xgboost 模型的文件的文件名。它给出了待训练的模型。这种做法允许连续训练。

.predict()：执行预测

predict(data, output_margin=False, ntree_limit=0)

参数:

data：一个 DMatrix 对象，表示测试集
output_margin：一个布尔值。表示是否输出原始的、未经过转换的margin value
ntree_limit：一个整数。表示使用多少棵子树来预测。默认值为0，表示使用所有的子树。如果训练的时候发生了早停，则你可以使用booster.best_ntree_limit。

返回值：一个ndarray，表示预测结果

对于回归问题，返回的就是原始的预测结果
对于分类问题，返回的就是预测类别(阈值为 0.5 )

.predict_proba(data, output_margin=False, ntree_limit=0) ：执行预测，预测的是各类别的概率参数：参考.predict() 返回值：一个ndarray，表示预测结果

它只用于分类问题，返回的是预测各类别的概率

.evals_result()：返回一个字典，给出了各个验证集在各个验证参数上的历史值它不同于cv() 函数的返回值。cv() 函数返回evaluation history 是早停时刻的。而这里返回的是所有的历史值

上一节: xgboost.XGBClassifier 下一节: Scikit-Learn API-示例

目录

评价

推荐

1. 安装

安装

2. 调参

调参指导

通用参数

tree booster 参数1

tree booster 参数2

dart booster 参数

linear booster 参数

tweedie regression 参数

学习任务参数

3. 外存计算

外存计算

4. GPU计算

GPU计算

5. 单调约束

单调约束

6. DART booster

DART booster

7. Python API

数据格式

DMatrix

DMatrix-示例

Booster

Booster-示例

xgboost.train()

xgboost.cv()

直接学习-示例

Scikit-Learn API

xgboost.XGBRegressor

xgboost.XGBClassifier

xgboost.XGBClassifier 和 xgboost.XGBRegressor 的方法

Scikit-Learn API-示例

xgboost.plot_importance()

xgboost.plot_tree()

xgboost.tp_graphviz()

绘图API-示例

腾讯产业互联网学堂

课程评价 (0)

学员评价

相关云产品

云服务器

GPU 云服务器

FPGA 云服务器_FPGA 实例_硬件加速

相关课程推荐

xgboost.XGBClassifier 和 xgboost.XGBRegressor 的方法