LightGBM 使用指南

备案控制台

登录注册

在线学习中心课程LightGBM 使用指南

20分钟

scikit-learn API

属性：
- .n_features_：一个整数，给出了特征的数量
- .classes_：一个形状为(n_classes,) 的numpy array，给出了样本的标签。（仅仅在分类问题中有效）
- .n_classes_：一个整数，给出了类别的数量。（仅仅在分类问题中有效）
- .best_score_：一个字典或者None，给出了训练完毕模型的最好的score
- .best_iteration_：一个字典或者None。当early_stopping_round 参数设定时，它给出了训练完毕模型的最好的迭代步。
- .objective_：一个字符串或者可调用对象，给出了训练模型的目标函数
- .booster_：一个Booster对象，给出了底层的Booster 对象。
- .evals_result_：一个字典或者None。当early_stopping_round 参数设定时，它给出了模型的evaluation results 。
- .feature_importances_：一个形状为(n_features,) 的 numpy array，给出了特征的重要性（值越大，则对于的特征越重要）。

2. 方法：

.apply(X,num_iteration=0)：预测每个样本在每个树的哪个叶节点上。
- 参数：
  - X：一个array-like 对象，或者一个sparse matrix，其形状为(n_samples,n_features) ，表示测试样本集
  - num_iteration：一个整数，指示在预测时，使用多少个子树。默认为0，表示使用所有的子树。
- 返回值：一个array-like对象，形状为(n_samples,n_trees)。它给出了每个样本在每个子树的哪个节点上。
.fit()：训练模型。 .fit(X, y, sample_weight=None, init_score=None, group=None, eval_set=None, eval_names=None, eval_sample_weight=None, eval_init_score=None, eval_group=None, eval_metric=None, early_stopping_rounds=None, verbose=True, feature_name='auto', categorical_feature='auto', callbacks=None) 参数：
- X：一个array-like 对象，或者一个sparse matrix，其形状为(n_samples,n_features) ，表示训练样本集
- y：一个array-like对象，形状为(n_samples,)，给出了标签值。
- sample_weight：一个形状为(n_samples,) 的array-like 对象，或者为None。给出了每个训练样本的权重。默认为None
- init_score：一个形状为(n_samples,) 的array-like 对象，或者为None。给出了每个训练样本的init score 。默认为None
- group：一个形状为(n_samples,) 的array-like 对象，或者为None。给出了每个训练样本的分组。默认为None
- eval_set：一个元素为(X,y) 的列表，或者None。给出了验证集，用于早停。默认为None。其中X,y 的类型与参数X,y 相同。
- eval_names：一个字符串的列表，或者None。给出了每个验证集的名字。默认为None。
- eval_sample_weight：一个array-like 的列表，或者None。给出了每个验证集中，每个样本的权重。默认为None。
- eval_init_score：一个array-like 的列表，或者None。给出了每个验证集中，每个样本的init score。默认为None。
- eval_group：一个array-like 的列表，或者None。给出了每个验证集中，每个样本的分组。默认为None。
- eval_metric：一个字符串、字符串列表、可调用对象、或者None。给出了验证的metric。默认为None。
- early_stopping_rounds：一个整数或者None，默认为None。参考lightgbm.train()
- verbose：一个布尔值。如果为True，并且至少有一个验证集，则输出evaluation 信息。
- feature_name：一个字符串列表、或者'auto'。参考lightgbm.train()
- categorical_feature：一个字符串列表、整数、或者'auto'。参考lightgbm.train()
- callbacks：一个可调用对象的列表或者为None 。参考lightgbm.train()
返回值：self，即当前LGBMModel 对象自己
.predict(X,raw_score=False,num_iteration=0)：执行预测。参数：
- X：一个array-like 对象，或者一个sparse matrix，其形状为(n_samples,n_features) ，表示测试样本集。注意：如果是numpy array 或者 pandas dataframe 时，要求数据的列必须与训练时的列顺序一致。
- raw_score：一个布尔值，指示是否输出raw score。默认为False
- num_iteration：一个整数，指示在预测时，使用多少个子树。默认为0，表示使用所有的子树。
返回值：一个形状为(n_samples,) 或者形状为(n_samples,n_classed) 的array-like 对象，表示预测结果

上一节: scikit-learn API 下一节: LGBMClassifier

目录

评价

推荐

1. 安装

安装步骤：

直接pip 安装：

2. 调参

调参指导

参数

核心参数

学习控制参数

IO 参数

目标函数的参数

度量参数

网络参数

GPU 参数

模型参数

3. 进阶

缺失值处理

分类特征支持

LambdaRank

并行学习

4. API

数据接口

Dataset

方法：

步骤三：

示例：

模型接口

模型接口

模型接口

直接学习

直接学习

scikit-learn API

scikit-learn API

LGBMClassifier

LGBMRegressor

LGBMRanker

Callbacks

绘图API

Booster API 转换

5. Docker

安装和使用

python 模式：

腾讯产业互联网学堂

课程评价 (0)

学员评价

相关云产品

云服务器

GPU 云服务器

FPGA 云服务器_FPGA 实例_硬件加速

相关课程推荐

scikit-learn API