20分钟
scikit-learn API
- 属性:
.n_features_:一个整数,给出了特征的数量.classes_:一个形状为(n_classes,)的numpy array, 给出了样本的标签。(仅仅在分类问题中有效).n_classes_:一个整数,给出了类别的数量。(仅仅在分类问题中有效).best_score_:一个字典或者None,给出了训练完毕模型的最好的score.best_iteration_:一个字典或者None。当early_stopping_round参数设定时,它给出了训练完毕模型的最好的迭代步。.objective_:一个字符串或者可调用对象,给出了训练模型的目标函数.booster_:一个Booster对象,给出了底层的Booster对象。.evals_result_:一个字典或者None。当early_stopping_round参数设定时,它给出了模型的evaluation results。.feature_importances_: 一个形状为(n_features,)的numpy array,给出了特征的重要性(值越大,则对于的特征越重要)。
2. 方法:
.apply(X,num_iteration=0): 预测每个样本在每个树的哪个叶节点上。- 参数:
X: 一个array-like对象,或者一个sparse matrix, 其形状为(n_samples,n_features),表示测试样本集num_iteration: 一个整数,指示在预测时,使用多少个子树。默认为0,表示使用所有的子树。
- 返回值:一个
array-like对象,形状为(n_samples,n_trees)。 它给出了每个样本在每个子树的哪个节点上。
- 参数:
.fit(): 训练模型。 .fit(X, y, sample_weight=None, init_score=None, group=None, eval_set=None, eval_names=None, eval_sample_weight=None, eval_init_score=None, eval_group=None, eval_metric=None, early_stopping_rounds=None, verbose=True, feature_name='auto', categorical_feature='auto', callbacks=None) 参数:X: 一个array-like对象,或者一个sparse matrix, 其形状为(n_samples,n_features),表示训练样本集y: 一个array-like对象,形状为(n_samples,),给出了标签值。sample_weight:一个形状为(n_samples,)的array-like对象,或者为None。给出了每个训练样本的权重。默认为Noneinit_score: 一个形状为(n_samples,)的array-like对象,或者为None。给出了每个训练样本的init score。默认为Nonegroup: 一个形状为(n_samples,)的array-like对象,或者为None。给出了每个训练样本的分组。默认为Noneeval_set:一个元素为(X,y)的列表,或者None。 给出了验证集,用于早停。默认为None。 其中X,y的类型与参数X,y相同。eval_names:一个字符串的列表,或者None。给出了每个验证集的名字。默认为None。eval_sample_weight:一个array-like的列表,或者None。 给出了每个验证集中,每个样本的权重。默认为None。eval_init_score:一个array-like的列表,或者None。 给出了每个验证集中,每个样本的init score。默认为None。eval_group:一个array-like的列表,或者None。 给出了每个验证集中,每个样本的分组。默认为None。eval_metric:一个字符串、字符串列表、可调用对象、或者None。 给出了验证的metric。默认为None。early_stopping_rounds:一个整数或者None,默认为None。参考lightgbm.train()verbose: 一个布尔值。如果为True,并且至少有一个验证集,则输出evaluation信息。feature_name:一个字符串列表、或者'auto'。参考lightgbm.train()categorical_feature:一个字符串列表、整数、或者'auto'。参考lightgbm.train()callbacks:一个可调用对象的列表或者为None。参考lightgbm.train()
返回值:
self,即当前LGBMModel对象自己.predict(X,raw_score=False,num_iteration=0): 执行预测。 参数:X: 一个array-like对象,或者一个sparse matrix, 其形状为(n_samples,n_features),表示测试样本集。 注意:如果是numpy array或者pandas dataframe时,要求数据的列必须与训练时的列顺序一致。raw_score:一个布尔值,指示是否输出raw score。 默认为Falsenum_iteration:一个整数,指示在预测时,使用多少个子树。默认为0,表示使用所有的子树。
返回值:一个形状为
(n_samples,)或者形状为(n_samples,n_classed)的array-like对象,表示预测结果
学员评价