Logistic回归在scikit-learn中的各参数详解

文章来源：企鹅号 - 夏虫不可以语于冰

这一节我们来介绍Logistic回归在scikit-learn中是如何实现的，话不多说，直接上代码：

我们还是挨个来看看它的参数都有哪些吧：

第1个参数：C

指正则化项的权重，它是正则化项系数α的倒数，也就是说，C值越小，正则化项的权重越大。

第2个参数：class_weight

指各个类别的权重，默认为None，即各类别权重相同；也可以指定为balanced，那么较少的类别将有较大的权重。

第3个参数：dual

即是否选择以对偶的方式求解，默认为False，不以对偶方式求解。

第4个参数：fit_intercept

指是否计算偏置b，默认为True，计算b的值。

第5个参数：intercept_scaling

与上一个参数有关。它指的是当线性关系wx+b被看成一个矩阵时，那么b的系数可看成1，因为b=1*b。因此，这个参数就是指b的系数。

第6个参数：multi_class

该参数指进行多分类时的策略。默认为一对多，即ovr（one vs rest）；也可以选择multinomial，即采用多项式Logistic回归。

第7个参数：penalty

指采用惩罚项（正则化项）的类型，默认为L2正则化，也可以选择L1正则化。

第8个参数：solver

指求解最优化问题时所采用的算法，默认为liblinear。当数据集较大时，可以采用sag，即随机平均梯度下降法。此外，还可以使用newton-cg（牛顿法）和lbfgs（拟牛顿法）。

第9个参数：verbose

指日志冗长度，默认为0，不输出训练过程；当其取1时，偶尔会输出结果；当其值大于1时，每个子模型都会输出结果。

第10个参数：warm_start

指是否使用上一轮的结果继续进行训练，默认为False，表示每次从头开始训练。

相关快讯