这一节我们来介绍Logistic回归在scikit-learn中是如何实现的,话不多说,直接上代码:
我们还是挨个来看看它的参数都有哪些吧:
第1个参数:C
指正则化项的权重,它是正则化项系数α的倒数,也就是说,C值越小,正则化项的权重越大。
第2个参数:class_weight
指各个类别的权重,默认为None,即各类别权重相同;也可以指定为balanced,那么较少的类别将有较大的权重。
第3个参数:dual
即是否选择以对偶的方式求解,默认为False,不以对偶方式求解。
第4个参数:fit_intercept
指是否计算偏置b,默认为True,计算b的值。
第5个参数:intercept_scaling
与上一个参数有关。它指的是当线性关系wx+b被看成一个矩阵时,那么b的系数可看成1,因为b=1*b。因此,这个参数就是指b的系数。
第6个参数:multi_class
该参数指进行多分类时的策略。默认为一对多,即ovr(one vs rest);也可以选择multinomial,即采用多项式Logistic回归。
第7个参数:penalty
指采用惩罚项(正则化项)的类型,默认为L2正则化,也可以选择L1正则化。
第8个参数:solver
指求解最优化问题时所采用的算法,默认为liblinear。当数据集较大时,可以采用sag,即随机平均梯度下降法。此外,还可以使用newton-cg(牛顿法)和lbfgs(拟牛顿法)。
第9个参数:verbose
指日志冗长度,默认为0,不输出训练过程;当其取1时,偶尔会输出结果;当其值大于1时,每个子模型都会输出结果。
第10个参数:warm_start
指是否使用上一轮的结果继续进行训练,默认为False,表示每次从头开始训练。
领取专属 10元无门槛券
私享最新 技术干货