[mqic6czuv1.png]
2 线性回归算法概述
2.1 线性回归简介
◆ 在回归分析中,自变量与因变量之间满足或基本满足线性关系,可以使用线性模型进行拟合
◆ 如回归分析中,只有一个自变量的即为一元线性回归...VS 非线性
◆ 线性简言之就是两个变量之间存在一 次方函数关系
◆ 自然界中变 量间更多的关系是非线性的,绝对的线性关系相对很少
◆ 因此,在选择数学模型进行拟合的时候,很多情况使用非线性函数构造的模型可能比线性函数模型更好...,就是在训练过程中,将训练数据集拆分为训练集和验证集两个部分
训练集专用训练模型
验证集只为检验模型预测能力
当二者同时达到最优,即是模型最优的时候
[34nsdlpng3.png]
8.4 正则化原理...◆ 我们在前面的示例中可以看到,对于过拟合现象,往往都是模型过于复杂,超过实际需要
◆ 那么,能否在损失函数的计算中,对模型的复杂程度进行量化,越复杂的模型,就越对其进行”惩罚”, 以便使模型更加”中庸...我们实现了一个pool adjacent violators algorithm
算法,该算法使用一种并行化保序回归的方法。
训练输入是一个DataFrame,它包含三列 : 标签,功能和权重。