这是直线的标准形式.现在学习任务就是用得到的数据为两个参数选择合适的值.
3.定义什么是最好的模型(重点)
首先,我们知道要想找到最好的模型,就是这条直线和所有的数据点都尽量的接近.
设:
?...(其中,argmin是数学上找到最小化参数的缩写.平方损失能够找到两个参数的最好值.)
4.最小二乘解
上面已经说过了,我们要通过平均平方损失函数来找到
?...的值使得我们求的的函数尽量能够接近数据集. 因此我们自然的对损失函数求最小值.
?
现在我们要求的便是以
?
为变量,其他量都是常量的函数最小值.
由多元函数的极值理论有
?
分别对
?...而有了这两个值,那么应该有的都有了.通过数据集便能够得到一条好的拟合直线.
5.奥运会最小二乘拟合
读取数据代码
?
拟合算出未知参数
?
运行顶层脚本
?
画图
?...3.向量/矩阵损失函数的得到未知参数
上面证明了向量函数和标量函数之间得到的损失函数是等价的.事实上,我们在做数据处理的时候,都是用的矩阵来做的,计算机计算矩阵也更加方便.所以,我们直接从矩阵函数来得到未知参数