文章/答案/技术大牛

发布

线性回归的最小二乘法与梯度下降法之R实现

文章来源：企鹅号 - 芦苇笔记

线性回归的最小二乘法与梯度下降法之R实现1.0 前言

放假在家，想着注册一个公众号，作为学习笔记记录及分享交流。

本文第一篇，对线性回归的最小二乘法和梯度下降法，利用R语言进行实现。

2.0 线性回归介绍

线性回归，就是用一条线，来拟合这些点，并且使得点集与拟合函数间的误差最小。如果这个函数曲线是一条直线，那就被称为线性回归，如果曲线是一条二次曲线，就被称为二次回归。

3.0 数据介绍

本文使用iris数据集，共50个样本，2个变量，如下图所示：

由图可知，x与y有较强相关性，拟合线性回归时，一般会加上截距项，因此从上述数据中增加截距项如下。

4.0 最小二乘法实现

最小二乘法（OLS），最小二乘法（又称最小平方法）是一种数学优化技术。它通过最小化误差的平方和寻找数据的最佳函数匹配。以下是来自百度百科的最小二乘法推导介绍。

根据上述公式，使用ols算法计算系数向量

通过算法得到的结果，与R base包里面自带了线性回归函数lm计算结果一致

使用ols算法的模型结果，计算预测的结果

5.0 梯度下降法

梯度下降法是机器学习中常用的算法之一，适用于多种场景。

5.1 损失函数

损失函数是指函数按照

拟合函数

hθ

(x)=

θ1

hθ(x)=θ+θ1x1, 其中

x= 1,

损失函数

J(θ)=

∑k=1m

(

hθ

(

x(i)

)−

y(i)

J(θ)=12∑k=1m(hθ(x(i))−y(i))2,m代表有m组样本

损失函数是关于

θj

θj的函数，即取不同的

θj

θj系数值，模型预测值与真实值的差距。好的模型是得到一组系数值，使样本的损失函数最小。在机器学习中，通过算法，不断的进行迭代从而达到算法定义的最优值。梯度下降法是通过求偏导数的方式，对系数进行优化。

5.2 梯度下降法

上面提到，损失函数是关于

θj

θj的函数，梯度下降法是指对于函数求最小值的过程，通过求偏导数的方式，对自变量

θj

θj以偏导数的方式，按照步长迭代，从而达到函数的极值。

∂∂

θj

J(θ)=

∂∂

θj

∑k=1m

(

hθ

(

x(i)

)−

y(i)

∑k=1m

(

hθ

(

x(i)

)−

y(i)

)

(i)

∂∂θjJ(θ)=∂∂θj12∑k=1m(hθ(x(i))−y(i))2=∑k=1m(hθ(x(i))−y(i))xj(i)

在上述梯度的基础上，参数

θj

θj的迭代式如下：

θj

′

θj

−α

∂∂

θj

J(θ)

θj′=θj−α∂∂θjJ(θ)

其中，∂为步长。

5.3 R语言实现梯度下降法

6 总结

结果表明，使用ols最小二乘法、梯度下降法、以及R自动的ls()函数拟合的线性方程系数，结果是一致的。各方法总结如下：

（1）最小二乘法，需要的条件是x的转置乘以x所得到的矩阵可逆，因此不是所有的数据都可以通过最小二乘法进行拟合，且其中有求逆矩阵的过程，算法计算量较大。

（2）梯度下降法是迭代的过程，适用性较强。但对非凸损失函数来说，容易得到局部最优解而非全局最优解。

发表于: 2018-02-232018-02-23 19:55:18
原文链接：http://kuaibao.qq.com/s/20180223G11GP000?refer=cp_1026
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货

线性回归的最小二乘法与梯度下降法之R实现

相关快讯

扫码

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐