[机器学习Lesson 2]代价函数之线性回归算法

原创

mantou

修改于 2018-04-11 14:47:36

1.7K2

修改于 2018-04-11 14:47:36

文章被收录于专栏：mantou大数据

本章内容主要是介绍：单变量线性回归算法（Linear regression with one variable）

1. 线性回归算法（linear regression）

1.1 预测房屋价格

下图是俄勒冈州波特兰市的住房价格和面积大小的关系：

该问题属于监督学习中的回归问题，让我们来复习一下：

监督学习（Supervised'Learning'）:对示例数据给出“正确答案”。
回归问题（Regression 'Problem'）:根据之前的数据预测出一个准确的输出值。

1.2 训练集

**m**=训练样本数量
**x's**=输入变量/特征量
**y's**=输出变量/目标变量，预测结果

（x,y）表示一个训练样本。

x(1) 指的是第一个训练集里值为2104的输入值，这个就是第一行里的x x(2) 等于1416。这是第二个x y(1) 等于460，这是第一个训练集样本的y值，这就是(1)所代表的含义。

这就是一个监督学习算法的工作方式，我们可以看到这里有我们的训练集里房屋价格，我们把它喂给我们的学习算法，然后输出一个函数。

按照惯例，通常表示为小写h代表hypothesis(假设) h表示一个函数。输入是房屋尺寸大小，就像你朋友想出售的房屋。因此，h 根据输入的 x 值来得出 y 值。 y值对应房子的价格。所以h是一个从x到y的函数映射。

y关于x的线性函数：

 hθ(x)=θ0+θ1\*x

这个模型被称为线性回归(linear regression)模型。这实际上是关于单个变量的线性回归，这个变量就是x 根据x来预测所有的价格函数。同时，对于这种模型有另外一个名称，称作单变量线性回归 单变量是对一个变量的一种特别的表述方式。总而言之这就是线性回归。

2. 代价函数(Cost Function)

任何能够衡量模型预测出来的值h(θ)与真实值y之间的差异的函数都可以叫做代价函数C(θ)，如果有多个样本，则可以将所有代价函数的取值求均值，记做J(θ)。

J(θ0,θ1)=12m$\sum$i=1m(y^i−yi)2=12m∑i=1m(hθ(xi)−yi)2

m：训练样本的个数；
hθ(x)：用参数θ和x预测出来的y值；
y：原训练样本中的y值，也就是标准答案
上角标(i)：第i个样本

3. 代价函数1(简化版):当θ0=0时

hθ(x)=θ1x，如下图：

重要公式

Hypothesis: 假设。这个例子中是尺寸对于房价关系的预测。
Parameters: 参数。
Cost Function：代价函数。
Goal: 优化目标。代价最小化。

3.1 斜率为1时的代价函数

（1）假设函数

x轴为面积，y轴为房价

假设函数 h(x) 对于一个固定的θ1，这是一个关于x 的函数。所以这个假设函数就是一个关于 x 这个房子大小的函数。

（2）代价函数

x轴为假设函数的斜率，y即代价大小

代价函数 J 是一个关于参数 θ1 的函数，而 θ1 控制着这条直线的斜率。

3.2 斜率为0.5时的代价函数

斜率为0.5时，取3个样本（m=3）：（0.5，1），（1，2），（1.5，3）。套公式得出J(0.5)=0.58

同理，J(0)=1/6(1²+2²+3²)=14/6，求出更多的点之后，我们得出类似以下函数：

学习算法的优化目标是我们想找到一个 θ1 的值，来将 J(θ1) 最小化。这是我们线性回归的目标函数。上面的曲线中，让 J(θ1) 最小化的值是 θ1=1。这个确实就对应着最佳的通过了数据点的拟合直线。这条直线就是由 θ1=1 的设定而得到的。对于这个特定的训练样本，我们最后能够完美地拟合这就是为什么最小化 J(θ1)，对应着寻找一个最佳拟合直线的目标。