在线性回归中,我们必须对不同的直线进行拟合,选择误差最小的一条,那么在不能直接给出最佳拟合线的情况下,给出一个能给出斜率和截距值的m,b公式的动机是什么?

1.假设我将数据集中的值应用于m,b的公式,并找到了回归线yhat = 17.5835x+6,例如,假设为这一行计算的误差为3。
2.假设我随机地拟合另一条线(我没有用m,b的公式来寻找这条随机线的m,b假设m,b值为16,3),我的第二条回归线是yhat = 16x+3and,例如,假设对这条线计算的误差为1.5。
线性回归目标:选择误差最小的最佳拟合线
所以在这种情况下,我的第二行比第一行好。
当不能直接给出最佳拟合线时,有一个给出斜率"m“值的公式,拦截"b”又有什么意义呢?
还是我的理解是用m,b的公式来求斜率/截距,总是给出最好的线?
如果是,则不需要尝试多行计算误差,并选择带有最小误差的行。
如果它没有,那么有什么意义,有一个公式的斜率m,截取b时,它不能给出最佳拟合线。这意味着数学/统计社区需要改变这个坡度的论坛,拦截。
发布于 2020-08-16 03:49:26
您提到的公式给出了最佳fit.The值线的系数,用最小二乘法导出,其中的目标是最小化平方误差之和。下面是m和b值的推导。
设最佳拟合线为\hat{y} = m*x + b,然后求出系数m和b,使实际值y与观测值\hat{y}之间的平方误差之和最小。\begin{align} SSE &= \sum_{i=1}^{n}(y_{i}-\hat{y_{i}})^2 \\ &=\sum_{i=1}^{n}(y_{i}-m*x_{i}-b)^2 \end{align}取上证指数关于c的一阶导数,等于零。
因此,我们得到c为b = \bar{y} - m*\bar{x},为了找到m,我们取了SSE关于m的偏导数,并将它等价为零。
用b代替m,得到m = \frac{n\sum xy - \sum x\sum y}{n\sum x^2 - (\sum x)^2}
发布于 2020-08-14 21:42:59
在线性回归中,可以选择使用正规方程计算最优权值,也可以尝试用梯度下降逼近最优权值。
我不知道你发布的公式,它可能是线性回归的标准方程,只有一个特性。
https://datascience.stackexchange.com/questions/80308
复制相似问题