上一篇关于梯度下降的算法,原作者原理其实已经讲的比较清楚了,下面我将通过一个非常简单的案例,帮助理解并且应用梯度下降算法。
假设我们有一些数据,xdata = [1.0, 2.0, 3.0] ,这个是 输入数据,输出数据是ydata = [2.0, 4.0, 6.0],输入输出数据存在一个公式,使得它们可以对应上,这个公式很简单,直接就可以看出来是y=2x。
假如我们现在并不知道这个公式具体是多少,仅仅知道y=wx,而我们的目标就是要求出这个w值,使得最终的预测结果和我们的输出实际结果尽可能接近。
正常输入:xdata = [1.0, 2.0, 3.0] ,得到的结果应该是ydata = [2.0, 4.0, 6.0],如果得到结果变成y_pred = [5, 6, 7],这个误差就非常大了,那么我们就需要调整w的值,看看预测的值如何,不断重复该过程调整直到预测的结果和实际的结果接近一致就可以了。
1.明确预测函数。
2.明确误差损失函数。
3.明确梯度。
4.利用梯度下降方法逼近我们设置的阈值。
5.求得我们要的结果。
用损失函数的结果值对w求导,这里是复合求导,最终结果如下:
复合求导理解
还没有训练的时候,因为这个w是我们随意给的,所以得到的预测结果和真实的相差很远。
这里通过更改阈值,可以让精度更高,也就是更加接近真实值;这里的训练其实是不严谨的,直接把每个数据循环计算了,应该把每组数据看作一个整体。
(全文完)