开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

社区首页 >专栏 >TensorFlow从0到1 | 第七篇：TensorFlow线性回归的参数溢出之坑

TensorFlow从0到1 | 第七篇：TensorFlow线性回归的参数溢出之坑

用户1332428

发布于 2018-03-08 11:11:16

5930

发布于 2018-03-08 11:11:16

举报

文章被收录于专栏：人工智能LeadAI

上一篇 6 解锁梯度下降算法解释清楚了学习率（learning rate）。本篇基于对梯度下降算法和学习率的理解，去填下之前在线性回归中发现的一个坑。

在5 TF轻松搞定线性回归中提到，只要把TF官方Get Started中线性回归例子中的训练数据换一下，就会出现越训练“损失”越大，直到模型参数都stackoverflow的情况。然而更换训练数据是我们学习代码的过程中再普通不过的行为，从stackoverflow.com上也能搜到很多人做了类似的尝试而遇到了这个问题。到底为什么这么经不住折腾？马上摊开看。

stackoverflow

更换训练数据如下：

参数初始值a=-1，b=50；
训练数据x_train = [22, 25]；
训练数据y_train = [18, 15]。

先亮个底：给出的训练数据只有两组但足够了，两点成一线，要拟合的直线心算下就能得出是y=-x+40，a是-1，b是40。

运行使用新数据的代码：

为了方便观察，让程序训练了10次，输出是：

参数越练损失越大的趋势果然重现了。

现在我们已经掌握了梯度下降大法，就来看看每次训练的结果到底是怎么产生的。

手工计算了两次迭代，和程序输出一致。

图中显示，训练样本（已红色标出）的值对梯度值的贡献很大，而此时沿用之前的学习率η=0.01就显得不够小了。训练样本既然不可调，那么显然只能调小学习率了。随之而来的副作用就是会导致学习缓慢，所以还得增加训练的次数。这就是之前的例子中最终调整为η=0.0028，epoch=70000的原因了。

如此看来，这的确不是TF的bug。再一次体会：训练是一门艺术。

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2017-08-17，如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自人工智能LeadAI 微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

评论

登录后参与评论

0 条评论

热度

最新

LV.