前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >线性回归 调试方法

线性回归 调试方法

作者头像
小小程序员
发布2023-12-01 08:30:14
2050
发布2023-12-01 08:30:14
举报
文章被收录于专栏:小小程序员——DATA

调试方法

特征缩放

对于某些不具有比较性的样本特征

x_i

(比如对其他的x来说

x_i

相当大或者相当小),梯度下降的过程可能会非常漫长,并且可能来回波动才能最后收敛到全局的最小值。

梯度下降法详解 笔记_x^ 5 +e^x+3x 3=0_Lu君的博客-CSDN博客
梯度下降法详解 笔记_x^ 5 +e^x+3x 3=0_Lu君的博客-CSDN博客

在这样的情况下,可以对

x_i

进行缩放(如

x_i≔αx_i

或者

x_i=x_i/α

),使得

x_i

与其他的

x

具有可比性,以增加梯度下降的效率。 **通常将

x

缩放至⟦-1,1⟧**的区间内。(只表示一个大致的范围,这不是绝对的。)

均值归一

x_i

替换为

x_i−μ_i

使得特征值具有为0的平均值(对

x_0

不适用)

x_i:=(x_i−μ_i)/s_i

定义

μ_i

为训练集

X

的平均值,

s_i=|x_imax−x_imin |

, 表示

x_i

的取值范围(近似值),或者直接设置为

s_i

的标准差。

学习率(Learning rate)

梯度下降调试的方法:

  1. 绘制
minJ(θ)-batch

的图像 原则:每一个batch之后 θ 的值都应该减小,这样的图像能够通过直观地表现变化率来表现梯度下降是否收敛(变化率为0)。

  1. 自动收敛测试 如果
J(θ)

在某一次迭代之后的下降值小于某个值

ε

后,就能够判断算法已经达到了收敛。

ε

的值比较难取,所以通常采取1.中的方法进行观测。

常见的α过大的

minJ(θ)-batch

的图像: α过大,出现梯度爆炸,每次

J(θ)

变化很大,导致代价函数无法收敛

α过小,梯度消失,每次

J(θ)

变化很小,导致代价函数收敛速度过慢

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2023-11-30,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 调试方法
    • 特征缩放
      • 均值归一
        • 学习率(Learning rate)
        相关产品与服务
        腾讯云服务器利旧
        云服务器(Cloud Virtual Machine,CVM)提供安全可靠的弹性计算服务。 您可以实时扩展或缩减计算资源,适应变化的业务需求,并只需按实际使用的资源计费。使用 CVM 可以极大降低您的软硬件采购成本,简化 IT 运维工作。
        领券
        问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档