前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >个人原创:浅谈「正则化项」是如何防止过拟合的?

个人原创:浅谈「正则化项」是如何防止过拟合的?

作者头像
不可言诉的深渊
发布2020-05-09 15:09:53
1.1K0
发布2020-05-09 15:09:53
举报

昨天推送一篇关于正则化是如何发生或出现的,错过的朋友可点击阅读:

浅谈一种最严重的过拟合

今天有读者问我正则化是如何解决过拟合问题的,下面说一下我对此问题的浅见。

如果模型复杂度是权重的函数,则特征权重的绝对值越高,对模型复杂度的贡献就越大。

先使用

L_2

正则化来量化复杂度,正则化项定义为所有特征权重的平方和:

L2 = W_1^2 + W_2^2 +...+W_n^2

不难理解,接近于 0 的权重对模型复杂度几乎没有影响,而离群值权重(取值相对更大的

W_i

)则可能会产生更大的影响。

例如,以最简单的线性模型为例,它具有以下权重:

代码语言:javascript
复制
W1 = 0.2
W2 = 1.5
W3 = 5
L_2

正则化项的

W

权重和

\sum_{i=1}^3 W_i

容易计算,过程如下:

W_1^2 = 0.04
W_2^2 = 2.25
W_3^2 = 25

正则化项权重和:

\sum_{i=1}^3 W_i = 0.04 + 2.25 + 25

对比

L_2

正则化前后,

W_3

权重贡献值的变化。

正则化前:

\frac{5}{0.2 + 1.5 + 5} = 74.6\%

正则化后:

\frac {25} {0.04 + 2.25 + 25} = 91.6\%

结论:正则化后

W_3

的权重贡献更大了,换句话说,模型更加依赖权重参数

W_3

,相对的,其他参数变得更不重要。

总结:以上便是正则化解决过拟合的一种直观认识,通过这个案例,希望大家对正则化如何解决过拟合有进一步认识。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-05-04,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Python机器学习算法说书人 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档