腾讯云开发者社区-腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

mathor

专栏作者

447

文章

591924

阅读量

50

订阅数

L2正则效果不好？试试WEISSI正则

正则表达式

L2正则的表现通常没有理论上说的那么好，很多时候加了可能还有负作用。最近的一篇文章《Improve Generalization and Robustness of Neural Networks via Weight Scale Shifting Invariant Regularizations》从"权重尺度偏移"这个角度分析了L2正则的弊端，并提出了新的WEISSI正则项。本文将指出常见的深度学习模型中存在的"权重尺度偏移(Weight Scale Shif)"现象，这个现象可能会导致L2正则的作用没那么明显。进一步地，我们可以构建一个新的正则项，它具有跟L2类似的作用，但是与权重尺度偏移现象更加协调，理论上来说更加有效。为了方便大家理解，请先阅读L2正则化的一些思考这篇文章

2021-06-17

6610

L2正则化的一些思考

神经网络正则表达式

很多时候，我们希望得到一个"稳健"的模型。何为稳健？一般来说有两种含义，一是对于参数扰动的稳定性，比如模型变成了f_{\theta}(x)；二是对于输入扰动的稳定性，比如输入从x变成了x+\Delta x后，f_{\theta}(x+\Delta x)是否能给出相近的预测结果。读者或许已经听过深度学习模型存在"对抗攻击样本"，比如图片只改变一个像素就给出完全不一样的分类结果，这就是模型对输入过于敏感的案例

2021-05-20

5770

没有更多了

社区活动

腾讯技术创作狂欢月

“码”上创作 21 天，分 10000 元奖品池！

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态