直观理解神经网络最后一层全连接+Softmax

李拜六不开鑫

修改于 2020-04-26 16:40:45

17.8K0

文章被收录于专栏：本立2道生本立2道生

写在前面

这篇文章将从3个角度：加权、模版匹配与几何来理解最后一层全连接+Softmax。掌握了这3种视角，可以更好地理解深度学习中的正则项、参数可视化以及一些损失函数背后的设计思想。

全连接层与Softmax回顾

深度神经网络的最后一层往往是全连接层+Softmax（分类网络），如下图所示，图片来自StackExchange。

加权角度

模板匹配

如果是只有一个全连接层的神经网络（相当于线性分类器），将每个类别的模板可以直接可视化如下，图片素材来自CS231n。

如果是多层神经网络，最后一个全连接层的模板是特征空间的模板，可视化需要映射回输入空间。

几何角度

仍将全连接层的输入\(\mathrm{x}\)视为网络从输入数据提取到的特征，一个特征对应多维空间中的一个点。

如下图所示：

Softmax的作用

总结

本文介绍了3种角度来更直观地理解全连接层+Softmax，

加权角度，将权重视为每维特征的重要程度，可以帮助理解L1、L2等正则项
模板匹配角度，可以帮助理解参数的可视化
几何角度，将特征视为多维空间中的点，可以帮助理解一些损失函数背后的设计思想（希望不同类的点具有何种性质）

视角不同，看到的画面就不同，就会萌生不同的idea。有些时候，换换视角问题就迎刃而解了。

以上。

参考

CS231n: Convolutional Neural Networks for Visual Recognition

本文参与腾讯云自媒体同步曝光计划，分享自作者个人站点/博客。

原始发表：2018-12-06 ，如有侵权请联系 cloudcommunity@tencent.com 删除

神经网络

本文分享自作者个人站点/博客前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

神经网络

登录后参与评论

0 条评论

热度

直观理解神经网络最后一层全连接+Softmax

直观理解神经网络最后一层全连接+Softmax

写在前面

全连接层与Softmax回顾

加权角度

模板匹配

几何角度

Softmax的作用

总结

参考

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐