首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >softmax损失函数理解「建议收藏」

softmax损失函数理解「建议收藏」

作者头像
全栈程序员站长
发布2022-09-13 15:26:53
发布2022-09-13 15:26:53
2.3K0
举报

大家好,又见面了,我是你们的朋友全栈君。

softmax softmax的定义

假设有一个数组V,ViVi表示V中的第i个元素,那么这个元素的softmax值为:

SoftmaxLayer和SoftmaxLossLayer

softmaxLayer softmax实际上就是logistic的扩展,后者只能二分类,前者则能多分类,实际上都是返回每一类的概率值。在caffe里面softmax的实现分为以下几步(加入输入到softmax里面的结点数为10): 1)找出输入的最大值,输入的每个变量减去最大值,取指数(e为底); 2)对1)中结果归一化,得出的结果就是每一类的分类概率。

softmaxLoss 实际上就是个代价函数,我们要让分类正确的概率最大,然后我们对这个概率取log对数,由于代价函数都是最小化,所以我们在log前面加个负号。caffe中都是以batch为单位进行训练的,所以计算loss的时候都是以batch为单位求和取平均。

softmax loss是我们最熟悉的loss之一了,分类任务中使用它,分割任务中依然使用它。softmax loss实际上是由softmax和cross-entropy loss组合而成,两者放一起数值计算更加稳定。这里我们将其数学推导一起回顾一遍。

令z是softmax层的输入,f(z)是softmax的输出,则

单个像素i的softmax loss等于cross-entropy error如下:

展开上式:

softmaxLoss

发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/153117.html原文链接:https://javaforall.cn

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档