专栏首页深度应用[知乎作答]·关于在Keras中多标签分类器训练准确率问题

[知乎作答]·关于在Keras中多标签分类器训练准确率问题

[知乎作答]·关于在Keras中多标签分类器训练准确率问题

本文来自知乎问题 关于在CNN中文本预测sigmoid分类器训练准确率的问题?中笔者的作答,来作为Keras中多标签分类器的使用解析教程。

一、问题描述

关于在CNN中文本预测sigmoid分类器训练准确率的问题? 对于文本多标签多分类问题,目标标签形如[ 0 0 1 0 0 1 0 1 0 1 ]。在CNN中,sigmoid分类器训练、测试的准确率的判断标准是预测准确其中一个标签即为预测准确还是怎样。如何使sigmoid分类器的准确率的判断标准为全部预测准确即为预测准确。有什么解决方案?

二、问题回复

问题中提出的解决多标签多分类问题的解决方法是正确的。但是要注意几点,keras里面使用这种方式的acc是二进制acc,会把多标签当做单标签计算。

什么意思呢?举个例子,输入一个样本训练,共有十个标签,其中有两个为1,而你预测结果为全部是0,这时你得到准确率为0.8。最后输出的ac是所有样本的平均。可以看出这个准确率是不可信的。

解决方法如下:重写acc评价指标,笔者自己写了一个多标签分类的acc,一个样本里,只有全部标签都对应上才acc为1,有一个不对就为0。

acc是keras输出acc,my_acc是多标签acc,因为使用了数据增强,valacc更高。

由于每个label的比例不同,又测试不同权重重写loss来对比。发现通过调整合适权重可以,相同参数下可以达到更优效果。

设置合适的权重值,val_acc上升了,val多标签acc也达到了更高。

关于如何设置合适权重,笔者还在实验中,可以关注下笔者的知乎博客。后面实验结果会及时更新。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • [深度概念]·多标签分类与多分类的通俗理解

    想到了一个很恰当比方 其实类似与多选题与单选题的问题 多分类(单选题)就是选出最大正确概率的选项 多标签(多选题)需要判断每个选项是否正确 也不难理解多...

    小宋是呢
  • 『TensorFlow2.0正式版』TF2.0+Keras速成教程·零:开篇简介与环境准备

    版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。 ...

    小宋是呢
  • 『TensorFlow2.0正式版』极简安装TF2.0正式版(CPU&GPU)教程

    版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。 ...

    小宋是呢
  • Django上线部署之Apache的方法

      1.Windows Server 2016 Datacenter 64位   2.SQL Server 2016 Enterprise 64位   3....

    砸漏
  • Python 操作 MySQL 字符集的问题

    使用 Python 操作 MySQL 有不少库供我们选择,比如 MySQLdb、mysqlclient、PyMySQL、peewee 和 SQLAIchemy ...

    hedeqiang
  • 杂谈

    以ae.c/aeProcessEvents(其中包含文件事件分派器)为主的源码让我受益匪浅。该函数作用是完成事件处理的一次循环。 ae_epoll.c/aeA...

    平凡的学生族
  • HanLP中文分词Lucene插件

    基于HanLP,支持包括Solr(7.x)在内的任何基于Lucene(7.x)的系统。

    IT小白龙
  • 报告指出索尼“拿下”半数CMOS图像传感器市场,未来销售额将会持续增长

    得益于辅助驾驶、人脸识别等相关技术领域市场的快速发展和带动,CMOS图像传感器市场规模在不断扩大,但市场格局依然没有显著变化。

    镁客网
  • 1036 跟奥巴马一起编程 (15 分)

    美国总统奥巴马不仅呼吁所有人都学习编程,甚至以身作则编写代码,成为美国历史上首位编写计算机代码的总统。2014 年底,为庆祝“计算机科学教育周”正式启动,奥巴马...

    可爱见见
  • 单链表的头尾插法详解

    head 结点的数据域为空 head -> data = NULL, ,地址域为空 head -> next = NULL;

    忆想不到的晖

扫码关注云+社区

领取腾讯云代金券