专栏首页深度学习自然语言处理分类问题的label为啥必须是 one hot 形式?

分类问题的label为啥必须是 one hot 形式?

作者:桔了个仔 链接:https://www.zhihu.com/question/359742335/answer/930586793 来源:知乎

其实真不一定必须用one hot,不过用one hot时,主要因素包括:

  • one hot的形式无法比较大小。如果你预测的label是苹果,雪梨,香蕉,草莓这四个,显然他们不直接构成比较关系,但如果我们用1,2,3,4来做label就会出现了比较关系,labe之间的距离也不同。有了比较关系,第一个label 和最后一个 label的距离太远,影响模型的学习。因为模型觉得label 1和label 2最像,和最后一个label 最不像。不过当你的label之间存在直接的比较关系,就可以直接用数字当label。例如你做一个风控模型,预测的是四个风险类别[低,中,高,紧急],其实你也可以用1,2,3,4来做label,因为确实存在一个比较。但这本质上就成了回归问题。
  • one hot的形式还可以计算top N准确度。预测的结果将会是[0.1, 0.6, 0.2, 0.1]这样的形式,我们一般取概率最高的那个为预测结果,假设这四个label还是[苹果,雪梨,香蕉,草莓],如果真实的结果是雪梨,那么这个结果是top1 准确的。但如果实际结果是香蕉,但香蕉的概率排第二,那么这个结果也是top 2准确的。top N准确率在推荐类应用中很常用,你购物时经常会看到物品下方有N个推荐搭配,如果推荐模型的top N准确率越高,那么这个购物推荐的最后转化效果就越好。

本文分享自微信公众号 - 深度学习自然语言处理(zenRRan)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-12-13

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 一文轻松搞懂-条件随机场CRF

    根据实验室师兄,师姐讲的条件随机场CRF,我根据我的理解来总结下。有什么疑问的尽管在评论里指出,我们共同探讨 ? 总说 CRF(Conditional Rand...

    zenRRan
  • 【收藏版】长文详解基于并行计算的条件随机场

    之前写过CRF的详解,只是为了让大家详细了解下原理,但是那种是没有优化的,速度很慢。在实际应用中,还是需要用到batch,也就是需要用到GPU的,那么此时并行计...

    zenRRan
  • 一分钟搞懂的算法之BPE算法

    昨天总结实验数据分析的时候发现一个机器翻译的其中的一个脚本,其中用到的算法就是BPE算法,刚开始感觉很高大上的,因为总是听到带上算法帽子的东西就觉得666。等自...

    zenRRan
  • RoBERTa多标签分类:你是最胖的!

    NSP,就是 Next Sentence Prediction,是 BERT 的两大任务之一:输入两段文本,预测第二段是否为第一段的下文。

    邓邓最棒
  • IOS UILabel设置阴影

    label.shadowColor=UIColor.lightGray label.shadowOffset=CGSize(width:2, height:2...

    用户5760343
  • Redis 的底层数据结构(跳跃表)

    字典相对于数组,链表来说,是一种较高层次的数据结构,像我们的汉语字典一样,可以通过拼音或偏旁唯一确定一个汉字,在程序里我们管每一个映射关系叫做一个键值对,很多个...

    Single
  • Redis 的底层数据结构(字典)

    字典相对于数组,链表来说,是一种较高层次的数据结构,像我们的汉语字典一样,可以通过拼音或偏旁唯一确定一个汉字,在程序里我们管每一个映射关系叫做一个键值对,很多个...

    Single
  • 语义分割--Label Refinement Network for Coarse-to-Fine Semantic Segmentation

    Label Refinement Network for Coarse-to-Fine Semantic Segmentation

    用户1148525
  • 我的APP,腾讯手机关机一直报a.gray.sexpay.m木马病毒

    没有什么病毒啊,360安全管家,金山毒霸,VirusTotal都被没有报风险,真是不知道怎么搞的,确实是误报,请求你们工程师审核,请把病毒标记去掉,ICP备案,...

    用户4164249
  • 向Windows 服务器传输大文件

    https://support.microsoft.com/zh-cn/help/2258090/copying-files-larger-than-2-gb-...

    渠道架构师测试帐号

扫码关注云+社区

领取腾讯云代金券