学界 | Hinton 谷歌大脑新作:通过给个体标签建模来提高分类能力

AI科技评论按:Geoffrey Hinton 于 2013 年加入谷歌,目前在谷歌大脑团队致力将深度学习应用于实践领域。近日,谷歌大脑团队推出了新作,一作 Melody Y. Guan 及 Varun Gulshan、Andrew M. Dai 及 Hinton 提出了一种创新的方法,通过给个体标签建模来提高分类能力。

给数据集进行标记的任务通常是由许多不同的专家分工完成的,每位专家只标记其中一小部分数据而同一个数据点又包含有多位专家所标记的标签。这样的做法不仅减轻了每位专家的个人工作量并且还有助于揭开数据中难以发现的真相。当专家们对同一个数据点的标签存在不同意见时,标准的做法是将获得更多专家支持的标签作为正确的标签,或者将正确的标签进行建模以获得分布状态。做法忽视了有关于哪些专家标记了哪些标签这一潜在的有效信息。因此为了获得这些额外的信息,谷歌大脑团队提出要单独对专家进行建模,然后学习平均权重以组合这些信息,比如说可能是以样本特定(sample-specific)的方式进行组合。通过这种方法,就能给更可靠的专家分配更多的权重,并利用个别专家的独特优势来对某些特定类型的数据进行分类。

在这篇论文中,作者展示了通过采用这种标记方法我们提升了计算机辅助诊断糖尿病导致视网膜病变的准确度,并且此方法的表现也优于Welinder和Perona以及Mnih和Hinton所提出的方法。谷歌大脑团队的工作提供了一种创新的方法,以处理那些数量巨大的、需要借助专家来标记标签的现实数据。

PS:本文原英文标题为:Who Said What: Modeling Individual Labelers Improves Classification,论文链接:https://arxiv.org/pdf/1703.08774.pdf.

原文发布于微信公众号 - AI科技评论(aitechtalk)

原文发表时间:2017-03-31

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏人工智能头条

关于强化学习你不得不知道的5件事

1843
来自专栏企鹅号快讯

深度学习的教学和课程,与传统 CS 的教学和课程有什么区别?

深度学习的课程和传统计算机课程有很大的不同,也可以说 “独树一帜”,其独特性主要来自于: 1. 前置课程多 2. 缺乏完整的理论体系 3. 繁多的调参技巧 4....

2147
来自专栏AI研习社

深度学习的教学和课程,与传统 CS 的教学和课程有什么区别?

本文作者阿萨姆,整理自作者在问题《深度学习的教学和课程,与传统 CS 的教学和课程有什么区别?》下的回答, AI 研习社获其授权发布。 深度学习的课程和传统计算...

3278
来自专栏新智元

【干货】机器学习概览+模型可视化呈现

2016年10月18日, 世界人工智能大会技术论坛,特设“新智元智库院长圆桌会议”,重量级研究院院长 7 剑下天山,汇集了中国人工智能产学研三界最豪华院长阵容:...

4136
来自专栏数据科学与人工智能

【学库】用Python做深度学习

若是你对深度学习只有比较浅的认识,想知道深度学习是什么?深度学习的来龙去脉?为什么会出现深度学习这个说法和技术?作者在第一章做了回答。

1652
来自专栏何俊林

【一】如果让我学习TensorFlow,我该怎么学?

熟悉我的读者知道,我一直以来就是做Android开发/音视频开发,对于什么人工智能,什么TensorFlow,什么机器学习,我也是小白,按照惯例,在学习一个新东...

2709
来自专栏量子位

“众矢之的”马库斯回应14个问题,将深度学习质疑到底

安妮 维金 李杉 编译自 Medium 量子位 出品 | 公众号 QbitAI 深度学习的质疑者中有位战士。 他有底气与大牛Yann LeCun激辩AI是否需要...

35810
来自专栏数据科学与人工智能

【知识】2017年数据科学Top12的Python库

Python深受数据科学家和数据工程师的喜爱。 ? 本文总结2017年数据科学的Top12的Python库。 核心库 1 numpy 它是最基础库,是众多Py...

3527
来自专栏AI星球

吾爱NLP(3)—我对NLP的理解与学习建议

简单来说,NLP = Nature Language Process = 自然语言处理 ≈ 语言信息(文本/语音)+机器学习 。

1992
来自专栏人工智能头条

Yann LeCun:CNN已解决CIFAR-10,目标 ImageNet

2066

扫码关注云+社区