学界 | Hinton 谷歌大脑新作:通过给个体标签建模来提高分类能力

AI科技评论按:Geoffrey Hinton 于 2013 年加入谷歌,目前在谷歌大脑团队致力将深度学习应用于实践领域。近日,谷歌大脑团队推出了新作,一作 Melody Y. Guan 及 Varun Gulshan、Andrew M. Dai 及 Hinton 提出了一种创新的方法,通过给个体标签建模来提高分类能力。

给数据集进行标记的任务通常是由许多不同的专家分工完成的,每位专家只标记其中一小部分数据而同一个数据点又包含有多位专家所标记的标签。这样的做法不仅减轻了每位专家的个人工作量并且还有助于揭开数据中难以发现的真相。当专家们对同一个数据点的标签存在不同意见时,标准的做法是将获得更多专家支持的标签作为正确的标签,或者将正确的标签进行建模以获得分布状态。做法忽视了有关于哪些专家标记了哪些标签这一潜在的有效信息。因此为了获得这些额外的信息,谷歌大脑团队提出要单独对专家进行建模,然后学习平均权重以组合这些信息,比如说可能是以样本特定(sample-specific)的方式进行组合。通过这种方法,就能给更可靠的专家分配更多的权重,并利用个别专家的独特优势来对某些特定类型的数据进行分类。

在这篇论文中,作者展示了通过采用这种标记方法我们提升了计算机辅助诊断糖尿病导致视网膜病变的准确度,并且此方法的表现也优于Welinder和Perona以及Mnih和Hinton所提出的方法。谷歌大脑团队的工作提供了一种创新的方法,以处理那些数量巨大的、需要借助专家来标记标签的现实数据。

PS:本文原英文标题为:Who Said What: Modeling Individual Labelers Improves Classification,论文链接:https://arxiv.org/pdf/1703.08774.pdf.

原文发布于微信公众号 - AI科技评论(aitechtalk)

原文发表时间:2017-03-31

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏新智元

【重磅】Facebook首次公开内部机器学习平台,启动AI帝国

【新智元导读】Tensorflow凭“谷歌”“开源”两个标签自2015年底发布以来便名震深度学习圈。而前年底Facebook就打造其专属ML平台FBLearne...

4758
来自专栏华章科技

谷歌背后的数学原理

在如今这个互联网时代, 有一家公司家喻户晓——它自 1998 年问世以来, 在极短的时间内就声誉鹊起, 不仅超越了所有竞争对手, 而且彻底改观了整个互联网的生态...

673
来自专栏大数据文摘

可视化告诉你,大数据究竟是什么?

783
来自专栏ATYUN订阅号

【方法】搜索引擎如何使用机器学习:我们需要知道的9种方式

? 当我们在2010年初初次听到机器学习的时候,可能会感觉它很可怕。 但当我们意识到技术已经被用来为我们提供解决方案时,我们就开始着手解决实际问题: —搜索引...

3409
来自专栏新智元

【一图读懂】你不得不知道的10个影响人类社会的算法

【新智元导读】本文的信息图表详细介绍了算法的定义、起源以及 10个重要而且基本的算法,并提出有关算法,尤其是人工智能和深度学习对人类社会、经济的影响的思考。 在...

3916
来自专栏PPV课数据科学社区

常用的5种数据可视化方法

小编最近在研究后台的设计,涉及到数据统计分析模块的数据的呈现方面,搜集学习材料的时候发现这篇文章,推荐给有需求的童靴们共同学习。在文章中,原作者跟大家分享数据可...

2204
来自专栏数据科学与人工智能

【数据挖掘】这些年,这些挖掘机算法,这些反思

写这篇文章,缘自于前几天部门内部成员们进行了一次部门内部现有涉及的一些算法的review以及整理。不过比较囧的就是,由于boss不在,我们讨论讨论着就成了吐槽大...

2339
来自专栏ATYUN订阅号

MIT新型动态算法,让自动驾驶汽车计算缓冲区以改变车道

在自动驾驶汽车领域,控制车道变化的算法是一个重要的研究课题。但是大多数现有的车道变换算法存在以下两个缺点其一:或者它们依赖于驾驶环境的详细统计模型,这些统计模型...

682
来自专栏机器之心

专访 | 阿里巴巴「鹿班」算法技术负责人星瞳:用可控视觉生成引擎完成智能设计

1818
来自专栏CDA数据分析师

英雄联盟如何指挥团战?AI帮你做决策

作者在 Kaggle 中上传了模型的每个部分,以便大家更好地理解数据的处理过程与模型结构:

871

扫描关注云+社区