科学家提出更加灵活的机器学习方法

据2015年10月美国麻省理工学院新闻,该校科学家将在2015年12月的神经信息处理系统年会上提出一种更加灵活的机器学习方法,该方法能够加强语义相关概念之间的联系。

在试验中,研究人员发现使用他们训练策略的机器学习算法可以更好地预测用户在Flickr网站应用于图像的标签。研究人员认为,当有很多的可能的类别时,传统的方法仅使用每一类的数据来训练该类的模型,这对所有其他类别都是不利的,因为这些类之间存在语义相关性。该研究团队利用语义相近类别的数据来训练模型。

(1)相近计分

通过梳理Flickr图像中经常同时出现的识别标签来量化语义相似性的概念,如阳光、水和影像。两个词的语义相似性是它们同时出现的频率的函数。

一般地,预测Flickr标签的机器学习算法尝试识别始终对应于特定标签的视觉特征。对于模型训练中的每一标签,如果算法预测正确,则获得得分;否则进行惩罚。对于与正确标签语义相关的不正确标签,MIT研究人员的算法获得部分得分。例如,一张水景图片被标记为“水”、“船”和“阳光”。在传统机器学习中,将此图标记为“水”、“船”和“夏天”的系统和将此图标记为“水”、“船”和“犀牛”的系统一样不会获得得分,但是MIT开发的系统将会获得得分。这个得分是标签“夏天”和“阳光”同时出现在Flickr数据库中的似然函数。

(2)人为错误

蕴含语义相似性的系统在预测语义相似性方面有较好的预测性,这听起来有些循环论证。但是,当网络用户试图查找在线图片时,一般的主题相关可能比精确的关键词更重要。

用户指定任意给定的Flickr图片的标签可以是各种各样的。根据语义相关性自动聚类生成的标签比人为定义的标签可能更有用。例如,MIT研究人员的测试集中的一张图片描述了一个穿着制服戴着头盔沿着丘陵小道骑着山地自行车的人。实际的标签是“春天”,“比赛”和“训练”。但是图片中的树是光秃秃的,草是棕色的,标签“比赛”和“训练”都不可能是正确的。MIT研究人员开发的系统预测此图的标签为“道路”,“自行车”和“选拔赛”,然而传统机器学习算法预测为“狗”,“冲浪”和“自行车”。

原文发布于微信公众号 - 人工智能快报(AI_News)

原文发表时间:2015-11-10

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏腾讯大数据的专栏

微信公众号广告点击率预估效果优化

1.背景点击率预估(pCTR)是广告投放过程中的一个重要环节,精准的点击率预估对于广告投放系统收益最大化具有重要意义。pCTR的优化主要有算法优化,系统改进,特...

2266
来自专栏机器之心

揭开深度学习黑箱:希伯来大学计算机科学教授提出「信息瓶颈」

选自QuantaMagazine 作者:Natalie Wolchover 机器之心编译 参与:黄小天、刘晓坤、路雪 耶路撒冷希伯来大学的计算机与神经科学家 N...

3458
来自专栏人工智能头条

入坑机器学习,十个知识点你不得不知

1262
来自专栏人工智能头条

何时不应使用深度学习?

621
来自专栏CDA数据分析师

机器学习=「新瓶装旧酒」的数据统计?No!

随着深度学习的热度开始消退,这个梗最近开始在社交媒体上广为流传,引起了互联网上众人的讥笑。机器学习没什么好激动的,它只是对统计技术的一种补充——这种观点越来越普...

461
来自专栏机器之心

观点 | 机器学习=「新瓶装旧酒」的数据统计?No!

随着深度学习的热度开始消退,这个梗最近开始在社交媒体上广为流传,引起了互联网上众人的讥笑。机器学习没什么好激动的,它只是对统计技术的一种补充——这种观点越来越普...

481
来自专栏数据派THU

独家 | 一文带你读懂特征工程!

本文描述了一个典型的基于跨行业标准流程的标准机器学习管道,作为数据挖掘行业的标准过程模型。

541
来自专栏人工智能头条

深度学习新方向:Multimodal CNN实现图像文本匹配

1525
来自专栏AI科技评论

洞见|如何评价谷歌刚刚上线的神经机器翻译(GNMT)系统?

Google最新宣布发布谷歌神经机器翻译(GNMT:Google Neural Machine Translation)系统,在官方博客中Google称该系统使...

3485
来自专栏ATYUN订阅号

每个机器学习项目必须经过的五个阶段

机器学习和预测分析在我们今天的生活中非常普遍。它几乎可以影响我们所做的一切,包括零售和批发定价,消费者习惯和行为,市场营销,娱乐,医药,物流,游戏,AI语音识别...

3595

扫码关注云+社区