科学家提出更加灵活的机器学习方法

据2015年10月美国麻省理工学院新闻,该校科学家将在2015年12月的神经信息处理系统年会上提出一种更加灵活的机器学习方法,该方法能够加强语义相关概念之间的联系。

在试验中,研究人员发现使用他们训练策略的机器学习算法可以更好地预测用户在Flickr网站应用于图像的标签。研究人员认为,当有很多的可能的类别时,传统的方法仅使用每一类的数据来训练该类的模型,这对所有其他类别都是不利的,因为这些类之间存在语义相关性。该研究团队利用语义相近类别的数据来训练模型。

(1)相近计分

通过梳理Flickr图像中经常同时出现的识别标签来量化语义相似性的概念,如阳光、水和影像。两个词的语义相似性是它们同时出现的频率的函数。

一般地,预测Flickr标签的机器学习算法尝试识别始终对应于特定标签的视觉特征。对于模型训练中的每一标签,如果算法预测正确,则获得得分;否则进行惩罚。对于与正确标签语义相关的不正确标签,MIT研究人员的算法获得部分得分。例如,一张水景图片被标记为“水”、“船”和“阳光”。在传统机器学习中,将此图标记为“水”、“船”和“夏天”的系统和将此图标记为“水”、“船”和“犀牛”的系统一样不会获得得分,但是MIT开发的系统将会获得得分。这个得分是标签“夏天”和“阳光”同时出现在Flickr数据库中的似然函数。

(2)人为错误

蕴含语义相似性的系统在预测语义相似性方面有较好的预测性,这听起来有些循环论证。但是,当网络用户试图查找在线图片时,一般的主题相关可能比精确的关键词更重要。

用户指定任意给定的Flickr图片的标签可以是各种各样的。根据语义相关性自动聚类生成的标签比人为定义的标签可能更有用。例如,MIT研究人员的测试集中的一张图片描述了一个穿着制服戴着头盔沿着丘陵小道骑着山地自行车的人。实际的标签是“春天”,“比赛”和“训练”。但是图片中的树是光秃秃的,草是棕色的,标签“比赛”和“训练”都不可能是正确的。MIT研究人员开发的系统预测此图的标签为“道路”,“自行车”和“选拔赛”,然而传统机器学习算法预测为“狗”,“冲浪”和“自行车”。

原文发布于微信公众号 - 人工智能快报(AI_News)

原文发表时间:2015-11-10

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI科技大本营的专栏

迁移学习到底是什么?让我们来解读一下杨强、Bengio和龙盛明的论文

作者 | 王晋东不在家 《小王爱迁移》之一:迁移成分分析(TCA)方法简介 之前整理总结迁移学习资料的时候有网友评论,大意就是现在的类似资料大全的东西...

1.3K5
来自专栏AI科技大本营的专栏

南开大学提出最新边缘检测与图像分割算法,精度刷新记录(附开源地址)

近日,南开大学媒体计算实验室提出的最新边缘检测和图像过分割(可用于生成超像素)被 IEEE PAMI 录用。研究的第一作者也发微博称:“这是第一个在最广泛使用的...

1041
来自专栏目标检测和深度学习

一门面向所有人的人工智能公开课:MIT 6.S191,深度学习入门

选自Medium 机器之心编译 参与:黄小天、李泽南 对初学者来说,有没有易于上手,使用流行神经网络框架进行教学的深度学习课程?近日,麻省理工学院(MIT)正式...

34813
来自专栏AI科技大本营的专栏

ECCV 2018|商汤37篇论文入选,为你解读精选论文(附链接+开源资源)

【导读】9 月 8 日-14 日,每两年举办一次的 2018 欧洲计算机视觉大会(ECCV 2018)在德国慕尼黑召开,本次会议总共收到了 2439 篇有效的论...

3025
来自专栏AI科技评论

ECAI 2016论文精选 | 更快,更精确的人脸识别方法

导读:ECAI 2016是欧洲展示AI科学成果的最佳场所,大会为研究人员提供了很好的机会,去介绍和听取当代最优秀的人工智能研究成果。 人脸识别的随机典型相关判别...

2898
来自专栏ATYUN订阅号

【学术】Google介绍了卷积神经网络NIMA模型,可对图像做出评估

图像质量和美学的量化一直是图像处理和计算机视觉的一个长期存在的问题。虽然技术质量评估涉及到测量像素级的退化,如噪声、模糊、压缩失真等,但美学评估捕获了图像中与情...

5507
来自专栏机器之心

GMIS 2017 | 清华大学朱军详解珠算:贝叶斯深度学习的GPU库(附视频)

机器之心整理 演讲者:朱军 5 月 27-28 日,机器之心在北京 898 创新空间顺利主办了第一届全球机器智能峰会(GMIS 2017)。中国科学院自动化研究...

3628
来自专栏人工智能头条

“无中生有”计算机视觉探奇

1524
来自专栏云时之间

NLP系列学习:文本聚类

最近一段时间在文本聚类的工作,一路也遇到了不少坑,自己也写一篇文章记录了一下自己的过程.

990
来自专栏AI科技评论

视频 | 两分钟论文:从冬天回到夏天,英伟达的迁移网络能派上用场

本期论文:Unsupervised Image-to-Image Translation Networks 论文译名:无监督以图生图(图到图迁移网络) 英伟达推...

3765

扫码关注云+社区