DeepMind研究:测试神经网络的抽象推理

编译:chux

出品:ATYUN订阅号

机器能学会抽象推理吗?这是谷歌子公司DeepMind发表的一篇新论文的主题,题为“Measuring abstract reasoning in neural networks”,将在瑞典斯德哥尔摩举行的国际机器学习会议上发表。

研究人员将抽象推理定义为在概念层面检测模式和解决问题的能力。人类的语言,空间和数学推理可以通过测试来经验性地测量,如通过梳理形状位置和线条颜色之间的关系。但那些测试并不完美。

“问题是,即使是人类,如果受试者准备太多,这样的测试也可能无效,因为可以学习特定测试的启发式方法,从而缩短了对普遍适用的推理的需求,”研究人员解释说,“鉴于神经网络具有惊人的记忆能力,这种潜在的缺陷在神经网络中更为严重。”

团队的解决方案是一个生成器,它创建涉及一系列抽象因素的问题,包括“渐进”之类的关系以及“颜色”和“大小”之类的属性。他们限制这些因素来创建不同的问题集,例如,揭示的谜题仅在应用于线条颜色时的渐进关系,以测试和训练机器学习模型。人们的想法是,高熟练度的算法,很有可能推断出他们从未见过的概念。

机器学习模型完成的一个视觉测试

大多数模型在测试中表现良好,有些模型的性能高达75%,研究人员发现,模型准确性与推断任务的潜在抽象概念的能力密切相关。他们通过训练模型来获得答案,从而提高了性能,并预测了应该考虑的关系和属性来解决这个难题。

团队写道,“有些模型学会了解决复杂的视觉推理问题,为此,他们需要从原始像素输入中诱导和检测抽象概念的存在,如逻辑运算和算术进展,以及将这些原则应用于从未观察到的刺激。”

但即使是表现最佳的神经网络Wild Relation Network(WReN)也有其局限性:它无法推断出在训练期间没有看到的属性值,并且在对先前看到的关系进行训练时,它在泛化任务上的表现更差(例如,形状数量的进展)或新属性(大小)。

“我们的研究结果显示,对于泛化得出普遍的结论可能是无益的:我们测试的神经网络在某些泛化方案中表现良好,而在其他方面表现很差,”该团队在博客文章中写道,“他们的成功取决于一系列因素,包括所用模型的架构以及该模型是否经过训练,以便为其答案选择提供可解释的理由。”

最终的结果可能是一个大杂烩,但研究人员还没有放弃。他们打算探索改进泛化的策略,并探索在未来的模型中使用结构丰富、但普遍适用的归纳偏差。

论文:proceedings.mlr.press/v80/santoro18a/santoro18a.pdf

本文分享自微信公众号 - ATYUN订阅号(atyun_com)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-07-12

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏新智元

【自监督学习机器人】谷歌大脑首次实现机器人端到端模仿人类动作 | 视频

【新智元导读】 机器人仅需观察人类行为就能模仿出一模一样的动作,这一机器人领域发展的长期目标最近被谷歌大脑“解锁”。在新发布的一项研究中,谷歌大脑团队介绍了他们...

46850
来自专栏腾讯大数据的专栏

微信公众号广告点击率预估效果优化

1.背景点击率预估(pCTR)是广告投放过程中的一个重要环节,精准的点击率预估对于广告投放系统收益最大化具有重要意义。pCTR的优化主要有算法优化,系统改进,特...

39360
来自专栏AI科技评论

深度 | BAIR论文:通过“元学习”和“一次性学习”算法,让机器人快速掌握新技能

AI科技评论按:近日伯克利大学人工智能实验室(BAIR)Sergey Levine团队在Arxiv上发布了一篇名为《One-Shot Visual Imitat...

421100
来自专栏数据科学与人工智能

【深度学习】深度学习未来十大趋势

神经网络框架变得越来越复杂而精密 在感知、语言翻译等等方面的大部分最先进的神经网络框架正在发展并且不在仅仅关于简单前馈式(feed forward)框架或者卷积...

40390
来自专栏PPV课数据科学社区

【推荐】开发者成功使用机器学习的十大诀窍

作者|Alexander Gray 编译|刘帝伟 转自|CSDN 在提供发现埋藏数据深层的模式的能力上,机器学习有着潜在的能力使得应用程序更加的强大并且更能响应...

24730
来自专栏AI科技评论

业界 | 百度引入Ring Allreduce算法,大规模提升模型训练速度

AI科技评论消息,美国西部时间2月21日,百度硅谷人工智能实验室(SVAIL)宣布将Ring Allreduce算法引进深度学习领域,这让基于GPU训练的神经网...

488120
来自专栏AI科技大本营的专栏

直播课程 | TensorFlow工程大咖带你由浅入深玩转深度学习算法

王琛老师有话说 ? 《深度学习基础与TensorFlow实践》 AI100学院有幸邀请到《深度学习原理与TensorFlow实践》作者之一、百纳信息公司AI...

38160
来自专栏算法channel

一文梳理NLP之机器翻译和自动摘要的发展现状

2 NLP入门:CNN,RNN应用文本分类,个性化搜索,苹果和乔布斯关系抽取(2)

90620
来自专栏CreateAMind

用DNN构建推荐系统-Deep Neural Networks for YouTube Recommendations论文精读

虽然国内必须翻墙才能登录YouTube,但想必大家都知道这个网站。基本上算是世界范围内视频领域的最大的网站了,坐拥10亿量级的用户,网站内的视频推荐自然是一个非...

47830
来自专栏Duncan's Blog

社交网络中抽取有代表性的用户

将用户以各个属性构建向量,以向量之间的距离来定义人物之间的代表性. 以Twitter社交拓扑为例,当A用户关注了B用户,将会有A指向B的一条有向边,

16420

扫码关注云+社区

领取腾讯云代金券