专栏首页arxiv.org翻译专栏探索人类智商测试中神经模型的空间推理能力(CS AI)
原创

探索人类智商测试中神经模型的空间推理能力(CS AI)

尽管神经模型在图像识别和问答等各种任务中表现出色,但它们的推理能力仅在少数研究中得到测试。 在这项工作中,我们集中在空间推理和探索的空间理解的神经模型。 首先,我们描述以下两个空间推理 iq 测试: 旋转和形状合成。 使用定义良好的规则,我们构建了由不同复杂度级别组成的数据集。 我们设计了各种实验的概括,并评估了六个不同的基线模型的新生成的数据集。 对影响模型泛化能力的结果和因素进行了分析。 此外,我们还分析了神经模型如何利用视觉辅助解决空间推理测试。 我们的发现将为理解机器以及机器与人类的区别提供有价值的见解。

原文题目:Exploring The Spatial Reasoning Ability of Neural Models in Human IQ Tests

原文:Although neural models have performed impressively well on various tasks such as image recognition and question answering, their reasoning ability has been measured in only few studies. In this work, we focus on spatial reasoning and explore the spatial understanding of neural models. First, we describe the following two spatial reasoning IQ tests: rotation and shape composition. Using well-defined rules, we constructed datasets that consist of various complexity levels. We designed a variety of experiments in terms of generalization, and evaluated six different baseline models on the newly generated datasets. We provide an analysis of the results and factors that affect the generalization abilities of models. Also, we analyze how neural models solve spatial reasoning tests with visual aids. Our findings would provide valuable insights into understanding a machine and the difference between a machine and human.

原文作者: Hyunjae Kim

原文地址:https://arxiv.org/abs/2004.05352

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 识别在公共交通系统中传播疾病的有传染性的旅行者(CS SI)

    最近一种新型冠状病毒的爆发及其迅速传播突出了了解人类流动性的重要性。 密闭空间,例如公共交通工具(例如巴士及火车) ,提供适当的环境让感染迅速广泛传播。因此,调...

    用户7095611
  • 枪声:枪声样本数字取证与人工智能(CS LG)

    根据炮口冲击波对武器进行分类是一项具有挑战性的任务,在各种安全和军事领域有着重要的应用。 现有的大多数工程依赖于特别部署的空间多样性麦克风传感器,以捕捉同一枪击...

    用户7095611
  • 架起图表和网络之间的桥梁(CS SI)

    网络科学已经成为描述现实世界中复杂的物理、生物、社会和技术系统的结构和动态的有力工具。主要建立在经验观察的基础上,以解决异质性,暂时性和适应性的相互作用模式,其...

    用户7095611
  • 基于智能多智能体的系统在电子医疗安全中的应用(CS CAS)

    近年来,用于电子医疗记录(EHR)的广泛系统的可用性和使用不断增加。在诸如医院和其他实验室的医疗中心,在治疗过程中形成了更多的健康数据集。为了提高医疗保健中提供...

    时代在召唤
  • DCO分析器:分布式测试场景的局部可控性与可观测性的分析与实现(CS SE)

    为了确保关键场景中异构分布式系统的互操作性和行为的正确性,必须要基于部署在系统组件附近的分布式测试组件(称为本地测试程序)来执行自动化集成测试,以模拟来自环境的...

    Elva
  • 面向工程师的最佳统计机器学习课程,Fall 2017 美国圣母大学,28章节详细讲述(附PPT下载,课程目录视频)

    【导读】美国圣母大学2017年新开课程《给科学家和工程师的统计学习》Statistical Computing for Scientists and Engin...

    WZEARW
  • 无约束多视点视频中动态事件的4D可视化(CS CV)

    我们提出了一种基于数据驱动的手持式多摄像机动态事件4D时空可视化方法。我们方法的关键是使用特定于场景的自监督神经网络来组成事件的静态和动态方面。虽然从离散的视角...

    蔡秋纯
  • 智能电网数据存储与处理架构的比较研究(CS SE)

    世界各地的许多政府和组织都同意,解决能源独立,全球变暖或紧急应变能力等国家和国际问题的第一步是重新设计称为智能电网的电网。通常,电网以次优的方式将电力从发电厂广...

    刘子蔚
  • 纪念:Dan Kohn(1972年11月20日-2020年11月1日)

    General Manager, Linux Foundation Public Health

    CNCF
  • 蛋糕切割图:离散和有界比例协议

    作者:Xiaohui Bei,Xiaoming Sun,Hao Wu,Jialin Zhang,Zhijie Zhang,Wei Zi

    罗大琦

扫码关注云+社区

领取腾讯云代金券