麻省理工科研人员开发出新型人脸识别算法

美国麻省理工学院网站发布消息称,该校科研人员开发出了一种新的人脸识别算法,这是一种新的基于人脑面部识别机制的计算模型,似乎能够捕获被现有模型忽略的一些人类神经学方面的特征。

研究人员设计了一个机器学习系统来实现其模型,并使用了大量样本图像训练该系统识别特定人脸。他们发现,经过训练的系统多了一个中间处理步骤,该步骤能够表示面部的旋转度,例如从中心旋转45度,但未说明是向左还是向右。

这一属性没有被内置到系统中,而是在训练过程中自发出现的,其特征与过去实验中观察到的灵长类动物的面部处理机制相似,研究人员认为这表明他们的系统与大脑的处理方式相似。

麻省理工学院意识与机器中心(CBMM)的科研人员指出:“这不能说明我们完全掌握了真理,模型只是对现实世界特别是对生物学的简单模拟。如果事情真的这么简单,我反而会感到惊讶。但我认为这是有力的证据,说明我们的研究方向是正确的。”

事实上,研究人员的新论文纳入了一项数学论证,他们使用特定类型的机器学习系统研究一种“生物学上合理的”神经系统模型,这类机器学习系统必定会产生与旋转角度无关的中间表征。

科研人员表示:这篇新文章“很好地说明了我们在CBMM要做的事情。一方面是机器学习与计算机科学的整合,另一方面是对神经生理学以及人类行为的研究。这意味着我们不仅能够了解大脑使用了什么算法,还能了解大脑中的回路是如何实现这些算法的。”

科研人员长期以来认为大脑必须产生对面部和其他对象的“稳定”表征,这种表征与空间中对象的方向、它们与观看者的距离或在视野中所处的位置无关。对人脑和猴脑的磁共振扫描资料支持了这一观点。但在2010年,科研人员发表了一项研究结果,详细地描述了猕猴面部识别机制的神经解剖学特征。

研究人员表示,来自猴子视神经的信息会通过一系列大脑部位传递,每个大脑部位对面部朝向的敏感性都比前一个大脑部位差。第一区域中的神经元仅对特定的面部朝向做出放电反应;最后一个区域中的神经元是否放电与面部朝向无关,而是一种恒定的表征。

但中间区域中的神经元似乎是“镜像对称的”,即它们对面部旋转的角度敏感,而对方向不敏感。在第一区域中,如果面部向左旋转45度,则将有一簇神经元被激发,而如果向右旋转45度,则将有另外的簇被激发。在最后一个区域,无论面部旋转30度、45度、90度还是其间的任何角度,相同的神经元群都会被激发。但是在中间区域,如果面部向某一方向旋转45度,则特定的神经元簇将被激发。如果旋转30度,则另外的神经元簇将被激发。这正是研究者开发的机器学习系统所再现的现象,研究人员表示:“这一模型的目的并非解释镜面对称性而是恒定性,而研究过程中发现了另一个属性。”

科研人员创建的机器学习系统是一个神经网络,原因在于它粗略地模仿了人类大脑的结构。神经网络由分层布置的非常简单的处理单元组成,这些处理单元密集地连接到上层和下层的各个处理单元或节点。数据被传递到网络的最底层,并在这里以某种方式被处理,然后传递到下一层,如此反复。在训练期间,顶层的输出结果与某些分类标准相关,如要求正确判断给定的图像描绘的是不是特定的人。

在早期的工作中,该团队主要是通过训练神经网络记忆一系列有代表性的人脸特征来产生恒定表征,这些人脸特征被研究人员称为“模板”。当神经网络识别新人脸时,它将测量该人脸与模板的差异。如果新人脸的特征与模板中人脸的特征相同,其差异将是最小的,则与这些模板相关联的节点的输出将在到达顶层时成为主导性的信息信号。如果新人脸与模板有差异,则会产生关于新人脸的一个识别性特征。

在实验中,这种方法产生了恒定表征:无论面部朝向如何,其识别性特征都大致相同。但是,记忆模板的机制在生物学上是找不到根据的。因此,新开发的网络使用了基于Hebb规则产生的误差,这在神经学文献中经常被描述为“连在一起的神经元会同时放电”。这意味着在训练期间,如果为了产生更精确的输出而调整节点之间的连接权重,相比那些独立做出反应(或根本不反应)的节点,对特定刺激做出一致反应的节点对最终输出结果的影响更大。

这种方法最终也产生了恒定表征,但网络的中间层也复制了灵长类动物大脑中间视觉处理区域的镜像对称响应现象。

原文发布于微信公众号 - 人工智能快报(AI_News)

原文发表时间:2017-02-04

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI研习社

最实用的 50 篇文章,教你搭建机器学习 APP

2017 年 1 月到 12 月,我们比较了近 2 万篇关于创建机器学习应用程序的文章,并挑选了排名较前的前 50 篇供大家学习参考。 我们相信,跟着这个领...

47211
来自专栏新智元

【深度强化学习突破】OpenAI Gym 玩游戏达到人类水平

【新智元导读】许多人不信只用1个强化学习算法,就能让计算机从零开始从像素中自动学会玩大部分ATARI游戏,并达到人类的表现水平。本文中,参与设计与研发OpenA...

3846
来自专栏华章科技

人人都能看懂的机器学习!3个案例详解聚类、回归、分类算法

机器学习,一言以蔽之就是人类定义一定的计算机算法,让计算机根据输入的样本和一些人类的干预来总结和归纳其特征和特点,并用这些特征和特点和一定的学习目标形成映射关系...

704
来自专栏机器之心

专访 | 诺基亚首席科学家范力欣:用模糊逻辑实现可解释的深度神经网络

深度学习发展到今天,很大程度上依然是一个「实验主导」的、「先有实验结果再找可能解释」的学科。对实验结果的理论解释,争议不断,而且随着时间的推移,研究者们给出的解...

702
来自专栏机器之心

学界 | UC Berkeley新研究:多视角图像3D模型重建技术

选自BAIR 作者:Abhishek Kar 机器之心编译 参与:李泽南、蒋思源 想象一下图片中的椅子。人类具有无与伦比的推理能力,可以在看到单张图片的情况下想...

35810
来自专栏机器之心

学界 | 面向星际争霸:DeepMind 提出多智能体强化学习新方法

33912
来自专栏AI科技评论

CVPR 2018中国论文分享会 之「人物重识别及追踪」

本文为 2018 年 5 月 11 日在微软亚洲研究院进行的 CVPR 2018 中国论文宣讲研讨会中第三个 Session——「Person Re-Ident...

1634
来自专栏机器之心

教程 | 用生成对抗网络给雪人上色,探索人工智能时代的美学

4007
来自专栏AI研习社

浅析Geoffrey Hinton最近提出的Capsule计划

Geoffrey Hinton 以「深度学习之父」和「神经网络先驱」闻名于世,其对深度学习及神经网络的诸多核心算法和结构(包括「深度学习」这个名称本身,反向传播...

3449
来自专栏PPV课数据科学社区

深度学习带你抠像表演

前情 回顾这些年机器学习的进展,我也一直想弄点真正的机器学习产品。 几个月前,我参加了超棒的Fast.ai深度学习课程之后,我好像就开窍了,我也有了机会:得益于...

2996

扫码关注云+社区