麻省理工科研人员开发出新型人脸识别算法

美国麻省理工学院网站发布消息称,该校科研人员开发出了一种新的人脸识别算法,这是一种新的基于人脑面部识别机制的计算模型,似乎能够捕获被现有模型忽略的一些人类神经学方面的特征。

研究人员设计了一个机器学习系统来实现其模型,并使用了大量样本图像训练该系统识别特定人脸。他们发现,经过训练的系统多了一个中间处理步骤,该步骤能够表示面部的旋转度,例如从中心旋转45度,但未说明是向左还是向右。

这一属性没有被内置到系统中,而是在训练过程中自发出现的,其特征与过去实验中观察到的灵长类动物的面部处理机制相似,研究人员认为这表明他们的系统与大脑的处理方式相似。

麻省理工学院意识与机器中心(CBMM)的科研人员指出:“这不能说明我们完全掌握了真理,模型只是对现实世界特别是对生物学的简单模拟。如果事情真的这么简单,我反而会感到惊讶。但我认为这是有力的证据,说明我们的研究方向是正确的。”

事实上,研究人员的新论文纳入了一项数学论证,他们使用特定类型的机器学习系统研究一种“生物学上合理的”神经系统模型,这类机器学习系统必定会产生与旋转角度无关的中间表征。

科研人员表示:这篇新文章“很好地说明了我们在CBMM要做的事情。一方面是机器学习与计算机科学的整合,另一方面是对神经生理学以及人类行为的研究。这意味着我们不仅能够了解大脑使用了什么算法,还能了解大脑中的回路是如何实现这些算法的。”

科研人员长期以来认为大脑必须产生对面部和其他对象的“稳定”表征,这种表征与空间中对象的方向、它们与观看者的距离或在视野中所处的位置无关。对人脑和猴脑的磁共振扫描资料支持了这一观点。但在2010年,科研人员发表了一项研究结果,详细地描述了猕猴面部识别机制的神经解剖学特征。

研究人员表示,来自猴子视神经的信息会通过一系列大脑部位传递,每个大脑部位对面部朝向的敏感性都比前一个大脑部位差。第一区域中的神经元仅对特定的面部朝向做出放电反应;最后一个区域中的神经元是否放电与面部朝向无关,而是一种恒定的表征。

但中间区域中的神经元似乎是“镜像对称的”,即它们对面部旋转的角度敏感,而对方向不敏感。在第一区域中,如果面部向左旋转45度,则将有一簇神经元被激发,而如果向右旋转45度,则将有另外的簇被激发。在最后一个区域,无论面部旋转30度、45度、90度还是其间的任何角度,相同的神经元群都会被激发。但是在中间区域,如果面部向某一方向旋转45度,则特定的神经元簇将被激发。如果旋转30度,则另外的神经元簇将被激发。这正是研究者开发的机器学习系统所再现的现象,研究人员表示:“这一模型的目的并非解释镜面对称性而是恒定性,而研究过程中发现了另一个属性。”

科研人员创建的机器学习系统是一个神经网络,原因在于它粗略地模仿了人类大脑的结构。神经网络由分层布置的非常简单的处理单元组成,这些处理单元密集地连接到上层和下层的各个处理单元或节点。数据被传递到网络的最底层,并在这里以某种方式被处理,然后传递到下一层,如此反复。在训练期间,顶层的输出结果与某些分类标准相关,如要求正确判断给定的图像描绘的是不是特定的人。

在早期的工作中,该团队主要是通过训练神经网络记忆一系列有代表性的人脸特征来产生恒定表征,这些人脸特征被研究人员称为“模板”。当神经网络识别新人脸时,它将测量该人脸与模板的差异。如果新人脸的特征与模板中人脸的特征相同,其差异将是最小的,则与这些模板相关联的节点的输出将在到达顶层时成为主导性的信息信号。如果新人脸与模板有差异,则会产生关于新人脸的一个识别性特征。

在实验中,这种方法产生了恒定表征:无论面部朝向如何,其识别性特征都大致相同。但是,记忆模板的机制在生物学上是找不到根据的。因此,新开发的网络使用了基于Hebb规则产生的误差,这在神经学文献中经常被描述为“连在一起的神经元会同时放电”。这意味着在训练期间,如果为了产生更精确的输出而调整节点之间的连接权重,相比那些独立做出反应(或根本不反应)的节点,对特定刺激做出一致反应的节点对最终输出结果的影响更大。

这种方法最终也产生了恒定表征,但网络的中间层也复制了灵长类动物大脑中间视觉处理区域的镜像对称响应现象。

原文发布于微信公众号 - 人工智能快报(AI_News)

原文发表时间:2017-02-04

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器之心

资源 | Geoffrey Hinton多伦多大学演讲:卷积神经网络的问题与对策

2694
来自专栏SIGAI学习与实践平台

人脸检测算法之 S3FD

原创声明:本文为 SIGAI 原创文章,仅供个人学习使用,未经允许,不得转载,不能用于商业目的。

1394
来自专栏CVer

[计算机视觉论文速递] 2018-05-19

这篇文章有4篇论文速递信息,涉及人脸识别(综述)、人脸检测、3D 目标检测和姿态估计和目标检测等方向(含2篇CVPR 2018)。

652
来自专栏新智元

效果惊艳!FAIR提出人体姿势估计新模型,升级版Mask-RCNN

来源:densepose.org 【新智元导读】FAIR和INRIA的合作研究提出一个在Mask-RCNN基础上改进的密集人体姿态评估模型DensePose-R...

37113
来自专栏机器之心

ICML 2018 | 英伟达提出仅使用噪点图像训练的图像增强方法,可去除照片噪点

近期在深度学习领域的研究聚焦于通过展示带噪点和清晰的图像示例对来训练神经网络修复图像。然后 AI 系统学习如何弥补差异。新方法的不同之处在于,它仅需要两张都带噪...

1054
来自专栏机器学习、深度学习

人脸检测--Supervised Transformer Network for Efficient Face Detection

Supervised Transformer Network for Efficient Face Detection ECCV2016 人脸检测: the...

1947
来自专栏AI科技评论

干货 | 香港科技大学施行健:深度学习如何用于短临降雨预报

AI科技评论按:本文介绍了 NIPS 2017 论文: Deep Learning for Precipitation Nowcasting: A Benchm...

3667
来自专栏新智元

【Nature重磅】谷歌AI自动重构3D大脑,最高精度绘制神经元

【新智元导读】AI能够映射大脑神经元。人类大脑包含大约860亿个神经元,并且一个立方毫米的神经元可以产生超过1000TB的数据。由于其庞大的规模,绘制神经系统内...

482
来自专栏瓜大三哥

DeepID3(0.9745):商汤科技

深度学习在人脸识别领域的应用提高了人脸识别的准确率。本文中,使用了两种深度神经网络框架(VGG net和GoogleLeNet)来进行人脸识别。两种框架ense...

2535
来自专栏瓜大三哥

CNN-3DMM extimation(0.9235)

当在真实场景中应用3d模拟来增加人脸识别精度,存在两类问题:要么3d模拟不稳定,导致同一个个体的3d模拟差异较大;要么过于泛化,导致大部分合成的图片都累死。因此...

26210

扫描关注云+社区