人脸识别技术的真相

人脸识别是机器学习的直接应用,这项技术已经被消费者、行业和执法机关广泛采用,它可能为我们的日常生活带来了便利,但也有严重的隐私问题。人脸识别已经超过了人类的工作效率,但是,在某些应用中实际实现时还存在问题。

立足于九十年代MIT的Eigenfaces方法,人脸识别第一次成功的大规模实现是2014年Facebook的DeepFace项目,准确性在实验室条件下达到了人类水平。从2014年开始,更大的训练数据集、GPU以及神经网络架构的快速发展进一步提高了人脸识别在通向现实世界可靠应用的更为丰富的上下文中的效率。

人脸识别的应用可以分类两类:身份验证和识别。这两种场景起初都会把一组已知的主体注册到系统中(图库),在测试期间,提供一个新的主体(测试图像)。人脸验证会计算图库和测试图像之间一对一的相似性,从而确定两副图像是否是相同的主体。例如,iPhone X基于人脸的登录功能或者机场的边境检查就是使用了这样的生物特征身份认证解决方案。目前,HSBC和Ticketmaster都考虑在他们的移动应用程序中使用人脸验证。另一方面,人脸识别计算一对多的相似性,从而在预先做好识别的人物图库中正确地识别出测试图像。它的主要应用是把未标记的照片和已知的资料进行匹配。其中,执法机关会使用这项技术从人群中识别出他们感兴趣的人。

人脸识别技术还可以用于推断人的特征和行为,如情绪、年龄或健康状况。斯坦福大学最近一项颇具争议的研究表明,基于一个从Tinder抽取的数据集,使用人脸分析方法预测一个人的性取向时准确率可达81%。

全球人脸识别市场主要在消费品、工业应用和执法三个领域,据Allied Market Research和Report Buyer介绍,到2022年,这个市场有望达到90亿美元。生物识别解决方案市场的主要参与者包括Safran(FR)、NEC Corporation(JA)、Cognitec(DE)和Face++(CH)。

但是,人脸识别是一种不同于其他技术的生物识别工具。乔治敦隐私&技术法律中心执行董事、人脸识别专家Alvaro Bedoya在近日接受USA Today采访时说,“你可以删除cookies。你可以修改浏览器设置。你可以把手机忘家里,但你不能删除你的脸,你不能把它忘家里”。人脸识别是一种不需要同意的生物认证工具。

越来越多的公民自由和隐私协会指出人脸识别的使用存在违反公民自由和隐私的危险,包括ACLU、人权观察、电子前线基金会以及英国的老大哥观察。有40家协会在一封给Amazon的、有关人脸识别系统Rekognition的邮件上签名,要求Amazon不再允许政府使用AWS Rekognition。2016年,作为Amazon Web Services云业务的一部分,Amazon推出了Rekognition。Facebook在加利福尼亚州也面临着一场根据生物信息隐私法案提起的针对其使用人脸识别的集体诉讼。在谷歌上搜索“Facebook Face Recognition”,第一页的前10个结果中,有6个是关于关闭人脸识别特性,这可以说明人们对这项技术的广泛质疑。

这项技术已经发展了好多年,在标准训练集上得分很高。不过,现实环境会带来一些特殊的挑战。例如,由于姿势的原因,一个人脸部的差别可能比不同人脸部的差别还要大。光照、表情、年龄和眼镜、帽子等遮挡物的差异也会妨碍识别。我们并不是总能获得主体的正面照,使用其他角度的照片会让处理过程增加额外的校准步骤。英国大都会警察局最近在节日期间使用人脸识别的情况就可以说明在现场人群中推广实验室实验还存在困难,超过95%的匹配都是误报。

可靠起见,人脸识别需要大型的训练数据集和强大的匹配模型。谷歌和Facebook利用人们上传到其平台的照片构造了大型的专有数据集。也有开源的大型数据集可供使用。Wild中的Labeled Faces(LFW)于2007年发布,其中包含6000人的13000张正面图像。MS-Celeb-1M是当前最大的名人人脸识别公共数据集,其中包含10K名顶级知名人士的10M图像,而MegaFace的训练集中包含670K不同个体的4.7M照片和1M的干扰项。

一般来说,人脸识别分为三个步骤:定位、标准化和识别。系统首先会定位图像中的人脸并探明轮廓。标准化是调整原始照片,使它接近于正面版本。然后,人脸识别模块会作用于这些经过重定位的人脸。标准化步骤有一种变体,为了模拟不同的姿势,它会通过生成正面照的多种表示来扩大目标空间。从2D图像重构出3D模型,生成姿势的各种变化,然后重新投射到各种2D的变化,就是这种增强技术的一个例子。

从90年代开始,人脸识别就已经不再以手工创建的局部特征为基础,而是转而使用深度学习模型。Facebook的Deepface模型是在LFW数据集上训练的,这是第一个达到人类效率的模型。经典的卷积神经网络(CNN)和架构,如AlexNet、VGGNet、GoogleNet和ResNet,被广泛地用作人脸识别的基线模型。后来,这些模型被用于专门为促进识别和泛化而设计有激活函数和损失函数的人脸识别。Face++、MegaFace、FaceNet是其他一些专门设计用来人脸识别的神经网络模型。

当前,人脸识别面临的挑战包括实现不同姿势、不同年龄人脸变体识别的健壮性、使用“照片简图(photo-sketches)”代替真正的照片、处理低分辨率照片、识别遮挡、彩妆及欺骗技术。

原文发布于微信公众号 - 程序你好(codinghello)

原文发表时间:2018-06-14

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏大数据文摘

数据科学中的“数据智慧”

18310
来自专栏人工智能快报

IBM正在研制通用型深度学习芯片

深度学习领域仍在不断发展,特别地,专家们认识到如果芯片能够使用低精度的计算方式得出近似答案,神经网络就可以用很少的资源完成大量的计算。这在移动设备和其他功率受限...

1102
来自专栏新智元

重磅!基于三维集成芯片的光量子计算原型机问世,上海交大金贤敏团队研制

10 月 29 日,最新一期国际权威学术期刊《自然•光子学》(影响因子:37.85) 以“Experimental quantum fast hitting o...

1145
来自专栏华章科技

超级干货 :一文读懂社交网络分析

社交网络在维基百科的定义是“由许多节点构成的一种社会结构。节点通常是指个人或组织,而社交网络代表着各种社会关系。”在互联网诞生前,社交网络分析是社会学和人类学重...

3182
来自专栏机器之心

如何做好论文评审工作?CVPR 2019程序委员会有话说

作者:Derek Hoiem, Gang Hua, Abhinav Gupta, and Zhuowen Tu

1394
来自专栏AI科技大本营的专栏

DeepMind 研发出类脑 AI 神经元,具备超强空间导航能力

Google 旗下人工智能公司 DeepMind 的研究人员最近在《自然》杂志上发表论文,宣布同伦敦大学学院的神经生理学家合作,研发出了能够模拟哺乳动物大脑中网...

1101
来自专栏大数据挖掘DT机器学习

教你如何用机器学习预测《权利的游戏》中的叛徒

几个月之前,Airbnb发布了一篇博文,在这篇文章中作者向读者介绍了他们的数据科学家建立一个机器学习模型来保护自己的用户免遭来自恶意行为的欺诈危害。如果我们将...

3636
来自专栏CSDN技术头条

携程:机器学习在酒店服务领域的实践

在携程技术中心推出的线上公开课程[携程技术微分享]上,携程酒店研发BI经理潘鹏举介绍了如何借助大数据和算法,通过机器学习去克服酒店服务行业挑战。目前的应用主要包...

3428
来自专栏机器学习之旅

应用:商品需求预估

假设现在有这么一个人,23岁,一线城市白领,常常出入城市CBD,之前没有任何的平台行为,刚刚注册app,那么他会买什么?

772
来自专栏ATYUN订阅号

Deepmind:让AI学会在没有地图的城市中导航

AiTechYun 编辑:nanan 在你童年时你是如何学会去朋友家、学校或者小卖部的?也许你不需要地图,只是简单地记住沿途街道的外观和转弯处就行。随着你逐渐探...

3537

扫码关注云+社区

领取腾讯云代金券