腾讯优图团队再创佳绩,刷新人脸识别世界纪录

近日,在国际权威人脸识别数据库LFW上,腾讯优图团队提交了在无限制条件下人脸验证测试(unrestricted labeled outside data)中的最新成绩,99.65%。这一结果打破了之前Facebook、Face++、Google等团队创造的纪录。这是该团队继去年FDDB人脸检测数据库上拔得头筹以后,又一次人脸分析领域技术研发上的重要突破。LFW全称 Labeled Faces in the Wild,是由马萨诸塞大学(University of Massachusetts)计算机视觉实验室维护的一套公开数据库,建立初衷是用于研究非受限情形下的人脸识别问题。不同于实验室环境下各种受限条件下采集的人脸库,LFW主要取材于新闻图片中的真实人脸,在视角、姿态、表情、光照、遮挡(如衣领帽子)甚至年龄等方面具有较高的多样性。LFW数据库共包含约13000张人脸,共5749个身份,其中1680个人含有多于一张图片。以其识别任务的挑战性和数据的丰富性,LFW当前已经成为学术界(工业界) 评价人脸识别性能最热门的benchmark之一。

刷新纪录的成果介绍(LFW官网Results截图)

在众多模式识别的应用领域中,人脸识别是一项兼具研究价值与应用价值的课题。解决人脸识别的关键在于能否找到一种稳定的,不轻易随着光照、视角、姿态、表情等外部因素变化而变化的,描述人脸身份ID的特征表达。传统的解决方案主要依赖于人工抽取特征(如HOG、LBP等),但限于底层特征的表达能力有限,难有突破性进展。近年来,随着深度学习技术的崛起与发展,借助海量数据与软硬件结合的快速优化算法,自动化抽取高层语义特征已然成为图像分析与识别领域的主流技术之一,同时也给人脸识别这一难题的进一步解决带来了机遇。

立足于在人脸分析领域内的多年深耕与积累,腾讯优图团队基于海量训练数据及深度学习技术,在数据采集、模型优化、训练、组合表达等环节不断积累与探索,最终产出了具备高精度识别能力的人脸深度特征表达模型Deep_UFACE 模型(以下简称UFACE)。实验证明,该模型抽取的人脸特征在不同变化条件具备高鲁棒性。LFW测试上,仅利用单个人脸patch进行特征抽取及验证即可达到98.5%+的准确率,组合20个patch之后准确率达到99.65%。不仅如此,UFACE模型也展现出巨大的应用价值,在业务数据集的测试表明,采用UFACE模型进行人脸身份比对,相较非深度方法在同等误识率条件下漏识率降低了50%以上。

厚积方能薄发,优图团队取得如此骄人的成绩除了团队自身秉持的精益求精的技术研发理念,主要得益于以下三个方面的持续积累与探索。

1、重视业务数据上的持续积累。近年来机器学习领域上的突破越来越有赖于采集数据规模及质量,这已成为业界的共识。早在2014年,优图团队通过人脸技术在各项业务中的落地,积攒了千万量级的人脸身份数据,毋庸置疑这为团队在人脸领域的全方位技术突破提供了巨大的潜在优势。

2、人脸研发主线上的持续投入。优图从2012年起,逐步积累了人脸检测、五官配准、人脸度量学习等具有国际竞争力的核心人脸技术,这些辅助的软实力为团队在人脸识别的进一步突破提供了坚实的技术基础。

3、在深度学习领域上的布局与探索。相比较其它IT巨头组建的研究团队(百度、Google),优图在深度学习领域起步较晚,但已取得了相当不错的成绩。如在深度学习为主导的图像识别领域,优图借助于大规模深度神经网络的训练,今年4月份在Pascal Voc 2012上刷新了纪录,此项技术当前也在逐步推广到公司内外的业务中,如腾讯云。他山之石可以攻玉,Deep_UFACE模型在设计与优化上深度借鉴了此前在图像识别领域的技术经验与成果。

优图团队是腾讯旗下专门研究机器学习,智能识别的团队,该团队在近期推出了腾讯优图开放平台,将人脸识别技术免费开放供开发者使用。

更多开放策略可关注腾讯优图开放平台(http://open.youtu.qq.com)。

本文分享自微信公众号 - 腾讯高校合作(Tencent_UR)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2015-06-25

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏灯塔大数据

原创译文 | 数据科学家告诉你:深度学习和机器学习不同

导读:上一期介绍了无人驾驶的发展现状,今天我们来了解一下深度学习和机器学习的不同实践和运用(文末更多往期译文推荐) ? GoodData数据科学和机器学习高级总...

34650
来自专栏大数据文摘

大咖 | 《深度学习革命》作者:人们对AI概念的理解存在偏差

对基本概念的误解必然导致对人工智能的错误解读。因此“杀手AI”、“机器人使我们过时”等话题便应运而生。

11020
来自专栏BestSDK

火爆的机器学习和人工智能,为何在金融业四处碰壁?

在2008年金融危机期间,银行业认识到,他们的机器学习算法是基于有缺陷的假设。 因此,金融体系监管机构决定需要额外的控制措施,并引入了对银行和保险公司进行“模式...

36360
来自专栏AI科技评论

动态 | 微软亚洲研究院资深研究员梅涛:原来视频可以这么玩了! | CCF-GAIR 2017

7月9日,由CCF主办,雷锋网与香港中文大学(深圳)承办的CCF-GAIR 2017全球人工智能与机器人峰会进入了第三天。在CV+专场首场,微软亚洲研究院资深研...

38770
来自专栏新智元

百度徐伟:深度学习存在3大瓶颈,如何打造通用人工智能研究平台?

【新智元导读】百度IDL实验室杰出科学家徐伟关于“通用人工智能研究”的演讲,关于通用人工智能,此前大多数讨论都集中在相信不相信,可不可以实现阶段。但是,徐伟在本...

407100
来自专栏新智元

腾讯优图杰出科学家贾佳亚:视觉AI的新认识,揭秘“卸妆”算法

【新智元导读】新智元AI WORLD2017 世界人工智能大会上,腾讯优图实验室杰出科学家、计算机视觉专家贾佳亚教授从前端、后端的视觉AI说起,分享了腾讯优图在...

443110
来自专栏AI研习社

数据科学、机器学习、人工智能,都有哪些区别?

当我向别人介绍我是数据科学家时,我常常被问到“数据科学和机器学习有什么区别”或者“这是否意味着你在从事人工智能工作?”类似问题我已经回答过很多次,答案可以总结成...

41090
来自专栏镁客网

Facebook推出人工智能引擎DeepText,让机器更好的理解语言和内容

20640
来自专栏编程

5本书带你走进Python与机器学习的世界

基于大数据的人工智能如今异常火爆 Python 作为最热门的编程语言之一 是实现机器学习算法的首选语言 Python与机器学习这一话题非常的宽广 5本书虽很难覆...

408100
来自专栏机器之心

通向未来人工智能的三条赛道:高性能计算、神经形态计算和量子计算

选自datasciencecentral 作者:William Vorhies 机器之心编译 参与:黄小天、蒋思源 有三种技术,可以带来更快、更简单、更廉...

373110

扫码关注云+社区

领取腾讯云代金券