清华大学王生进教授团队在人像识别研究中取得突出进展

你知道人像识别技术吗?人像识别技术分为人脸识别与行人再识别两种。

将两张图片放在一起,区分是否为同一人,这就是人脸识别的简单应用。

目前,人类对于此类人脸识别的准确度仅为97%,而人工智能则达到了99.8%。

如此的高精确度诱发了研究者对于人工智能算法更加苛刻的追求——将一张照片放入数据量更加庞大的数据库中进行比对,人工智能能做到什么程度呢?

Megaface,美国华盛顿大学计算机科学与工程实验室发布并维护的一套公开人脸数据集。其中包含一百万张图片,代表69万个独特的人。megaface是第一个在一百万规模级别的面部识别算法测试基准,与LFW数据库侧重于对比两张人脸照片是否具有相同身份。

行人再识别则是给定一个感兴趣的人,行人再识别Re-ID需要在其他时间,其他地点,其他相机再次将人物指定出来。对于训练集,测试集来讲,它很大的一个特点是没有ID上的重叠。这和图像分类有很大不同,图像分类所有的类在训练阶段都是可以见到并且学习的。

2017年,行人再识别研究飞速进展。在公开数据集Market-1501上,一选正确率从2016年ECCV中较高的65.9%提高到2017年ICCV中的80+%,王生进团队不仅贡献了行人再识别领域公开图像数据集iLIDS-VID,Market-1501及视频数据集MARS,所提出的方法近期又刷新了国际最高水平,将Market-1501数据集该指标提高到95%左右。

近日,来自全球的各大人工智能企业,例如google、百度都参与了Megaface的算法测试。华泰科捷合作伙伴——清华大学电子工程系王生进教授团队的人像识别算法也参与到了该测试中,截至目前,有一项拿到了第一名的好成绩。

THU CV-AI Lab为清华大学电子工程系王生进教授团队

与LFW测试数据集的1:1算法测试不同,MegaFace测试数据集采用1:N的测试,将一张照片投入百万级数据库,因此难度更高。

近些年,深度学习发展迅速,人工神经网络得到提升,最高已达到1000层,这使得机器的学习能力越来越强,应用于人脸识别的准确度越来越高。

然而,我们不能因此而停步不前,人脸识别仍有着亟待解决的问题——复杂环境下的人脸识别。

由于光线导致的过曝或过暗,由于姿态导致的图像输入问题,由于戴口罩等原因导致的信息录入不全,这些都会影响机器的判断。我们无法预测实际环境,所以,在没有考虑环境的情况下算法性能会有所下降,这也阻碍了人脸识别技术在各行各业的应用。

如此问题,是整个AI行业面临的问题和阻力。Megaface数据库第一的测试结果证明了,王生进教授团队已具备攻克这一行业阻力的能力。目前,他们也正在与华泰科捷精诚合作,联合打造加载动态人脸识别算法的智能前端产品,并且计划于今年4月召开智能前端产品发布会。届时,他们将共同把复杂环境下的动态人脸识别方案及产品展现给大家,敬请期待。

  • 发表于:
  • 原文链接:http://kuaibao.qq.com/s/20180103G0U3SK00?refer=cp_1026

扫码关注云+社区