学界 | 山世光等四位学者带来生物特征识别精彩报告

中国图象图形学学会围绕「生物特征识别」这一主题,在中科院自动化所成功举办了第四期「CSIG 图像图形学科前沿讲习班」。

AI 科技评论按:2018 年 4 月 14 日-15 日,中国图象图形学学会围绕「生物特征识别」这一主题,在中科院自动化所成功举办了第四期「CSIG 图像图形学科前沿讲习班」。

生物特征识别 (BIOMETRICS),是指通过计算机利用人体所固有的生理特征(指纹、虹膜、面相、DNA 等)或行为特征 (步态、击键习惯等) 来进行个人身份鉴定的技术。

本期讲习班邀请了旷视科技首席科学家孙剑,中科院自动化所研究员孙哲南、山世光、郝然、王亮,清华副教授冯建江、徐明星,中山大学教授郑伟诗等八位学者分别就人脸、虹膜、指纹、步态、音纹等人体特征的研究现状做了详细报告。

AI 科技评论在本文中将对 15 日王亮、郑伟诗、徐明星、山世光的 4 场精彩报告进行介绍。

王亮:步态识别的进展,机遇和挑战

中科院自动化所的王亮研究员首先开讲,为大家带来步态识别的报告。

首先王亮研究员介绍了步态识别的概念。步态是一种生物行为特征,步态识别的原始数据是人类行走视频,步态识别就是通过视频中的步态特征识别行人。

接着王亮研究员介绍了步态识别的历史与传统步态识别方法。步态识别的概念起源非常早,亚里士多德就曾分析过动物的步态。之后经历了19世纪的图片、影像运动研究,到20世纪则有了运动模式的概念。1997有了第一篇生物步态论文。当下则使用深度学习进行步态识别。至于传统模式识别方法,王亮研究员将其概括为基于模型的步态识别和基于姿态的步态识别。

王亮研究员进一步介绍了当前基于深度学习的步态识别。王亮研究员接着介绍了他们团队目前采用基于CNNs的多视角人类步态识别技术,这项技术的识别效果良好。这项技术目前面临训练数据过少的问题。

最后王亮研究员介绍了如何建立一个简单实用的的步态识别系统。该系统使用端到端的深度神经网络来进行步态分割以及步态识别。介绍完技术,王亮研究员还展示了系统demo,他表示以后会着手解决多人重叠等步态识别急需解决的问题。

郑伟诗:行人重识别及其若干难点问题

中山大学郑伟诗教授接着做了行人重识别的报告。

首先郑伟诗教授介绍了行人重识别的概念,即在不同的场景或摄像头下如何定位识别同一个人,去追踪这个人的运动。随后,他围绕行人重识别这五年的发展和目前学术上的研究两个方面进行介绍。

在五年发展历史这一部分,郑伟诗教授从 2013 的基于 Handcrafted Feature 的 Re-ID 一直介绍到现在他目前正在做的 Metric Learning。今年郑伟诗老师团队还将超分辨率和 Re-ID 结合在一起。

至于当前的学术研究,郑伟诗教授提到他们把行人重识别中传统的 Metric Learning 变为非对称的。这是一个很好的的处理方法。在面临一致性的问题,郑伟诗老师采用 LDA 的方法来处理该问题,并取得很不错的结果。

郑伟诗教授最后总结道,不应该把行人重识别看作一个简单识别问题,实际应用中的问题非常复杂。在数量众多的摄像头跟踪过程中有一个摄像头出错很可能就会丢失目标,这是一个很值得研究解决的课题。

徐明星:语音处理技术在无监督身份认证中的应用

清华大学的徐明星教授从产、学、研等方面介绍了语音处理技术特别是声纹识别的应用。

徐明星教授首先介绍了基本概念。声纹属于行为特征(区别于人脸等生理特征)。相较于生理特征,语音具有双向传递信息、周边无死角、高可变性与唯一性完美统一等特点。这些特点不仅让语音适合用作识别,也因此仅凭软件算法就可以防止攻击。

介绍完基本概念,徐明星教授将目前的声纹应用概括为以下几个部分:

  • 一:移动支付。
  • 二:社保生存认证。
  • 三:社区矫正系统。
  • 四:公共安全。
  • 五:电子政务。
  • 六:移动领域。
  • 七:车联网、门禁、考勤。

徐明星教授进一步补充应用中的挑战即对鲁棒性的要求。其中包括环境相关的声纹鲁棒性,说话人相关的声纹鲁棒性,应用相关的声纹鲁棒性。

徐明星教授最后介绍了当前的声纹识别发展比较好的方向,包括语音支付、网络安全、生物认证等。

山世光:人脸识别的近期进展与应用

中科院计算所研究员山世光作为最后一位讲者,做了本期讲习班最后一场关于人脸识别技术概况的报告。

山世光研究员首先介绍了深度学习对人脸识别的影响。主要包括这几个方面:

  • 一:基于CNN的人脸检测,之后拓展为多任务 CNN 和 PCN。
  • 二:完全端到端的级联CNN用于人脸特征定位。
  • 三:基于卷积神经网络的特征提取,再在卷积神经网络之前加上ReST进行人脸识别。

接着山世光研究员介绍了比较高阶的新工作。包括新的损失函数如 L-Softmax 、A-Softmax 、CosFace 、ArcFace 、Range Loss 、L2-constrained Softmax Loss 、Ring loss 。姿态稳健的人脸识别如 DREAM(Deep Residual Equivariant Mapping CVPR2018 )。以及基于视频的人脸识别如 DCRL(Discriminative Covariance Oriented Representation Learning )、DAN(Discriminative Aggregation Network )等。

山世光研究员紧接着介绍了当前中国比较好的应用方向,例如智慧社区和智慧楼宇的人脸验证,省级甚至全国级的身份查重等。他表示深度学习给人脸识别带来的变化是翻天覆地的,从检测到特征定位到识别都发生了质的变化,这个变化的主要指的是错误出现的数量级下降。但目前,仍然需要解决大数据下的精度问题,以及假脸等攻击问题。

以上是 AI 科技评论全部报道,CSIG 图像图形学科前沿讲习班第四期至此落下帷幕。两天时间,八位专家为大家带了十分精彩又干货十足的报告,对人脸识别、声纹识别、指纹识别等生物特征识别领域的技术发展历史、技术原理、发展现状、未来前景等进行了深入介绍。

本文分享自微信公众号 - AI科技评论(aitechtalk)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-04-26

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏Hadoop实操

如何在CDSW中使用GPU运行深度学习

25720
来自专栏老秦求学

深度学习算法优化背景知识---指数加权平均

15930
来自专栏量子位

自动驾驶“老司机”拼车技,MIT的这个比赛已经飙到了时速123公里

12930
来自专栏SIGAI学习与实践平台

生成式对抗网络模型综述

原创声明:本文为 SIGAI 原创文章,仅供个人学习使用,未经允许,不得转载,不能用于商业目的。

25350
来自专栏云时之间

深度学习与应用:百度AI平台使用浅谈

最近因为对文本情感分析有一些需要,所以去学习使用了一下百度的NLP处理模块,特此记录一下,来和大家一起分享。

21140
来自专栏Coding迪斯尼

使用卷积网络实现计算机图像识别:卷积和max pooling操作介绍

24640
来自专栏深度学习那些事儿

理解深度学习:与神经网络相似的网络-自编码器(上)

本篇文章可作为<利用变分自编码器实现深度换脸(DeepFake)>(稍后放出)的知识铺垫。

24980
来自专栏SIGAI学习与实践平台

生成式对抗网络模型综述

原创声明:本文为 SIGAI 原创文章,仅供个人学习使用,未经允许,不得转载,不能用于商业目的。

38740
来自专栏吴生的专栏

人人都会深度学习之Tensorflow基础快速入门

《Tensorflow基础快速入门》课程的目的是帮助广大的深度学习爱好者,逐层深入,步步精通当下最流行的深度学习框架Tensorflow。该课程包含Tensor...

15630
来自专栏云时之间

深度学习与TensorFlow:关于DBN的一些认识

最近在学习深度置信网络(DBN)的时候,看过几篇博客,但是在DBN的结构上,一大堆博客讲DBN是将受限玻尔兹曼机(RBM)像砖块一样叠加起来的一个网络,这本身是...

18440

扫码关注云+社区

领取腾讯云代金券

年度创作总结 领取年终奖励