人脸检测与识别技术（怎么去创新？）

计算机视觉研究院

发布于 2018-04-17 16:26:23

2.3K0

发布于 2018-04-17 16:26:23

文章被收录于专栏：计算机视觉战队

首先给大家展示下简单的人脸检测与识别！（生活场景剧——生活大爆炸！）

视频内容

自从“阿法狗”再次击败人类，再一次掀起了深度学习（人工智能）的热潮。而且在该领域已经有很多技术已应用到现实生活中！例如无人驾驶：

最近谷歌已经开始了无人驾驶服务的测试：

这种技术是现在最为惊艳的科技，因为之前只能在科幻电影中出现，但是现在简单的雏形已经出来了，可知，现在的人工智能发展是多么的迅速。

下面这个算是最近最火热的技术：

接下来简单介绍下一些其他领域的技术（含有文章和Github代码）：

用卷积神经网络将一幅图像的内容与另一幅图像的风格进行组合。

具体的文章为：A Neural Algorithm of Artistic Style

Github：https://github.com/jcjohnson/neural-style

图像语义理解

具体文章为：Show and Tell: Lessons learned from the 2015 MSCOCO Image Captioning Challenge

Github：https://github.com/tensorflow/models/tree/master/im2txt

图像超分辨率展示：

具体文章为：super-resolution through deep learning

Github：https://github.com/david-gpu/srez

还有很多技术就不一一介绍了，其中主要的功劳归功于deep learning！让我想到很早以前的一篇报道：

LeCun表示深度学习的运用不仅仅局限于互联网服务，还可以延伸至现实世界中能够操作的设备上，例如机器人和自动驾驶汽车。不久，加州大学伯克利分校的研究人员透露，使用深度学习技术的机器人系统能够自己学会如何拧开瓶盖。2015年年初，大牌芯片制造商Nvidia和以色列一家名为Mobileye的公司透露，他们也正在开发深度学习系统，可以用来驱动自动驾驶汽车。

但是之前的物联网的发展其实已经隐隐约约在推动人工智能的发展。现在很多场景都应用了该领域的技术。如自己比较喜欢的商汤，他们的技术在很多领域都做得非常优秀。

因为最近人脸检测与识别火热的进行着，本平台想进一步详细介绍关于人脸领域的相关知识与分析，让更多人的有进一步深入的熟知！其中我刚开始接触的时候，也是通过商汤合作的项目学习深入的人脸检测识别技术。

在2016年的CVPR上，商汤发表了一篇关于人脸的文章。具体框架和想法都特别引人。具体效果如下：

人脸检测与识别的趋势和分析（增强版）这篇推送已经清楚说明了传统的一些应用和出现的问题，现在我们要把这领域做得非常优秀，并且超越人类的极限，只能通过一一排除所有的困难，才可以实现超人类的检测与识别技术。

视频内容

现在用传统的技术已经不能再有新的突破，所以现在流行了DL架构，打破了人类的极限，又将检测，识别，跟踪等技术上升到另一个高度。

今天就以多尺度这个难题来详细说说！我们都知道，现实生活无论是照片还是视频，其中的人脸都是在变的，通过镜头的远近，人脸的尺度大小一直在变化，这种尺度变化问题就会导致人脸检测识别精度的降低，那现在我们就要针对该问题去解决它。

怎么去解决呢？？？

注：如下的方法可能已被大家知晓，但是希望通过这种思考问题的方式，给大家带来小小的灵感，也希望得到更多人的指点，学习更过思考问题的方式，去解决更多的实际问题，谢谢支持！

首先，会想到，要不要建立一个可变模型，去根据人脸的结构去建模，不同尺度大小的变化，必然会带来同等比例的缩放，犹如：

该模型就是想通过5个基本关键点去建模（也可以考虑64,128甚至更多额关键点，但是关键点越多，复杂度就越大），构造关键点之间的关系。虽然尺度改变了，但是隐含的一些关系没发生变化。犹如，我们看自己远照和近照的时候，都是很快识别，那是因为我们抓住了关键的特征。这个模型可以根据眼睛与鼻尖的角度，或者是其他器官之间的关系（需要实验者自己去挖掘关键点之间的深入关系），既可以非常详细的解释每个人的特征分布，最后把特征关系进行量化处理，得到每个人的人脸特征表示，最后进行训练学习。

但是，这个过程特别繁琐，不仅会消耗很多人工标记时间，还会增加了训练的复杂度。

于是乎，有了如下的想法：

该模型就是把训练的数据线进行CNN训练，得到一个训练好的CNN模型，然后对训练数据进行多尺度变化，把多种尺度的数据送到训练好的CNN模型进行进一步学习和微调，得到一个能够识别多尺度数据的CNN新模型。

该方法缺点就是在大量数据的情况下，要花费很多时间去预处理训练数据，并且对数据进行各种尺度比例的缩放，这个标准得通过实验获得，因为比例缩放的过程可能出现人为因素的干扰，增加了原始数据的干扰，所以这方面也是该想法的小缺陷。

那该怎么办？？？

这就需要读者您自己慢慢去体会，怎么去处理这方面的问题，也希望通过本次简单的介绍和分析，可以给有帮助的您带来一些解决！O(∩_∩)O

如果有好的想法和思路，可以通过平台或者学习群分享，让大家一起进行讨论，提出更多的解决办法。

在此，再一次感谢您耐心的阅读，也感谢您对本平台的关注与支持，谢谢！

最后再给出一个视频中人脸检测与识别的Demo！

注：视屏因为压缩，会有些不清楚地方请谅解，还有个别几处出现漏检和错检，后期我们会进一步修改，争取做出完美的检测效果，已达到实际的应用价值。

视频内容

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2017-06-05，如有侵权请联系 cloudcommunity@tencent.com 删除

人脸识别

人工智能

本文分享自计算机视觉战队微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

人脸识别

人工智能

登录后参与评论

0 条评论

热度

人脸检测与识别技术（怎么去创新？）

人脸检测与识别技术（怎么去创新？）

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐