前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >人脸检测与识别技术(怎么去创新?)

人脸检测与识别技术(怎么去创新?)

作者头像
计算机视觉研究院
发布2018-04-17 16:26:23
2.3K0
发布2018-04-17 16:26:23
举报
首先给大家展示下简单的人脸检测与识别!(生活场景剧——生活大爆炸!)
视频内容

自从“阿法狗”再次击败人类,再一次掀起了深度学习(人工智能)的热潮。而且在该领域已经有很多技术已应用到现实生活中!例如无人驾驶:

最近谷歌已经开始了无人驾驶服务的测试:

这种技术是现在最为惊艳的科技,因为之前只能在科幻电影中出现,但是现在简单的雏形已经出来了,可知,现在的人工智能发展是多么的迅速。

下面这个算是最近最火热的技术:

接下来简单介绍下一些其他领域的技术(含有文章和Github代码):

  • 用卷积神经网络将一幅图像的内容与另一幅图像的风格进行组合。

具体的文章为:A Neural Algorithm of Artistic Style

Github:https://github.com/jcjohnson/neural-style

  • 图像语义理解

具体文章为:Show and Tell: Lessons learned from the 2015 MSCOCO Image Captioning Challenge

Github:https://github.com/tensorflow/models/tree/master/im2txt

  • 图像超分辨率展示:

具体文章为:super-resolution through deep learning

Github:https://github.com/david-gpu/srez

还有很多技术就不一一介绍了,其中主要的功劳归功于deep learning!让我想到很早以前的一篇报道:


LeCun表示深度学习的运用不仅仅局限于互联网服务,还可以延伸至现实世界中能够操作的设备上,例如机器人和自动驾驶汽车。不久,加州大学伯克利分校的研究人员透露,使用深度学习技术的机器人系统能够自己学会如何拧开瓶盖。2015年年初,大牌芯片制造商Nvidia和以色列一家名为Mobileye的公司透露,他们也正在开发深度学习系统,可以用来驱动自动驾驶汽车。


但是之前的物联网的发展其实已经隐隐约约在推动人工智能的发展。现在很多场景都应用了该领域的技术。如自己比较喜欢的商汤,他们的技术在很多领域都做得非常优秀。

因为最近人脸检测与识别火热的进行着,本平台想进一步详细介绍关于人脸领域的相关知识与分析,让更多人的有进一步深入的熟知!其中我刚开始接触的时候,也是通过商汤合作的项目学习深入的人脸检测识别技术。

在2016年的CVPR上,商汤发表了一篇关于人脸的文章。具体框架和想法都特别引人。具体效果如下:


人脸检测与识别的趋势和分析(增强版)这篇推送已经清楚说明了传统的一些应用和出现的问题,现在我们要把这领域做得非常优秀,并且超越人类的极限,只能通过一一排除所有的困难,才可以实现超人类的检测与识别技术。

视频内容

现在用传统的技术已经不能再有新的突破,所以现在流行了DL架构,打破了人类的极限,又将检测,识别,跟踪等技术上升到另一个高度。

今天就以多尺度这个难题来详细说说!我们都知道,现实生活无论是照片还是视频,其中的人脸都是在变的,通过镜头的远近,人脸的尺度大小一直在变化,这种尺度变化问题就会导致人脸检测识别精度的降低,那现在我们就要针对该问题去解决它。

怎么去解决呢???

注:如下的方法可能已被大家知晓,但是希望通过这种思考问题的方式,给大家带来小小的灵感,也希望得到更多人的指点,学习更过思考问题的方式,去解决更多的实际问题,谢谢支持!

首先,会想到,要不要建立一个可变模型,去根据人脸的结构去建模,不同尺度大小的变化,必然会带来同等比例的缩放,犹如:

该模型就是想通过5个基本关键点去建模(也可以考虑64,128甚至更多额关键点,但是关键点越多,复杂度就越大),构造关键点之间的关系。虽然尺度改变了,但是隐含的一些关系没发生变化。犹如,我们看自己远照和近照的时候,都是很快识别,那是因为我们抓住了关键的特征。这个模型可以根据眼睛与鼻尖的角度,或者是其他器官之间的关系(需要实验者自己去挖掘关键点之间的深入关系),既可以非常详细的解释每个人的特征分布,最后把特征关系进行量化处理,得到每个人的人脸特征表示,最后进行训练学习。

但是,这个过程特别繁琐,不仅会消耗很多人工标记时间,还会增加了训练的复杂度。

于是乎,有了如下的想法:

该模型就是把训练的数据线进行CNN训练,得到一个训练好的CNN模型,然后对训练数据进行多尺度变化,把多种尺度的数据送到训练好的CNN模型进行进一步学习和微调,得到一个能够识别多尺度数据的CNN新模型。

该方法缺点就是在大量数据的情况下,要花费很多时间去预处理训练数据,并且对数据进行各种尺度比例的缩放,这个标准得通过实验获得,因为比例缩放的过程可能出现人为因素的干扰,增加了原始数据的干扰,所以这方面也是该想法的小缺陷。

那该怎么办???

这就需要读者您自己慢慢去体会,怎么去处理这方面的问题,也希望通过本次简单的介绍和分析,可以给有帮助的您带来一些解决!O(∩_∩)O

如果有好的想法和思路,可以通过平台或者学习群分享,让大家一起进行讨论,提出更多的解决办法。

在此,再一次感谢您耐心的阅读,也感谢您对本平台的关注与支持,谢谢!


最后再给出一个视频中人脸检测与识别的Demo!

注:视屏因为压缩,会有些不清楚地方请谅解,还有个别几处出现漏检和错检,后期我们会进一步修改,争取做出完美的检测效果,已达到实际的应用价值。

视频内容
本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2017-06-05,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 计算机视觉战队 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
人脸识别
腾讯云神图·人脸识别(Face Recognition)基于腾讯优图强大的面部分析技术,提供包括人脸检测与分析、比对、搜索、验证、五官定位、活体检测等多种功能,为开发者和企业提供高性能高可用的人脸识别服务。 可应用于在线娱乐、在线身份认证等多种应用场景,充分满足各行业客户的人脸属性识别及用户身份确认等需求。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档