前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >目标检测

目标检测

作者头像
linxinzhe
发布2018-04-10 15:07:00
9020
发布2018-04-10 15:07:00
举报
文章被收录于专栏:林欣哲

今天的这篇是对吴恩达的深度学习微专业的第四节课卷积神经网络的第三周的目标检测的总结。

普通的卷积神经网络我们用来识别一张图片是什么东西。但是有些时候我们需要知道这个物体在哪,也就是能识别出这个物体并且知道它的坐标(x,y)和长宽。

要能识别物体在哪,神经网络用带有坐标和长宽的标签的大量的这类物体做数据,用神经网络预测的点的位置和长宽的均方误差来训练得到的。

也可以同样的道理去训练一个识别人脸的特征(比如眼角和嘴角的位置)的神经网络。

明白了原理,我们就能做一个图像里的目标检测了,原理其实是用训练好的识别物体的神经网络,以一个小框去框出来的图片作为输入,一个框一个框的去扫描整个图像,知道找到这个框里有这个物体,以及它的坐标。

但是,用框去一个个扫并计算,相对于一个大图像被切割成很多相互间有非常多重复像素的图片,非常耗费计算性能。

因此,我们对整张大图谱直接输入神经网络去计算出它的卷积的最终结果,这个卷积结果的中的每个像素的值,从数学意义上看可以认为是,分别框出来的小图像输入神经网络后最终得到的预测值,这样大大提高了计算的效率。依然有个缺点就是,识别这个目标的边框可能不够精确。

YOLO算法可以解决这个边框的问题。我们以路上的目标检测为例,它把一个大图像划分成比如3x3的区域,整个图形输入神经网络,做卷积,每个区域都会对应一个8维向量(是否有物体,x轴位置,y轴位置,长,宽,是否是行人,是否是车,是否是摩托),最终是一个完整的3x3x8维向量,而看某个区域的8维向量结果可以知道,其中有某个物体,且它的边框是多少。

衡量一个目标检测是否符合标准,就看神经网络识别后的框和数据标注的框的交并比,也就是两者框的交集除以两者框的并集。

这里可能会碰到多次检测的问题,就是在目标附近的几个格子都会认为它检测到了目标,这时候应用非极大值抑制的算法,选出概率最大的格子,并把其他交并比很高的格子抑制(这一步交并比的判断,是因为有可能一个图像里有多个目标被检测出来,利用交并比可以只抑制一个目标附近多余的检测,而不能把其他目标的检测都被你抑制了)。不同类别的目标检测,如车和人,抑制分别跑,一共跑两次。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2017-11-24,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 林欣哲 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
图像识别
腾讯云图像识别基于深度学习等人工智能技术,提供车辆,物体及场景等检测和识别服务, 已上线产品子功能包含车辆识别,商品识别,宠物识别,文件封识别等,更多功能接口敬请期待。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档