前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >目标检测_0

目标检测_0

作者头像
Dean0731
发布2020-05-08 15:48:06
1910
发布2020-05-08 15:48:06
举报
文章被收录于专栏:blog-技术博客blog-技术博客

目标检测

  1. rcnn:根据颜色等特征,将图像分为许多小区域(一般情况下颜色相同的都是一类物体)
    1. 合并区域,然后进行区域内的物体检测 即到卷积中进行预测(每个框一个卷积网络)
    2. 缺点:找到的框太多
  2. fast-rcnn:整张图片卷积得到特征图
    • 图片映射到特征图,
  3. faster-rcnn:RPN 层,根据标注中框的位置,让卷积网络自己学习框应该在哪 (在特征图上提取框)
    • 怎么学习?
      • 有基数128,256,512,3种方式
    • 对于一个像素点生成9个框,以他为中心
      • 128*256,256*128,128*128
      • 256*512,512*256,256*256
      • 512*512,512*1024,1024*512

数据

  1. 或获途径
    • Benchmark是一个行业的基准(数据库,论文,源码,结果)。 face benchmark或MPII Human Pose Dataset
    • 论文
    • 论坛或者交流社区 如thinkface
  2. 处理
    1. 正样本:裁剪,根据标注把目标裁剪出来,例如人脸,可使用opencv工具
    2. 负样本:随便选择的框,可与正样本重叠,但不能太多 这个比例 成为 inception open union (Iou) 一般为0.3,小于0.3为负样本 大于0.7为正样本(当做遮蔽的数据),中间的舍弃
  3. 根据不同框架数据集格式生成数据集

训练

  1. Input Image 227*227*3
  2. Conv1
    1. num_output=96 特征图数量
    2. kernel_size=11 卷积核大小
    3. stride=4 滑动步长
    4. input:55*55*96
  3. relu
  4. Pool
    1. kernel_size=3,
    2. stride=2
    3. input:27*27*96
  5. 经过多层卷积,,激活,池化,(偶尔还有规范化)
  6. 全连接层 4096*1
    1. 激活
    2. drop
  7. 全连接分类n*1
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2019-11-30 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 目标检测
    • 数据
      • 训练
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档