专栏首页我爱计算机视觉Scale Match:国科大提出小目标检测的尺度匹配方法,用于预训练数据集处理

Scale Match:国科大提出小目标检测的尺度匹配方法,用于预训练数据集处理

圣诞快乐~

今天分享一篇新出的论文 Scale Match for Tiny Person Detection,作者贡献了一个细小人物目标检测的数据集 TinyPerson,同时提出一种对预训练数据进行尺度调整的Scale Match(尺度匹配)的方法,显著改进了小目标检测。

该文作者信息:

作者均来自中国科学院大学。

众所周知,小目标检测一直是比较棘手的技术问题,现有目标检测算法往往难以给出理想的结果,但在某些场合,小目标检测却非常有意义。

比如,长距离的视频监控,画面中的人物可能都比较小。

作者构建的 TinyPerson 细小人物目标数据库与其他知名的目标检测数据库的视觉比较:

TinyPerson 样本局部放大图

可见,如果大家不点击查看大图的话,基本上就只能看到 TinyPerson上有一些黑点而已。

下面图表和表格是对几大数据集的尺度的统计:

TinyPerson 中人物平均绝对大小才 18 个像素。能较好的反应长距离视频监控场景中的人物。

TInyPerson数据集统计数据

当目标仅有十几个像素大小的时候,算法如何有效捕捉目标呢?事实上,作者没有发明新的检测算法,而是给算法增加训练样本,并对这些训练样本进行尺度调整,使其在尺度上和目标数据集(TinyPerson)统计属性上相似。

嗯,思路就是这么直接!?

作者将这个尺度调整的过程称之为尺度匹配(Scale Match),请看下图:

Psize(s;E)代表用于增加样本的外部数据集中目标尺度的统计直方图;

Psize(s;Dtrain)则代表目标检测任务数据集中目标尺度的统计直方图;

尺度匹配(Scale Match)的过程就是让这两个直方图分布相似。然后把尺度调整后的外部数据集加入训练集,训练算法模型。

熟悉数字图像处理的朋友,肯定学过直方图匹配(将一幅图像的直方图调整为与另一幅图像直方图相似),尺度匹配与其类似,不同的是,这里直方图每个分箱代表的是不同的尺度的目标的统计。

尺度匹配的算法流程如下:

图像直方图匹配中要保持像素值映射的单调性,目标检测中尺度匹配不需要严格单调(毕竟尺度调整之后该是什么目标还是什么目标),但作者也尝试了保持尺度调整单调性的Monotone Scale Match (MSM),这在某种程度上保留了预训练数据集中目标出现的自然尺度的相对大小一致性。

实验结果

作者实验了一阶段、二阶段、anchor-free 几种有代表性的目标检测算法,以下是在使用MS COCO做预训练然后在TinyPerson上的结果比较:

文中使用 Faster RCNN-FPN 作为比较的基线算法,下表为添加Scale Match、Monotone Scale Match之后在TinyPerson、Tiny Citypersons数据集上的实验结果:

可见,对于训练数据集进行尺度匹配带来了显著的精度提升,AP上升约3-4个点。

论文地址: https://arxiv.org/abs/1912.10664v1

数据代码地址:

https://github.com/ucas-vg/TinyBenchmark

(目前还未开源)

本文分享自微信公众号 - 我爱计算机视觉(aicvml),作者:CV君

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-12-25

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • CV 加持的工业检测,从算法选型到模型部署

    随着AI技术的逐渐成熟,越来越多的传统企业希望借助AI技术,实现智能质检。传统质检更多依靠有经验的人工劳动力来实现质量检查甚至分拣,但这样的方式,许多场景会有检...

    CV君
  • YOLOv3剪枝再升级!

    该项目也说明在使用YOLOv3进行单类目标检测时,模型存在大量冗余,剪枝可以较好的减少参数、提高速度。

    CV君
  • 发布!天池布匹疵点检测大赛解决方案与Baseline(acc:85%左右,mAP:52%左右)

    阿里天池布匹疵点智能检测大赛正如火如荼进行,本次大赛目前共计有2415支队伍参赛,成为今年天池上最受关注最热门的算法大赛!

    CV君
  • 危险:会话固定攻击漏洞,你们的系统都堵上了吗?

    什么是会话固定攻击? 会话固定攻击(session fixation attack)是利用应用系统在服务器的会话ID固定不变机制,借助他人用相同的会话ID获取...

    Java技术栈
  • 鸡汤不给勺,就是耍流氓,成功背后的概率 (二)

    今天是过年的前的最后几天,估计也没有什么人看我的文章了,也不想写什么技术类的东西,估计也没有人看的下去,过年估计大家收到的最大的祝福就是,大发财源,赚钱多多,出...

    AustinDatabases
  • Kubernetes-持久化存储卷PersistentVolume

    PersistentVolume(PV)用于为用户和管理员提供如何提供和消费存储的API,PV由管理员在集群中提供的存储。它就像Node一样是集群中的一种资源。...

    菲宇
  • 早发arXiv可多获得65%的引用,但……

    对研究人员来说,这么做主要有两个好处。一方面尽早占坑,另一方面可以绕过漫长的同行评议时间,加速圈内人交流工作进展。

    量子位
  • 问题来了,谁能证明阿蒂亚关于黎曼猜想的证明是对的?

    万众期待下,89岁的阿蒂亚爵士只花了不到十分钟的时间,用一张PPT就完成了他的证明,这场过于简洁的解说让演讲现场的提问环节陷入了迷之尴尬,尔后整个数学界都沉默了...

    镁客网
  • 安防视频流媒体可视化服务EasyNVR存储模式之NVR、IP-SAN和CVR三种存储模式对比

    近几年,安防视频监控的势头不断上涨,对视频的技术要求也越来越高。组建一套安防视频监控,我们需要考虑四个部分,分别是前端系统,传输系统,存储系统以及显示系统,其中...

    EasyNVR
  • SSH和SSI架构的一点区别

    最近的正在进行的一个项目是基于SSI框架的,也就是传说中的Struts+Spring+Ibates。对于ibates和hibernate的对比网上有很多文章,...

    the5fire

扫码关注云+社区

领取腾讯云代金券