Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >多目标检测:基于Yolo优化的多目标检测(附论文下载)

多目标检测:基于Yolo优化的多目标检测(附论文下载)

作者头像
计算机视觉研究院
发布于 2023-08-24 00:14:21
发布于 2023-08-24 00:14:21
9340
举报

计算机视觉研究院专栏

作者:Edison_G

为了解决目标检测任务中小目标检测精度低、误检、漏检率高等问题,有研究者提出了一种新的目标检测方法。

一、前言

为了解决目标检测任务中小目标检测精度低、误检、漏检率高等问题,有研究者提出了一种基于YOLOv4卷积神经网络的多目标检测方法。 多目标检测作为目标检测领域的一个重要研究方向,一直受到研究人员的广泛关注。目前,在智能交通、智能辅助驾驶和视频监控等领域已经产生了深入的研究。

传统的行人检测方法,如HOG(定向梯度直方图)、DPM(可变形部件模型)、ACF(聚合通道特征),都采用人工设计或特征聚合来获取行人特征。随着2012年AlexNet在图像分类任务上的重大突破,利用卷积神经网络自动学习特征提取过程代替传统的人工设计是当前的主要研究方向。基于卷积神经网络的目标检测方法主要分为两类,一类是两阶段方法,一类是单阶段方法。

第一种方法的主要思想是在生成候选目标区域的基础上,利用级联方法进一步判断边界框的类别和位置。另一种是单阶段方法,以YOLO和SSD为例。思路是使用卷积神经网络直接返回位置和类别。卷积神经网络的引入提高了行人检测算法的性能,但遮挡问题仍然是行人检测的一大难点。有文献【Deep learning strong parts for pedestrian detection】使用联合学习方法对不同的行人遮挡模式进行建模,但其检测框架复杂且无法穷尽所有情况。【Repulsion Loss: Detecting Pedestrians in a Crowd】设计了一种新的损失函数,使预测帧与目标真实帧保持接近,同时远离其他真实帧。这种方法处理遮挡更灵活,更容易实现。【Occlusion-aware R-CNN: Detecting Pedestrians in a Crowd】结合了上述两种思想,提出了一个组件遮挡感知单元和一个聚合损失函数来处理行人遮挡问题。【Bi-box Regression for Pedestrian Detection and Occlusion Estimation】通过引入新的监督信息(行人可见区域的边界框)来处理遮挡,思路是用两个分支网络分别返回行人的全身框架和可见区域的边界框,最后合并两个分支的结果,提高检测性能。

目前目标检测任务主要针对不同的应用场景选择合适的检测算法:单阶段算法检测速度最快,但准确率较低;两阶段和多阶段检测算法可以获得更高的检测精度,但以牺牲检测速度为代价。

二、概要

今天分享的框架,新的方法基于YOLOv4。 高层特征的语义信息首先通过FPN采样传播到低层网络,然后与底层特征的高分辨率信息融合,以提高小目标检测对象的检测效果。 通过对特征金字塔进行下采样来增强从底部到顶部的信息传递路径,最后融合不同层的特征图以实现相关预测。 实验证明,新提出的方法具有良好的效果。

三、新框架

新的模型架构如上图所示。它由三部分组成:用于特征提取的前端网络、特征融合模块和用于分类和回归操作的检测模块。在输入处将输入图像的尺寸resize为416×416,输入到网络中进行训练和检测。 基本卷积块是一个卷积层,它结合了批量归一化 (BN) 并使用Mish和leakyRelu激活函数。

模型前端使用CSPDarknet模块组成的主干网络,由卷积层和残差模块叠加,有效防止在网络层数加深的基础上梯度消失或爆炸,获得更丰富的语义信息特征图,并且在主干网络中,特征图维度的减少是通过卷积层的5倍下采样实现的,其步长为2,内核大小为3;对网络neck处进行2次上采样,浅层采用PAN+SPP模型结构实现浅层特征与高层语义特征的融合以及多尺度感受野的融合,充分利用了浅层网络,改善小目标特征丢失的问题;检测头采用回归+分类的思想,将输入图像分别划分为76×76、38×38、19×19三种不同尺寸的网格图像,分别实现小目标、中目标和大目标的检测目标。

SPP模块:

该模型在主干网络后面添加了SPP模块,如下图所示。输入特征图经过一个卷积层后,经过5×5、9×9、13×13三个核进行最大池化, 然后concat得到的特征图进行通道拼接,输出通道数变成原来通道数的4倍,特征图大小保持不变。

输出特征图大小为:

其中n是输入特征图的大小,p是padding,s是步长,这意味着向下取整。SPP模块通过使用不同大小核的Maxpool层获取特征图局部区域的感受野信息和接近全局的感受野,并进行特征融合。这种融合不同尺度感受野的操作可以有效丰富特征图的表达能力,增强骨干网络输出特征的接受范围,分离重要的上下文信息。

四、实验及可视化

转载请联系本公众号获得授权

往期推荐

🔗

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-05-10,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 计算机视觉战队 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
多目标检测:基于YoloV4优化的多目标检测
为了解决目标检测任务中小目标检测精度低、误检、漏检率高等问题,有研究者提出了一种基于YOLOv4卷积神经网络的多目标检测方法。 多目标检测作为目标检测领域的一个重要研究方向,一直受到研究人员的广泛关注。目前,在智能交通、智能辅助驾驶和视频监控等领域已经产生了深入的研究。
计算机视觉研究院
2022/01/26
1.1K0
多目标检测:基于YoloV4优化的多目标检测
SSFENet | 增强空间和语义特征用于目标检测(附论文下载)
计算机视觉研究院专栏 作者:Edison_G 目前最先进的目标检测器通常使用预先训练好的分类网络来提取特征,然后利用特征金字塔来检测不同尺度的目标。 公众号ID|ComputerVisionGzq 学习群|扫码在主页获取加入方式 源码获取|扫码回复“GWD”获取源码 1 简要 目前最先进的目标检测器通常使用预先训练好的分类网络来提取特征,然后利用特征金字塔来检测不同尺度的目标。然而,分类网络更喜欢平移不变性,而忽略了位置信息,因此直接使用提取的特征进行融合会影响性能。 在今天分享中,研究者提出了一个
计算机视觉研究院
2022/03/04
7050
干货 | 深度学习时代的目标检测算法
AI 科技评论按:本文作者 Ronald,首发于作者的知乎专栏「炼丹师备忘录」,AI 科技评论获其授权转发。 目前目标检测领域的深度学习方法主要分为两类:two stage 的目标检测算法;one s
AI科技评论
2018/03/07
1.7K0
干货 | 深度学习时代的目标检测算法
目标检测系列之五(YOLO V4)
论文题目《YOLOv4: Optimal Speed and Accuracy of Object Detection》 论文地址:https://arxiv.org/abs/2004.10934 论文代码:https://github.com/AlexeyAB/darknet
Minerva
2020/05/25
1.6K0
基于深度学习的目标检测算法综述
目标检测的任务是找出图像中所有感兴趣的目标(物体),确定它们的位置和大小,是机器视觉领域的核心问题之一。由于各类物体有不同的外观,形状,姿态,加上成像时光照,遮挡等因素的干扰,目标检测一直是机器视觉领域最具有挑战性的问题。本文将针对目标检测(Object Detection)这个机器视觉中的经典任务进行解析,抛砖引玉。如对文中的内容持不同观点,欢迎到SIGAI公众号发消息给我们,一起探讨!
SIGAI学习与实践平台
2018/08/07
1.4K0
基于深度学习的目标检测算法综述
一文总结目标检测
如有排版问题,可知乎查看:zhihu.com/column/c_1255545721723191296
枫桦
2022/08/02
8331
一文总结目标检测
目标检测究竟发展到了什么程度? | CVHub带你聊一聊目标检测发展的这22年
目标检测领域发展至今已有二十余载,从早期的传统方法到如今的深度学习方法,精度越来越高的同时速度也越来越快,这得益于深度学习等相关技术的不断发展。本文将对目标检测领域的发展做一个系统性的介绍,旨在为读者构建一个完整的知识体系架构,同时了解目标检测相关的技术栈及其未来的发展趋势。由于编者水平有限,本文若有不当之处还请指出与纠正,欢迎大家评论交流!
AIWalker
2021/07/05
3.3K0
目标检测究竟发展到了什么程度? | CVHub带你聊一聊目标检测发展的这22年
现代目标检测故事 | 40+种网络架构大盘点!从基础架构ResNet到最强检测器Yolov7再到最新部署神器GhostNetV2
目标检测是指在图像或视频中分类和定位物体的任务。由于其广泛的应用,最近几年目标检测受到了越来越多的关注。本文概述了基于深度学习的目标检测器的最新发展。同时,还提供了目标检测任务的基准数据集和评估指标的简要概述,以及在识别任务中使用的一些高性能基础架构,其还涵盖了当前在边缘设备上使用的轻量级模型。在文章的最后,我们通过以图表的形式直观地在多个经典指标上比较了这些架构的性能。
AiCharm
2023/05/15
1.4K0
现代目标检测故事 | 40+种网络架构大盘点!从基础架构ResNet到最强检测器Yolov7再到最新部署神器GhostNetV2
应对遮挡挑战,北航提出新型 YOLOv5 模型表现优异 !
行人检测是计算机视觉在日常生活中的典型应用 [1]。事实上,单阶段深度卷积神经网络(YOLO)在目标检测 方面表现出色,明显优于之前的半手工方法和两阶段神经网络 [2]。例如,YOLO允许卷积神经网络(CNNs) [6] 在任意长宽比下输出一个边界框,而滑窗方法的开销为零。尽管双阶段检测器(R-CNN)能够实现最先进的精确度,但它需要更多参数进行计算,且占用更多操作空间,严重削弱了算法的实时性能。
未来先知
2024/08/29
2950
应对遮挡挑战,北航提出新型 YOLOv5 模型表现优异 !
目标检测近年综述(文末有下载论文包)
发展论述:对于Overfeat、R-CNN方法,只是利用卷积神经网络进行特征提取,并没有改变搜索框提取目标区域的策略,算法的在速度上仍存在瓶颈。
计算机视觉研究院
2020/03/04
1K0
结合语义和多层特征融合的行人检测
行人检测是目标检测领域研究最广泛的任务之一,也一直是计算机视觉任务中的热点和难点。行人检测任务是给出图像或视频中所有行人的位置和大小,一般用矩形框标注。行人检测技术可以与目标跟踪、行人重识别等技术结合,应用于汽车无人驾驶系统、智能视频监控、人体行为分析等领域。在实际场景中, 由于行人与物体、行人间互相遮挡以及交通标志、橱窗中的模特等相似信息的干扰,行人检测任务仍然存在很大的挑战。
一点人工一点智能
2022/12/27
7690
结合语义和多层特征融合的行人检测
视觉显著性目标检测综述(2)
一个显著性目标检测模型能取得较好的效果至少应该满足以下3个标准:一是好的检测能力,尽量少地遗漏真正的显著区域或错误地将背景标记为显著区域;二是高分辨率,显著图应具有较高的分辨率或全分辨率,以准确定位显著目标并保留原始图像信息;三是高计算效率,作为其他任务的前置阶段,能够快速检测到显著区域。基于不同数据源的显著性目标检测方法研究思路也主要围绕以上3个方面展开,对检测模型的性能进行不断优化和提升,如图6所示。
AiCharm
2023/05/15
6140
视觉显著性目标检测综述(2)
涨分利器!攻克目标检测难点秘籍之多尺度检测
在前面的秘籍一:模型加速之轻量化网络和秘籍二:非极大抑制算法和回归损失优化之路中,我们主要关注了轻量化网络,非极大值抑制算法、回归损失优化。但是要想获得较好的检测性能,检测算法的多尺度检测也极为重要。
BBuf
2020/02/21
1.3K0
涨分利器!攻克目标检测难点秘籍之多尺度检测
改进的检测算法:用于高分辨率光学遥感图像目标检测
目标检测对光学遥感图像的解释至关重要,可以作为研究利用遥感的其他视觉任务的基础。然而,目前在光学遥感图像中使用的目标检测网络没有充分利用特征金字塔的输出,因此仍有改进检测的潜力。
计算机视觉研究院
2023/08/23
7510
改进的检测算法:用于高分辨率光学遥感图像目标检测
YOLO-S:小目标检测的轻量级、精确的类YOLO网络
研究者提出了YOLO-S,一个简单、快速、高效的网络。它利用了一个小的特征提取器,以及通过旁路和级联的跳过连接,以及一个重塑直通层来促进跨网络的特征重用,并将低级位置信息与更有意义的高级信息相结合。
计算机视觉研究院
2023/08/23
1.6K0
YOLO-S:小目标检测的轻量级、精确的类YOLO网络
【目标检测系列】CNN中的目标多尺度处理方法
【导读】本篇博文我们一起来讨论总结一下目标检测任务中用来处理目标多尺度的一些算法。视觉任务中处理目标多尺度主要分为两大类:
深度学习技术前沿公众号博主
2020/06/10
1.8K0
【目标检测系列】CNN中的目标多尺度处理方法
干货 | 基于深度学习的目标检测算法综述(二)
目标检测(Object Detection)是计算机视觉领域的基本任务之一,学术界已有将近二十年的研究历史。近些年随着深度学习技术的火热发展,目标检测算法也从基于手工特征的传统算法转向了基于深度神经网络的检测技术。从最初 2013 年提出的 R-CNN、OverFeat,到后面的 Fast/Faster R-CNN、SSD、YOLO 系列,再到 2018 年最近的 Pelee。短短不到五年时间,基于深度学习的目标检测技术,在网络结构上,从 two stage 到 one stage,从 bottom-up only 到 Top-Down,从 single scale network 到 feature pyramid network,从面向 PC 端到面向手机端,都涌现出许多好的算法技术,这些算法在开放目标检测数据集上的检测效果和性能都很出色。
磐创AI
2018/09/20
1.5K0
干货 | 基于深度学习的目标检测算法综述(二)
YoloV8改进策略:Block改进|RFE模块|即插即用
本文介绍了一种基于YOLOv5的人脸检测方法,命名为YOLO-FaceV2。该方法旨在解决人脸检测中的尺度变化、简单与困难样本不平衡以及人脸遮挡等问题。通过引入一系列创新模块和损失函数,YOLO-FaceV2在WiderFace数据集上取得了优异的表现,特别是在小物体、遮挡和困难样本的检测上。
AI浩
2024/10/31
3610
YoloV8改进策略:Block改进|RFE模块|即插即用
目标检测 | 丰富特征导向Refinement Network用于目标检测(附github源码)
研究者提出了一个单阶段检测框架,该框架解决了多尺度目标检测和类不平衡的问题。没有设计更深层的网络,而是引入了一种简单而有效的特征丰富化方案来生成多尺度的上下文特征。进一步引入了一种级联的优化(精炼)方案,该方案首先将多尺度的上下文特征注入到一阶段检测器的预测层中,以增强其进行多尺度检测的判别能力。其次,级联精炼方案通过细化anchors和丰富的特征以改善分类和回归来解决类不平衡问题。对于MS COCO测试上的320×320输入,新的检测器在单尺度推理的情况下以33.2的COCO AP达到了最先进的一阶段检测精度,操作是在一个Titan XP GPU上以21毫秒运行的 。对于MS COCO测试上的512×512输入,与最佳的单阶段结果相比,就COCO AP而言,新方法获得了一个明显的增加(增加了1.6%)。
计算机视觉研究院
2021/05/31
5640
目标检测 | 丰富特征导向Refinement Network用于目标检测(附github源码)
Gold-YOLO:基于聚合与分配机制的高效目标检测器
在过去几年中,YOLO 系列模型已成为实时目标检测领域的主流方法。许多研究通过修改架构、扩充数据以及设计新的损失函数,将基线水平提升到了更高层次。然而,我们发现尽管特征金字塔网络(FPN)和路径聚合网络(PANet)缓解了这一问题,但以往的模型仍存在信息融合方面的难题。
计算机视觉研究院
2025/02/12
2010
Gold-YOLO:基于聚合与分配机制的高效目标检测器
推荐阅读
相关推荐
多目标检测:基于YoloV4优化的多目标检测
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文