前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >改进YOLOv5的合成孔径雷达图像舰船目标检测方法

改进YOLOv5的合成孔径雷达图像舰船目标检测方法

作者头像
墨明棋妙27
发布2023-12-19 13:27:50
5230
发布2023-12-19 13:27:50
举报
文章被收录于专栏:1996

源自:系统工程与电子技术

作者:贺翥祯 李敏 苟瑶 杨爱涛

针对合成孔径雷达图像目标检测易受噪声和背景干扰影响, 以及多尺度条件下检测性能下降的问题, 在兼顾网络规模和检测精度的基础上, 提出了一种改进的合成孔径雷达舰船目标检测算法。使用坐标注意力机制, 在确保轻量化的同时抑制了噪声与干扰, 以提高网络的特征提取能力; 融入加权双向特征金字塔结构以实现多尺度特征融合, 设计了一种新的预测框损失函数以改善检测精度, 同时加快算法收敛, 从而实现了对合成孔径雷达图像舰船目标的快速准确识别。实验验证表明, 所提算法在合成孔径雷达舰船检测数据集(synthetic aperture radar ship detection dataset, SSDD)上的平均精度均值达到96.7%, 相比于YOLOv5s提高1.9%, 训练时收敛速度更快, 且保持了网络轻量化的特点, 在实际应用中具有良好前景。

关键词

合成孔径雷达 ; 目标检测 ; YOLOv5 ; 注意力机制 ; 多尺度融合

引 言

海洋权益涉及国家的根本利益, 为维护军事和领海安全, 对舰船目标进行有效的检测识别尤为重要。合成孔径雷达(synthetic aperture radar, SAR)具有受复杂天气因素影响小, 在日间或夜间环境均可工作的特点[1], 十分符合舰船目标监测所需的环境适应性和适时性的要求, 因此得到了广泛使用。

受制于硬件算力制约, 早期SAR图像的舰船目标检测技术主要依赖于预先定义的分布和人工设计特征, 例如双参数恒虚警率算法等[2-4]。这些传统的舰船目标检测算法大多针对特定场景, 主要对海杂波进行建模与仿真以及恒虚警目标的检测, 但其算法鲁棒性较低, 泛化性差。

近年来, 随着硬件性能的不断提升, 卷积神经网络(convolutional neural network, CNN)的迅速崛起使得基于深度学习的目标检测算法受到了广泛关注, 这类算法在实现特征自行提取方面具备极大优势, 可以摆脱对人工设计特征和建模的依赖, 达到较好的识别精度和泛化性能。在发展过程中, CNN根据处理流程又可分为两类。第一类是以区域CNN(region CNN, R-CNN)[5]、Fast R-CNN[6]、Faster R-CNN[7]等为代表的二阶段算法, 此类算法的检测准确率较高, 但由于需要先提取候选区域, 其网络结构较大, 执行速率较慢。第二类是以单次多框检测器(single-shot multi-box detecfor, SSD)[8]和YOLO(You Only Look Once)系列[9-12]等为代表的一阶段算法, 其主要思路是将分类和目标的定位均看作回归问题, 执行一次处理。与二阶段算法相比, 其检测不需要生成候选区域, 大大提高了算法效率, 但其检测精度略低。

针对上述两类算法的缺点, 学者们不断进行着改进优化。如赵江洪等[13]和顾佼佼等[14]使用不同的网络替代视觉几何组(visual geometry group, VGG)作为其主干网络, 并调整锚框的尺寸和个数。马啸等[15]增加了判别模块以及类别预测分支和语义分割分支。这些基于二阶段算法的改进虽然在一定程度上减小了主干网络的结构, 提高了检测精度均值, 但保留了区域推荐模块, 网络结构仍比一阶段算法复杂。唐崇武等[16]通过微调分类网络、增加训练尺度、聚类目标边框维度等方法优化了YOLOv3检测算法。胡欣等[17]基于YOLOv5增加了多分支注意力机制。钱坤等[18]改进了YOLOv5网络的激活函数和网络特征融合结构。以上改进不同程度地提高了一阶段算法的检测精度, 但在原算法上增加了较高的计算量。

因此, 使用深度CNN进行SAR图像舰船目标检测面临的一个重要问题, 就是兼顾网络规模和目标检测精度。就当前的改进算法性能而言, 一阶段算法更具优势, 在尽量维持原有计算量的情况下进一步改进一阶段算法的检测精度, 具有重要的研究价值和意义。

另外, SAR的斑点噪声影响是目标检测亟需解决的一个重要问题。由于独特的成像技术, SAR图像存在很多斑点噪声, 这些噪声会影响目标检测精度。处于港口沿岸的舰船图像, 成像时的斑点噪声和检测时遇到的干扰目标(如小岛、陆地和海杂波)混杂在一起, 将产生较多虚警。

除此以外, 当前检测算法对于SAR的舰船目标存在多尺度情况下泛化性弱的问题。SAR的舰船图像由于存在多分辨率成像模式以及不同的船舶尺寸等情况, 导致输入图像目标尺寸差异性大, 这样的多尺度输入会使算法性能不稳定。尤其是当小目标映射到最终特征图时, 用于位置细化和分类的信息很少, 会降低检测性能。

本文从上述问题出发, 提出了一种基于坐标注意力(coordinate attention, CA)机制及多尺度融合的目标检测算法。算法以YOLOv5新的版本(V6.1版)为基础, 进行了深度优化: 一是结合CA改进主干网络, 侧重目标坐标重要度信息以提高模型特征提取能力, 抑制了噪声和干扰的影响; 二是改进了原网络的特征融合结构, 添加了具有跳跃连接的加权双向特征金字塔网络(bi-directional feature pyramid network, BiFPN)进行多尺度融合, 提高多尺度下的泛化能力; 三是设计了一种新的预测框损失函数——快速有效的交并比(rapid and efficient intersection over union, REIOU), 以加快预测框收敛的速度和准确性。改进后网络的权重文件仅增加了0.4 M, 确保了网络的轻量化。最后, 将模型在SAR舰船检测数据集(ship detection dataset, SSDD)上进行了实验验证, 其平均精度均值(mean average precision, mAP)相比原算法提高了1.9%。

1 YOLOv5网络结构

1.1

YOLOv5的网络结构

YOLOv5的网络结构主要包括主干段、颈部段和头部段3部分。实现过程中, 为增加预测的准确性和模型泛化能力, 在数据进入预测网络前, 对YOLOv5进行了一系列的图像增广和自适应锚框计算等预处理操作, 其网络具体结构如图 1所示。

图1 YOLOv5 (V6.1版)的模型结构

1.2

新版本重要改动

YOLOv5的V6.1版本在主干段部分, 采用了新的CSPDarknet53网络结构对图像的特征进行提取。与早期版本有所区别, V6.1版本去掉了之前的Focus聚焦结构, 并将此前的BottleneckCSP部分更新为C3, C3的具体结构如图 1左下角所示。主干段就是以一系列的C3将各尺度的特征图分成两部分进行前向计算, 一路经过颈部段处理, 另一路与第一路直接进行特征融合。这样做的优势是减少了梯度的重复计算, 在保证速度和准确率的同时, 减少了网络参数和运算量。最后, 将提取的特征图直接输入改进的快速空间金字塔池化(spatial pyramid pooling-fast, SPPF), 对网络不同尺度的特征进行融合。

在颈部段部分, YOLOv5使用了路径聚合网络(path aggregation network, PANet)[19]进行了特征融合, PANet是在特征金字塔网络(feature pyramid network, FPN)[20]基础上增加的一条自底向上的信息流通路, 缩短了信息传输路径, 旨在使准确的底层定位信息能够增强到整个特征提取网络, 其总体结构如图 2所示。

图2 PANet结构

在头部段部分, YOLOv5的V6.1版本采用了完全交并比(complete intersection over union, CIOU)损失[21]替代了早期版本中的广义交并比(generalized intersection over union, GIOU)[22]损失, 作为预测框损失函数。CIOU考虑了中心点距离和宽高比两个参数。相比GIOU而言, 其算法收敛速度更快。

2 基于注意力机制及

多尺度融合的YOLOv5改进网络

2.1

算法框架

算法框架如图 3所示, 其中红色部分为本文的改进部分。输入图像具有灵活的尺寸, 经图像预处理统一调整为640×640大小, 之后经过一系列CBL模块和C3模块的卷积处理得到深层特征, 再将特征图经CA模块为其各特征点重新赋予权重后输入快速空间金字塔池化SPPF模块。这一过程主要是从特征图中抽取横纵坐标因子, 做批归一化(batch normalization, BN)后得到坐标权重, 增大了卷积核的局部感受野。随后, 图像特征在移除了单输入结点, 增加了跳跃连接的BiFPN网络后, 进行多尺度融合, 最后在头部段将3个尺度下的预测信息进行处理, 以得到置信度损失、类别损失和预测框损失, 其中的预测框损失使用了设计的REIOU损失。

图3 改进后的算法模型结构

2.2

CA机制

CA机制的思想是令网络在提取某类物体特征时对于位置或通道的关注有明显的侧重, 以此提高算法性能。但其会造成计算量的增加, 这对于训练时间和算力成本的控制以及移动端部署极为不利。相比其他注意力机制, CA[23]计算开销小, 并且在x坐标和y坐标方向上对位置进行池化和BN, 以图像中目标坐标灰度值分布特点对原特征图中的每一处赋予坐标权重, 可以有效抑制SAR图像中的噪声和干扰影响, 因此引入CA机制对网络进行改进。CA模块的具体实现结构如图 4所示。

图4 CA模块的结构

其具体工作流程如下:

对于输人尺寸为 C×H×W 的特征图, 分别进行水平方向和垂直方向的平均池化, 得到大小为 C×1×W 和 C×H×1的两组张量, 其公式为

(1)

(2)

式中:

为第 C 个通道第 h行的平均池化结果;

为第 C 个通道第 w 列的平均池化结果。将得到的

两个张量放在同一维度上聚合, 再通过一个 1×1的卷积改变输出的通道数, 通道数具体由衰减因子进行调控, 公式如下:

(3)

式中: C(⋅) 表示连接操作; ⊗表示卷积运算。

经过BN层和Sigmoid的非线性变换后, 重新按水平和垂直方向分割成大小为 H 和 W 的两部分 fh 和 fw , 并同时恢复原通道数的大小, 再将 fh 和 fw 经过Sigmoid函数得到输出 gh 和 gw , 公式如下:

(4)

(5)

gh 和 gw 表示坐标水平和垂直方向的重要程度, 以其为CA, 对原特征图进行权重赋值, 得到CA的最终输出公式如下:

(6)

CA即通过赋予特征图各通道的各坐标权重, 从而有效关注空间坐标位置信息。

本文在改进过程中进行了两种方案的尝试, 两方案分别如图 5 (a)和图 5(b)所示。一是直接改进所有C3模块, 使之在提取特征时就已侧重空间坐标位置信息; 二是将该注意力机制嵌入到主干段中的SPPF模块之前, 对总特征图进行CA机制处理, 以提取感兴趣的目标区域特征。经实验比较, 发现后者性能更好, 因此最终选择了方案2。

图5 两种改进方案的主干网络示意图

6.1

2.3 加权双向特征金字塔多尺度特征融合

YOLOv5中的主干段部分经过了多个C3模块组的处理, 且每经过一个C3模块组, 特征图的尺寸大小便会缩小为原来的50%, 这主要是为了提取更高维的语义信息, 但在获取更高维特征的同时, 会损失掉部分底层细节特征, 因此YOLOv5在颈部段部分使用了PANet的基本结构, 促进不同尺度特征信息的融合, 以弥补此缺陷。PANet是基于FPN的改进, 它在FPN自顶向下的融合路径之后又添加了一条自底向上的路径, 利用准确的低层定位信号增强整个特征层次, 从而缩短了低层与顶层特征之间的信息路径。

将FPN中融合后的第n个特征层记为Pn,可以看到,PANet结构仍然为较简单的双向融合,存在部分节点信息冗余、原始节点信息未直接参与输出特征融合等问题。基于此, 本文采用了EfficientDet[24]网络中的BiFPN结构对网络特征融合部分进行了改进,具体结构如图 6所示。考虑到BiFPN的改进较为复杂,为进行区分,文献[24]将改进前的第n个特征层记为

, 将改进后的第 n个特征层记为

图6 PAN和BiFPN的网络结构

BiFPN在PANet上的改进可总结为3个方面: 一是减少了部分节点, BiFPN在融合处删除了单输入节点, 因为这样的节点相较于前一节点没有额外信息, 去掉节点后可减少冗余计算; 二是增加了不相邻节点间的跳跃链接, 使输出层不但能够得到自下而上已经参与特征融合的信息, 还保留了原始节点未经融合的信息; 三是BiFPN在特征融合后, 可继续堆叠, 做进一步融合, 以改善效果。

考虑到算法网络结构复杂度和改进后的计算量等实际情况, 本文设计的BiFPN融合层数为3, 堆叠数为1, 结合原主干段网络实际结构, 添加了一次跳跃连接, 并改变了原层次的连接关系, 具体连接关系如图 7所示。

图7 改进后的特征融合网络

对照图 7, 以P6为例, 罗列出输入输出关系式如下:

(7)

式中: Conv为卷积操作, 由C3模块执行; Resize通常为上采样或下采样操作, 以匹配各特征图大小。在本算法中, 左侧两黑色虚线框中的upsample执行上采样, 而右侧两黑色虚线框中的CBL执行下采样。

2.4

损失函数

YOLOv5算法V6.1版本的预测框损失函数采用了CIOU损失, 但在预测框回归过程中, 一旦CIOU与真实框的宽高纵横比相同, 预测框的宽和高无法同时增加或者减小, 以致不能继续优化。为解决此问题, 本文在参考EIOU[25]的基础上, 设计了一种新的损失函数——REIOU作为预测框损失函数, 在CIOU基础上将预测框和真实框的纵横比直接拆分为单独预测长和宽, 并结合其梯度下降趋势对损失函数进行了改进。

原始的EIOU示意图如图 8所示, 其损失值如下:

(8)

图8 EIOU示意图

式中: C 为覆盖预测框与真实框的最小外接框的对角线长度; Cw 和 Ch 分别为其宽度和高度; ρ(b,bgt) 为预测框与真实框中心点的距离; ρ(w,wgt) 和 ρ(h,hgt) 分别为其横向差值和纵向差值, 具体如下:

(9)

(10)

式(8)实际包含了IOU损失、中心点距离损失和预测框与真实框的纵横比损失3方面内容。将此3项内容整合后, 影响最终损失值的所有变量即为式中的EIOU。EIOU的值越接近于1, 则预测框损失越小。为确保预测框损失能够更快收敛, 设计REIOU损失如下:

(11)

式(11)中的LREIOU与原始LEIOU均随EIOU值的增大而减小, 下限均为0。但两者相比, LREIOU曲线梯度较LEIOU更大, 收敛更快。且梯度随EIOU值增大而逐渐降低。当EIOU的值趋向于1时LREIOU梯度趋近于-1, 因此具有自适应调节的良好性能。两者曲线比对如图 9所示。

图9 REIOU与EIOU对比图

3 实验结果与分析

3.1

原始架构与实验环境

本文算法以YOLOv5s为原始架构进行改进。YOLOv5系列共分为五种网络架构, 区别仅在于网络规模和参数量的差异。通过调节深度因子和宽度因子, 改变主干段部分中的C3模块个数及其内部卷积核个数, 最终形成不同的网络深度和网络宽度。其参数对比如表 1所示, 对比项目包括深度因子、宽度因子、总参数量、网络层数和浮点运算数(floating point operations, FLOPs)。

表1 YOLOv5系列各网络结构规模

事实上, 本文的改进适用于YOLOv5系列所有的网络架构, 但综合考虑到网络规模、训练时长以及识别率等因素, 最终选择了较为轻量的YOLOv5s进行改进实现。实验的软硬件环境搭建如表 2所示。

表2 实验的软硬件环境

3.2

数据集与训练策略

实验使用的数据集为公开的SSDD数据集[26], 该数据集共有1 160张SAR图像, 包含2 456个舰船目标, 具有多种极化模式、多种分辨率, 包括了海面及沿岸等多种舰船场景, 能有效验证模型的鲁棒性。本文实验将SSDD数据集按照7 ∶2 ∶1的比例随机划分为训练集、验证集、测试集。

实验在数据集上从头开始训练权重, 使用随机梯度下降(stochastic gradient descent, SGD)优化器对网络参数进行迭代更新, 动量参数设为0.937, 批次大小设为32, 训练周期为100个轮次, 训练时使用了warm-up方法对学习率的调整进行预热。其中, 设置初始学习率lr0为0.01, 在前3个轮次进行warm-up使学习率迭代更新直至0.1, 之后使用余弦退火算法再次更新学习率, 最终使学习率下降至0.001。

3.3

评价指标

本实验对改进算法的评价从目标检测性能、运算处理速度和模型大小3个方面展开。

目标检测性能以mAP为主要指标进行评价。mAP是以召回率R和查准率P为横、纵坐标形成的曲线与两坐标轴构筑的面积大小, 其作为衡量模型整体性能的最终评价指标, 具体表示为

(12)

式中: TP表示目标正确检测的个数; FN表示目标漏检的个数; FP为错检的目标个数。

上述评价指标的确定与IOU检测阈值紧密相关, 本实验设置IOU检测阈值为0.5, 即当检测框与真实框的重叠区域超过50%时, 判定检测框预测位置正确。

运算处理速度以每秒处理帧数(frame per second, FPS) 和FLOPs为指标进行评价。这两个指标能够分别表明模型的动态实时检测能力以及模型所需的算力负载。

模型大小以参数量和模型权值文件大小为指标进行评判, 这两个指标能够表明模型的轻量化程度, 并为移动端移植的可行性提供参考。

3.4

结果与分析

3.4.1

消融实验

本文算法从特征提取、特征融合和损失函数3方面对YOLOv5s进行了改进, 为评估此3项改进对SAR舰船目标检测的优化程度, 设计了单项及多项组合的消融实验, 实验结果如表 3所示。

表3 各改进算法的性能比较

其中, 第一行为原YOLOv5算法, 最后一行为本文提出的改进算法, 中间几行为消融实验的对比算法, 表格内“√”表示使用了当前模块, “—”表示未使用当前模块。

从改进算法1~改进算法3可以看出, 就单个模块对算法检测效果的改善而言, CA机制和BiFPN、REIOU相比带来的性能改善相对较低, 但通过改进算法4可以看出, CA一旦与BiFPN相结合, 对算法检测能力的改善则会有明显提升, 这是因为BiFPN存在跳跃连接, 在此基础上进行特征融合, 可充分利用CA侧重感受目标空间位置的优势, 而原算法的特征融合没有跳跃连接, 因此CA带来的优势并未被有效利用至后续的检测过程中。在改进算法3、改进算法5、改进算法6中, 可以看到采用REIOU作为损失函数, 也能较好改善算法的平均精度均值, 这是因为REIOU解决了原算法中预测框的长宽比在达到真实框长宽比的情况下无法同时增大或缩小的问题, 使预测框损失得到有效改善。对比本文算法可知, 综合3方面的改进可最大限度地提高原算法的目标检测性能, 在SSDD数据集上使mAP从原来的94.8%提升至96.7%, 性能改善了1.9%。

3.4.2

性能曲线

本文算法与原YOLOv5s在迭代过程中mAP值以及loss曲线的对比情况如图 10和图 11所示。

图10 算法改进前后mAP值曲线

图11 算法改进前后的loss曲线

图 10展示了本文算法与原YOLOv5s算法的mAP值曲线。由图 10可以看到, 本文算法mAP值收敛更快, 在约20个轮次时即可达到90%左右, 而原YOLOv5s算法需要50个轮次后方能达到同样水平。这是由于本文引入的CA机制给予侧重的坐标位置特征更大的权重, 使得算法在迭代时更具方向性, 收敛更快, 结合BiFPN结构可更有效地提取特征并进行融合, 故本文算法收敛过程较原算法更为平稳, 最终收敛值更高。

图 11展示了算法改进前后的loss曲线, 其中红色代表改进算法loss曲线, 蓝色代表原算法loss曲线。由图 11可知, 改进算法的loss值下降更快, 最终收敛值更低。这是因为REIOU对预测框的损失进行了重新定义, 将预测框损失由预测框和真实框的长宽比改为了直接预测目标框长度和宽度两个因子, 并优化了下降的梯度, 使收敛性能得到有效改善。

3.4.3

检测效果

为直观展现本文算法的检测效果, 从测试集的检测结果中选取了四张具有代表性的典型场景检测结果, 如图 12所示。其中, 图 12(a)、图 12(b)展示了在远海小目标时的舰船检测结果。图 12(c)、图 12(d)展示了舰船入港时复杂背景情况下的舰船检测结果。

图12 实验结果示例

从图 12可以看出, 算法对于离港的舰船在无港口、岛屿等干扰的情况下, 检测效果良好, 无论是对少数目标或是多个离散分布的目标都能实现准确的识别。对于舰船入港时具有复杂背景影响的情况, 改进算法也具有良好的检测效果, 尤其是在图 12(d)中, 算法对于复杂背景下, 不同尺寸大小且分布密集的舰船目标均可实现准确定位和识别, 漏警率和虚警率低。

3.4.4

算法比较

为验证算法的有效性和先进性, 将本文算法与其他常用目标检测算法在SSDD数据集上进行了横向对比实验, 结果如表 4所示。

表4 SSDD数据集上各检测算法对比

对于平均检测精度而言, 各算法的mAP值均可达到83%以上。对比两阶段算法中主干段采用ResNet50[27]+FPN结构的Faster-RCNN, 本文算法的mAP提升了13%, 性能改善明显, 对比单阶段的RetinaNet[28]和SSD算法, 本文算法的mAP也分别有4.7%、10.6%的提升, 具有更加优秀的检测能力, 同时也优于同系列的YOLOv3和YOLOv5s算法。

在运算速度和计算量上, 本文算法FPS达到了127, 与除YOLOv5s的其他算法相比提高了3~7倍。FLOPs的大小为16.6 G, 远小于Faster-RCNN、RetinaNet、YOLOv3 3种算法。与SSD算法相比, 虽然总计算量略高, 但由于算法结构具有较高并行度, 改进算法实际处理速率达到了SSD的3倍, 具有明显优势。与原算法YOLOv5s相比, 由于增加了CA机制, 改进算法总的计算量略有增加, 运算速度亦有所下降, 然而127 FPS的速率已经可以满足当前大多数的工程实际需求。在可接受的下降范围内, 新算法换来了检测性能的明显提升。

至于参数量和权重文件大小, 本文算法的参数量仅为7.2 M, 权重文件大小为14.1 MB, 约为SSD算法的1/2, Faster-RCNN的1/7, RetinaNet的1/8, YOLOv3的1/9, 显著优于其他算法。与原YOLOv5s算法相比, 本文算法参数量和权重文件仅增加了0.2 M和0.4 MB, 仍然保持了轻量化, 便于在移动端上部署和执行。

3.5

与其他改进算法的对比

在确定本文算法的过程中, 进行了两种CA嵌入方案的对比实验, 其具体实现见第2.2节, 实验结果如表 5所示。其中, 方案1和方案2为第2.2节所述的方案1与方案2。两种方案均采用了REIOU和BiFPN。

表5 两种CA嵌入方案性能对比

从表 5可知, 方案1所需的计算量和参数量更小。这是因为方案1为控制参数规模, 在为每一个C3模块嵌入CA时, 去掉了原先C3中的颈部段, 相较颈部段而言嵌入的CA需要更新的参数量更少, 具有更小的计算量, 同时其FPS值也相应较高。但由于去掉了具有跨层连接的颈部段结构, 其特征提取能力会有所下降, 因而方案1的平均精度mAP值不及方案2。考虑到检测性能的影响, 本文算法最终选用了第二种嵌入方案。

为进一步验证本文算法的先进性以及对原YOLOv5算法带来的性能影响, 将本文算法与一些其他改进算法进行了实验比对, 结果如表 6所示。改进算法在原主干段融入了SE[29]、CBAM[30]和CA三种不同的注意力机制, 改进算法1~改进算法3、改进算法4~改进算法6、改进算法7和改进算法8在各注意力机制基础上分别使用SIOU[31]、EIOU和REIOU作为预测框损失函数。上述的8种改进算法均在BiFPN的结构中实现了特征融合, 最后与本文改进算法进行了比对。

表6 YOLOv5s及改进算法的性能参数比对

实验结果表明, 以上9种改进算法均能提高检测算法的性能。就mAP值而言, 在损失函数相同的情况下, CA机制相对SE、CBAM能够为原算法带来更多提升, 在SIOU、EIOU和REIOU下分别提高1.2%、1.7%和1.9%。就参数量而言, CA带来的增长也是3种注意力机制中最少的。故而在三者中选择CA机制为宜。在注意力机制确定的情况下, 采用REIOU作为预测框损失相较SIOU而言, FPS值基本保持不变, mAP值在SE和CA下有0.3%~0.7%的提升; 相较EIOU而言, 采用REIOU时其mAP值在SE和CA上均有0.2%的提升, 同时考虑其拥有更快的收敛速度, 因而损失函数采用REIOU为宜。同时结合实验结果, 也可看出本文改进方案在表 6所列所有方案中效果是最佳的。

为清晰直观地展示原算法和几种改进算法的性能差异, 除原算法和本文改进算法, 在其余的8种改进算法中选择了性能最好的3种算法, 并从测试集中挑选了5种典型场景的SAR图像检测结果进行横向对比, 如图 13所示。

图13 原算法及改进算法检测效果图

由图 13可以看出, 所展示的五种算法均可对SAR图像的舰船目标做出有效检测, 但存在部分漏检或错检的情况。在以第一幅图为代表的深海区域多目标情形下, 5种算法均可准确检测出所有目标。第二、第三、第四幅图分别为复杂背景大、中、小三种尺度下入港舰船检测结果。第二幅图中, 原算法和改进6算法存在漏检, 改进3算法存在错检情况; 第三幅图中, 原算法和改进6算法存在严重漏检, 改进7算法存在部分漏检; 第四幅图中, 原算法将部分背景错检为目标。而对于此三幅图, 本文算法均未出现漏检及错检情况。第五幅图展示了密集多目标位于图像边缘的情况, 原算法和改进3算法、改进6算法存在漏检, 改进7算法和本文算法结果良好。

综上可知, 在多种尺度的SAR图像中, 本文算法无论是对深海区域的离港舰船或是对处于复杂背景下的入港舰船, 相比原算法及其他对比改进算法都具有更高的检测精度, 更好的鲁棒性和更低的漏检/错检率。

虽然本文算法取得了性能上的提升, 但通过实验仍发现了一些不足, 主要体现在复杂背景下有强干扰信号时存在的目标漏检问题, 如图 14所示。由于单通道SAR图像本身缺乏纹理、色彩等细节信息, 且图像分辨率较低, 网络的学习能力不能充分发挥, 再加之训练集仅有812张图片, 缺乏足够的学习样本, 含有强噪声干扰的目标样本则更少, 使得网络的泛化能力不足, 而导致上述现象发生。

图14 目标存在干扰时的漏检

4 结 论

针对当前基于深度学习的SAR图像目标检测算法易受噪声和背景干扰影响, 以及在多尺度条件下检测性能下降的问题, 本文在兼顾算法网络规模和检测精度的基础上, 提出了一种基于CA机制和多尺度融合而改进的YOLOv5目标检测算法。该算法对于远海简单背景情况下以及具有陆地、港口等复杂背景情况下的舰船目标都具有良好的检测效果。相比其他方法, 本文所提算法具有更高的精度和检测速率, 模型更为简单, 权重文件更小。对比原YOLOv5模型, 该算法在仅增加少量参数的情况下, 改善了算法的平均检测精度, 同时能够快速收敛, 具备较高的检测速率, 满足各种工程项目的实时性需求。其权重文件仅为14.1 M, 对弹载、机载等移动端设备上的实时SAR图像检测具有一定现实意义。

本文方法虽然达到了良好的检测效果, 但在实验中, 由于使用的SSDD数据集训练样本较少, 且缺乏有强噪声干扰时的训练样本, 使得在有较强干扰时存在个别目标漏检的情况。计划在未来工作中, 进一步优化损失函数, 以解决样本不平衡的问题, 并使用数量更大、分辨率更高的SAR舰船图像数据集进行训练, 以优化网络结构和提高检测精度。

声明:公众号转载的文章及图片出于非商业性的教育和科研目的供大家参考和探讨,并不意味着支持其观点或证实其内容的真实性。版权归原作者所有,如转载稿涉及版权等问题,请立即联系我们删除。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-12-13,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 计算机视觉CV 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档