前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Integrated Multiscale Domain Adaptive YOLO

Integrated Multiscale Domain Adaptive YOLO

作者头像
狼啸风云
发布2023-10-07 15:27:50
3260
发布2023-10-07 15:27:50
举报
文章被收录于专栏:计算机视觉理论及其实现

摘要

 领域自适应领域在解决许多深度学习应用程序遇到的领域转移问题方面发挥了重要作用。这个问题是由于用于训练的源数据的分布与实际测试场景中使用的目标数据之间的差异而产生的。在本文中,我们介绍了一种新的多尺度域自适应YOLO(MS-DAYOLO)框架,该框架在YOLOv4目标检测器的不同尺度上采用了多个域自适应路径和相应的域分类器。在我们的基线多尺度DAYOLO框架的基础上,我们为生成领域不变特征的领域自适应网络(DAN)引入了三种新的深度学习架构。特别地,我们提出了一种渐进特征约简(PFR)、一种无人分类器(UC)和一种集成架构。我们使用流行的数据集与YOLOv4一起训练和测试我们提出的DAN架构。我们的实验表明,当使用所提出的MS-DAYOLO架构训练YOLOv4时,以及当在自动驾驶应用的目标数据上进行测试时,物体检测性能显著提高。此外,相对于更快的R-CNN解决方案,MS-DAYOLO框架实现了数量级的实时速度改进,同时提供了可比的目标检测性能。

1、介绍

 在对场景中的各种对象进行分类和定位方面,卷积神经网络(CNNs)已经在目标检测方面实现了极大的改进。然而,在领域转移的情况下,当测试数据的分布与训练数据的分布不同时,最先进的对象检测方法的性能会显著下降,有时甚至会显著下降。这种域偏移可能是由于在不同的照明或天气条件下捕捉数据,或者由于从不同的视点观看相同的目标导致对象外观和背景的变化。例如,用于自动驾驶汽车的训练数据通常在晴朗的天气条件下获取,而测试可能在更具挑战性的天气(如雨、雾)下进行。因此,方法无法检测对象,如图1(b)的示例所示。在这种情况下,进行训练的领域称为源领域,而进行测试的新领域称为目标领域。

 加剧领域转移问题的挑战之一是缺乏目标领域数据,尤其是注释数据。这导致了领域自适应领域的出现,该领域已被广泛研究,以解决领域转移的问题,而无需为新的目标领域注释数据。一般来说,领域自适应解决方案依赖于对抗性网络和其他旨在生成领域不变特征的策略。因此,所使用的特定领域自适应解决方案在很大程度上受到底层目标检测方法架构的影响。在这种情况下,在目标检测领域,对于Faster R-CNN目标检测及其变体,已经对域自适应进行了相当广泛的研究。然而,其他流行的目标检测方案,特别是基于YOLO的架构,没有或很少受到关注。 

在本文中,我们为YOLOv4目标检测器提出了新的域自适应架构。特别地,我们介绍了四种新的多尺度域自适应YOLO(MS-DAYOLO)架构,它们促进了特征提取阶段的多尺度领域自适应和域分类器的渐进通道缩减策略。如图1(c)的示例所示,所提出的MS-DAYOLO框架实现了对YOLOv4的显著改进。相对于更快的R-CNN解决方案,MS-DAYOLO实现了数量级的实时速度改进,同时提供了可比的且在某些情况下优越的对象检测性能。特别是,本文的主要贡献可概括如下:

1) 基线多尺度DAYOLO:我们介绍了一种多尺度域自适应YOLO(MS-DAYOLO)架构,该架构支持YOLOv4骨干网络中特征提取阶段不同层的域自适应。MS-DAYOLO架构包括具有多尺度特征输入和多个域分类器的域自适应网络(DAN),代表了我们的基线域自适应YOLO框架。需要强调的是,我们最近在[24]中引入了拟议的基线架构。在此,我们在先前工作的基础上:(a)引入三种新的新型MS-DAYOLO架构,b)相对于基线性能,呈现出显著改进的新性能结果,以及(c)进行新的、更广泛的模拟和消融研究。

2) 渐进特征约简、Uniffed分类器和集成多尺度DAYOLO:在我们的基线MS-DAYOLO框架的基础上,我们提出了三种新的领域自适应架构,当在具有挑战性的目标数据上测试时,这些架构进一步提高了YOLOv4目标检测性能。这些体系结构是:(a)渐进式特征约简,(b)Uniffed Classifier,以及(c)结合了其他两种体系结构优点的集成MS-DAYOLO框架。本文稍后将详细解释这些架构的相应DAN网络。

3) 我们使用Cityscapes、KITTI和Waymo数据集进行了广泛的实验。这些实验表明,当在目标域上测试时,我们提出的MS-DAYOLO框架对YOLOv4的性能提供了显著的改进。我们还表明,与基于更快R-CNN对象检测器的最先进方法相比,MS-DAYOLO提供了相当的、有时甚至更优越的对象检测性能。如上所述,与基于更快R-CNN的解决方案相比,我们提出的MS-DAYOLO架构实现了这一级别的最先进性能,同时在计算复杂性方面提供了一个数量级的改进。

本文的其余部分组织如下。第二节简要介绍了相关工作。第三节详细描述了YOLO目标检测器的多尺度域自适应框架,包括域自适应网络的新架构。第四节提供了所提出的框架的实验结果,并进行了分析和讨论。最后,第五节总结了本文的主要工作成果。

2、相关工作

一般来说,最先进的基于CNN的目标检测模型可以分为两组:基于一阶段和基于两阶段的方法。一阶段目标检测器通过统一神经网络在单个计算中直接从完整图像预测目标的边界框和与这些目标相关联的类概率。单阶段目标检测器最著名的模型是YOLO、SSD和RetinaNet。另一方面,两阶段目标检测器在第一阶段中使用区域建议网络(RPN)生成可能具有对象的建议边界框。然后,建议被馈送到第二阶段,在第二阶段中,裁剪的特征被用于对目标进行分类并微调边界框。两阶段目标检测器最著名的模型是R-CNN系列,包括Fast R-CNN、Faster R-CNN、R-FCN和Mask R-CNN。

最近,由于域偏移,无监督域自适应已被用于提高目标检测的性能。它试图使用来自源域的标记数据和来自目标域的未标记数据来学习鲁棒的目标检测器。用于目标检测的领域自适应方法主要可分为基于重建的解决方案和基于对抗性的解决方案。基于重建的域自适应试图通过使用图像到图像的平移模型来提高目标域的目标检测器的性能。特别地,它利用图像到图像的翻译方法从相应的源标记样本生成目标域的人工(假)样本。因此,将标记的源数据翻译成相应的目标数据将有助于训练目标域中的目标检测器;并且这应当提高该领域中的目标检测的性能。

在基于对抗性的领域中,领域鉴别器被训练来分类数据点是来自源领域还是目标领域,而目标检测器的特征提取器被训练来混淆领域鉴别者。因此,作为该训练策略的结果,特征提取器生成域不变特征。针对Faster R-CNN目标检测器,已经提出了许多基于对抗性的领域自适应方法。基于对抗性的领域自适应的最先进方法是领域自适应Faster R-CNN。随后,提出了许多其他办法。例如,何和张提出了用于领域和提议特征对齐的多个对抗性子模块。此外,赵等人提出了一种协作自训练方法,该方法可以将损失梯度传播到整个检测网络,并相互增强区域建议网络和区域建议分类器。此外,Hsu等人利用精细的原型表示来实现类别级域对齐。另一方面,张等人将[16]中的域自适应模块应用于YOLOv3目标检测器。

3、提出的多尺度域适配YOLO

YOLOv4[27]结合了许多新的修订和新的技术,以相对于其前身提高整体检测精度。YOLOv4有三个主要部分:脊椎、颈部和头部,如图2所示。主干负责提取不同尺度的多层特征。颈部使用上采样层从脊椎的三个不同尺度收集这些特征,并将其提供给头部。最后,头部预测对象周围的边界框以及与每个边界框相关联的类概率。

主干(即特征提取器)代表YOLOv4架构的一个主要模块,我们认为它对检测器的整体性能产生了重大影响。除了许多卷积层外,它还有23个残差块[39]和5个下采样层,用于提取后续检测阶段使用的关键特征层。在这里,我们集中讨论提供给颈部模块的特性(图2中的F1、F2和F3)。特别是,我们的目标是将域自适应应用于这三个特征,使它们对域偏移具有鲁棒性,从而使它们在基于域自适应的训练中收敛于域不变性。同样重要的是,这三个阶段的特征具有不同的尺寸,这是由于连续的下采样层将特征的宽度和高度逐渐减少一半,同时使通道数量加倍。如果d是第一个比例(F1)的特征宽度,则特征的三个阶段的尺寸为:

 A、域适配YOLO

所提出的域自适应网络(DAN)仅在训练期间连接到YOLOv4目标检测器,以学习域不变特征。事实上,YOLOv4和DAN是以端到端的方式进行训练的。对于推理和测试,在原始YOLOv4架构(没有DAN网络)中使用域自适应训练的权重。因此,我们提出的框架不会增加推理过程中潜在的检测器复杂性,这是自动驾驶等许多实时应用的重要因素。

DAN使用主干的三个不同的尺度特征作为输入,这些特征被输入到颈部。它有几个卷积层来预测领域类别(源或目标)。然后,通过二进制交叉熵计算域分类损失(

),如下所示:

这里,

t_i
t_i

是第

i
i

个训练图像的基本真值域标签,其中

t_i = 1
t_i = 1

用于源域,

t_i = 0
t_i = 0

用于目标域。

p^{(x,y)}_i
p^{(x,y)}_i

是在特征图的位置

(x,y)
(x,y)

处的第

i
i

个训练图像的预测域类概率。

N
N

表示一批图像的总数乘以特征图中元素的总数。

DAN经过优化,通过最小化这种损失来区分源域和目标域。另一方面,对主干进行优化,以最大限度地提高学习域不变特征的损失。因此,对于这两个域,主干的特征应该是不可区分的。因此,这应该提高目标域的目标检测性能。 为了解决联合最小化和最大化问题,我们采用了对抗性学习策略。特别是,我们通过在主干网和DAN网络之间使用梯度反转层(GRL)来实现这一矛盾的目标。GRL是一个双向算子,用于实现两个不同的优化目标。在前馈方向上,GRL充当身份算子。这导致了在DAN内执行局部反向传播时最小化分类误差的标准目标。另一方面,对于向骨干网络的反向传播,GRL变为负标量(

\lambda
\lambda

)。因此,在这种情况下,它导致二进制分类误差最大化;并且这种最大化促进了主干对域不变特征的生成。 为了计算检测损失(

),仅使用源图像,因为它们用地面实况对象进行了注释。因此,YOLOv4的所有三个部分(即主干、颈部和头部)都通过最小化

进行了优化。另一方面,使用源标记图像和目标未标记图像来计算域分类损失(

),该损失用于通过最小化DAN来优化DAN,并通过最大化DAN来计算主干。因此,使用

来优化主干。换言之,通过最小化以下总损失来优化主干:

 其中

\lambda
\lambda

是GRL的负标量,它平衡了检测损失和域分类损失之间的权衡。事实上,

\lambda
\lambda

控制了DAN对主干的影响。

 B、DAN结构

我们为域自适应网络(DAN)开发了各种体系结构,如图3所示,以探索和深入了解不同组件对提高目标域性能的影响。在我们所有的架构下,我们采用了一种多尺度策略,通过三个相应的GRL将主干的三个特征F1、F2和F3连接到DAN。除了这种常见的多尺度策略之外,所提出的DAN架构彼此不同,如下所述。 1) 多尺度基线:我们没有像在域自适应更快R-CNN架构中那样仅对特征提取器的最终尺度应用域自适应,而是分别为三个尺度开发域自适应,以解决梯度消失问题。换言之,由于梯度消失问题,仅将域自适应应用于最终尺度(F3)不会对先前尺度(F1和F2)产生显著影响,因为它们之间存在许多层。因此,我们将领域自适应应用于所有尺度,如图3(a)所示。对于每个尺度,GRL之后有两个卷积层,第一个将特征通道减少一半,第二个预测领域类概率。最后,使用领域分类器层来计算领域分类损失。

2) 渐进特征缩减(PFR):如图3(a)所示,基线架构通过两个阶段的神经网络,将YOLOv4主干产生的特征向量大小突然缩减为单值特征(标量)。这个简单的两阶段DAN旨在生成一个单一的特征值,该特征值用作领域分类器的输入。域分类器需要单个特征值这一事实是分类器的二进制性质所固有的,该分类器只需要将图像数据分类到源域或目标域中。同时,由于这里使用的对抗性策略,如图2所示,上述基线域自适应网络正在与主干网中明显更复杂的网络竞争。我们观察到,简单的基线DAN架构和复杂的骨干网络之间的这种不匹配可能会影响域自适应性能。因此,DAN网络可能不足以区分源域和目标域,因为复杂的骨干网络很容易混淆(和欺骗)DAN网络。为了缓解这种失配,我们通过逐渐减少特征通道来增加每个尺度的卷积层的数量,如图3(b)所示。这种特征信道的逐渐减少有助于DAN网络更有效地与更复杂的主干网竞争。因此,骨干网络提取的特征将更具域不变性。 因此,虽然基线架构使用两个阶段的神经网络来减少特征通道的数量,但我们提出的渐进特征减少根据原始特征大小使用四个或五个阶段。特别地,对于特征向量F1和F2,我们使用四个阶段的神经网络,其将特征向量大小分别从128和256逐渐减小到单个特征标量值,这是作为二进制域分类器的输入所需要的全部。对于特征向量F3,我们使用五阶段神经网络DAN来逐渐将骨干特征向量减少到标量特征值。重要的是要强调以下关于所提出的渐进特征减少架构的内容。与我们在图3(b)所示的架构中使用的阶段数量相比,可以使用更多数量的渐进式缩减阶段。然而,根据我们的经验,将赛段数量增加到四个或五个赛段之外并不一定能提高整体表现。 3) Uniffed分类器:在多尺度基线和渐进特征约简架构下,每个尺度都有自己独特的领域分类器。这种多分类器策略可能导致尺度之间的不一致。例如,在一个尺度上的域分类器可以将图像块分类为源数据,而在另一尺度上的领域分类器可以将源自目标域的相同图像块分类。(这种不一致性的例子稍后在实验部分中显示。)为了解决这种潜在的不一致性,我们建议使用一个单一的(统一的)域分类器,该分类器组合了所有尺度的特征向量,如图3(c)所示。重要的是要强调以下关于所提出的统一分类器域自适应网络的内容: 1) 我们使用下采样卷积层来匹配不同尺度上的特征大小。例如,为了组合由主干的F1和F2尺度产生的特征向量,我们将下采样阶段添加到F1尺度,并将产生的向量与来自F2的特征向量连接。该策略保持了我们的域自适应网络的多尺度属性,同时针对统一的域分类器架构。 2) 此外,我们将不同尺度的特征连接起来,使每个尺度在特征通道数量方面的贡献相等。换句话说,每个特征尺度在域类概率的预测中的贡献相等。 3) 集成:需要注意的是,上述两种改进,即渐进特征约简和统一分类器,已直接和单独应用于多尺度基线架构。因此,为了获得渐进特征减少和统一领域分类器策略的好处,我们将它们集成到一个网络中,如图3(d)所示。原则上,我们通过用额外阶段的卷积层补充统一分类器架构(图3(c))来开发网络,以实现特征通道大小的更渐进减少。通过比较图3(c)和图3(d)中所示的两种体系结构,可以明显看出这一点。

4、实验

在本节中,我们评估了我们提出的域自适应YOLO框架和提出的MS-DAYOLO架构。我们修改了基于暗网平台的YOLOv4的官方源代码,并开发了一个新的代码来实现我们提出的方法。 A.设置 对于训练,我们使用了原始YOLOv4中使用的默认设置和超参数。使用预先训练的权重文件对网络进行初始化。训练数据包括两组:具有图像及其注释(边界框和对象类)的源数据,以及没有注释的目标数据。每个批次有64个图像,其中32个来自源域,32个来自目标域。基于先前的工作以及我们使用试错的经验,我们为所有实验设置了λ=0.1。

为了进行评估,我们报告了每个类别的平均精度(AP)以及阈值为0.5的平均平均精度(mAP),使用了标记了目标域图像的测试数据。我们遵循了使用相同阈值0.5的其他先前领域自适应目标检测工作。我们将我们提出的方法与最初的YOLOv4和其他基于Faster R-CNN目标检测器的最先进的领域自适应方法进行了比较,所有这些方法都应用于相同的目标领域验证集。

B、结果

1) 跨摄像头自适应:

配备不同摄像头的不同驾驶车辆拍摄的不同真实视觉数据集之间可能会发生域偏移,即使这些视觉数据是在类似的天气条件下拍摄的。这种域偏移通常由不同的相机设置驱动,从而导致图像质量和分辨率的偏移。此外,此类数据集通常在不同的位置捕获,这些位置具有不同的视图和驾驶环境。所有这些因素都会导致数据集之间的领域差异。在这个实验中,我们评估了我们的MS-DAYOLO框架在两个真实驾驶数据集之间的域自适应性能:KITTI和Cityscapes,正如该领域的许多最近工作所做的那样。特别地,具有6000个标记图像的KITTI训练集被用作源数据。而Cityscapes训练集有2975张图像,但没有标签,被用作目标数据。Cityscapes验证集有500张标记图像,用于测试和评估。 表I显示了先前工作中报告的基于汽车AP的性能结果,因为它是两个数据集之间唯一的公共目标类。基于这些结果,我们提出的框架的所有架构都显著优于原始的YOLOv4方法。此外,所提出的集成架构在

mAP
mAP

方面实现了最佳的整体性能。图4显示了我们的方法与原始YOLOv4进行定性比较的可视化示例。从这些例子中可以明显看出,我们的方法成功地检测到了场景中的车辆,而原始YOLOv4未能检测到相同的车辆。

2) 不利天气适应:

由于天气条件的变化导致的域偏移是源域和目标域之间存在差异的最突出原因之一。不同天气条件下的可靠物体检测系统对于自动驾驶等许多关键应用至关重要。因此,我们通过研究自动驾驶在具有挑战性的天气条件下的领域变化,重点介绍了我们提出的MS-DAYOLO框架的评估结果。为了实现这一点,我们使用了三个不同的驾驶数据集:Cityscapes、Foggy Cityscapes和Waymo。 a) 干净到有雾:我们使用驾驶数据集讨论了我们提出的方法从晴朗到多雾天气的适应能力:Cityscapes和Foggy Cityscapes,正如该领域最近的许多工作所做的那样。Cityscapes训练集有2975个标记的图像,这些图像被用作源域。同样,Foggy Cityscapes训练集也有2975个图像,但没有注释,并用作目标域。原始YOLOv4仅使用源域数据进行训练。而MS-DAYOLO是使用源域和目标域数据进行训练的。Foggy Cityscapes验证集有500张标记图像,用于测试和评估。因为Foggy Cityscapes训练集是注释的,所以我们能够用这个集训练原始YOLOv4,以显示理想的性能(oracle)。 表二总结了业绩结果。与原来的YOLOv4相比,我们的方法实现了明显的性能改进。我们还观察到,相对于基线架构,所提出的渐进特征约简(PFR)、统一分类器(UC)和集成架构提高了检测性能。尽管MeGA方法的性能略优于Integrated MS-DAYOLO(0.3%),但我们的MS-DAYOLO运行速度快于实时,并且在每秒帧数(FPS)方面明显快于GPA,这对时间关键型应用至关重要。值得注意的是,与最初的YOLOv4相比,所提出的集成架构实现了显著的改进,并且几乎达到了理想(oracle)场景的性能,尤其是对于一些目标类,在平均精度方面。图1显示了与原始YOLOv4相比,所提出的方法的检测结果示例。此外,图5显示了与基线相比,所提出的集成架构的检测结果示例。

b) 阳光明媚→ 雨:我们介绍了在Waymo数据集上应用YOLOv4和我们的MS-DAYOLO框架的结果,该数据集包括两组被指定为“晴天”和“雨天”的视觉数据。我们提取了14319张“晴朗天气”标记图像作为源数据,13004张“下雨天气”未标记图像作为目标数据。如前所述,仅使用源数据(即标记的阳光图像)来训练原始YOLOv4。同时,我们提出的MS-DAYOLO是使用源和目标数据(即标记的晴天图像和未标记的雨天图像)进行训练的。此外,我们从降雨天气数据中提取了1676张标记图像进行测试和评估。重要的是要注意以下关于Waymo数据集的关键观察结果:(a)“晴天”和“雨天”图像的名称由Waymo数据集中的提供商确定。(b) 根据我们处理这些数据的丰富经验,晴天和雨天图像样本之间的区别是非常主观的,在许多情况下,人们可以认为“雨天”图像样本应该被标记为“晴天”,反之亦然。因此,如图6中的示例所示,这两个域(被指定为“晴天”和“雨天”)之间的域偏移并不是很显著。这一点至关重要,因为使用Waymo“晴天”数据集训练原始YOLOv4有效地覆盖了源“晴天”域内的大量“雨天”测试样本。然而,我们选择遵循数据集的指定,目的是评估所提出的MS-DAYOLO框架可能提供的任何潜在改进。

结果总结在表III中。很明显,尽管在这种情况下,晴天和雨天这两个领域有很大的重叠,但MS-DAYOLO框架仍然提供了良好的改进。这可以解释为什么在城市景观数据上应用MS-DAYOLO时,这些改进不如所实现的改进那么显著,城市景观数据由两个明显不同的领域组成,如图1的示例所示。此外,类似于→ 在雾实验中,我们观察到,当应用于Waymo数据集时,所提出的渐进特征约简(PFR)、无人分类器(UC)和集成架构相对于基线架构提高了检测性能。对于这个实验,我们没有报告其他基于Faster R-CNN的域自适应目标检测方法的性能,因为这些方法都没有报告或使用Waymo数据集来检测阳光→ 雨区转移场景。图7显示了与原始YOLOv4相比,所提出的集成MS-DAYOLO框架的检测结果示例。此外,图8显示了集成架构成功检测到目标,而基线架构未能检测到相同目标的检测结果示例。此外,图9显示了基线架构存在误报情况的示例,而集成架构消除了这些误报,这有助于提高其性能。                

C.消融研究

为了表明将域自适应应用于骨干网络的三个不同规模的重要性。首先,我们分别将领域自适应应用于YOLOv4架构颈部的三个特征尺度中的每一个。此外,我们同时将领域自适应应用于两个尺度的不同组合。最后,我们将研究结果与将这些研究组合应用于所有三个量表的性能进行了比较,如第III-B节所述。这项消融研究的另一个重要方面是,我们希望考虑具有统计显著数量样本数据的对象。在这种情况下,由于某些类别(卡车、公共汽车和火车)的标签目标数量较少(即训练集中少于500个,测试集中少于100个),因此这些类别的性能测量将是不准确的。因此,我们在本消融研究中排除了它们,并根据其余类别计算mAP。表IV总结了消融研究的结果。很明显,基于这些结果,我们可以得出结论,将域自适应应用于所有三个特征尺度可以提高目标域的检测性能,并获得最佳结果。

D.分析 为了显示使用统一的域分类器而不是三个不同的域分类器的好处,我们记录了方程1在KITTI的训练迭代中的域分类器损失→ 城市景观实验。图10显示了在前2500次训练迭代中,与基线架构的特征F1、F2和F3相对应的三个域分类器的损失。我们可以看到,在1K迭代之后,损失是不同的。这意味着分类器的性能不一致,从而导致性能下降。这促使我们在所有三个尺度上采用统一的领域分类器。反过来,这导致了当应用于目标域数据时用于提高检测性能的UC架构,如表I、表II和表III所示。 此外,为了研究DAN的领域分类损失与检测性能之间的关系,我们在训练过程中进行了时间分析。我们在图11中绘制了集成架构的域分类器(DC)损失和KITTI的mAP检测性能→ 城市景观实验。我们将mAP标准化100,以与DC损失相同的比例绘制它。在训练开始时,我们发现DC损失开始于其最高值,约为0.745。然后,随着训练的进行,DAN通过最小化损失来优化,而YOLO骨干通过最大化损失来优化。换言之,丹和YOLO骨干相互竞争。从图中,我们观察到检测性能继续提高,直到损耗大约达到0.6左右。之后,性能几乎保持不变,因为随着DC损耗变小,DAN对主干的影响不会很大。

5、结论

在本文中,我们为流行的最先进的实时目标检测器YOLO提出了一个多尺度域自适应框架。具体而言,在我们的MS-DAYOLO架构下,我们将域自适应应用于YOLO特征提取器中的三个不同尺度的特征,这些特征被馈送到下一阶段。除了多尺度域自适应网络的基线架构外,我们还开发了三种不同的深度学习架构,以产生更稳健的域不变特征,从而减少域偏移的影响。所提出的架构包括渐进特征约简(PFR)、统一域分类器(UC),以及结合渐进特征约简和统一分类器策略的优点以提高目标域下的整体检测性能的集成架构。基于各种实验结果,我们提出的MS-DAYOLO框架可以在没有注释的情况下成功地将YOLO适配到目标域。此外,在自动驾驶应用的不同测试场景下,所提出的MS-DAYOLO架构优于最先进的YOLOv4和其他基于更快R-CNN目标检测器的令人兴奋的方法。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 摘要
  • 1、介绍
  • 2、相关工作
  • 3、提出的多尺度域适配YOLO
    •  A、域适配YOLO
    •  B、DAN结构
    • 4、实验
      • B、结果
        • C.消融研究
        • 5、结论
        领券
        问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档