提出了一种算法,用于生成任意尺寸卷积核的初始采样坐标。与常规卷积核相比,提出的AKConv实现了不规则卷积核的函数来提取特征,为各种变化目标提供具有任意采样形状和尺寸的卷积核,弥补了常规卷积的不足。在COCO2017和VisDrone-DET2021上进行目标检测实验,并进行了比较实验。结果表明,提出的AKConv方法在目标检测方面具有更好的性能。
链接:
https://jingjing.blog.csdn.net/article/details/134715790?spm=1001.2014.3001.5502
在目标检测方面,本文提出的AKConv方法相比常规卷积有以下优势:
综上所述,本文提出的AKConv方法在目标检测方面相比常规卷积具有更高的灵活性、参数和计算效率以及网络性能优化等优势。这些优势有助于提高目标检测的准确性和效率,为计算机视觉领域的发展提供新的思路和方法。
Class Images Labels P R mAP@.5 mAP@.5:.95: 100%|██████████| 15/15 [00:02<00:00, 5.42it/s]
all 229 1407 0.979 0.977 0.993 0.736
c17 229 131 0.99 1 0.996 0.841
c5 229 68 0.962 1 0.996 0.839
helicopter 229 43 0.964 1 0.988 0.636
c130 229 85 1 0.997 0.997 0.671
f16 229 57 1 0.966 0.996 0.697
b2 229 2 0.948 1 0.995 0.647
other 229 86 1 0.914 0.994 0.562
b52 229 65 0.985 0.969 0.98 0.834
kc10 229 62 1 0.974 0.986 0.823
command 229 40 0.998 1 0.996 0.798
f15 229 123 1 0.979 0.997 0.659
kc135 229 91 0.988 0.989 0.987 0.679
a10 229 27 1 0.599 0.989 0.425
b1 229 20 0.994 1 0.997 0.741
aew 229 25 0.951 1 0.97 0.769
f22 229 17 0.993 1 0.996 0.742
p3 229 105 1 1 0.998 0.788
p8 229 1 0.921 1 0.995 0.498
f35 229 32 1 0.998 0.996 0.62
f18 229 125 0.987 0.992 0.995 0.816
v22 229 41 0.998 1 0.996 0.719
su-27 229 31 0.996 1 0.996 0.84
il-38 229 27 0.994 1 0.995 0.878
tu-134 229 1 0.866 1 0.995 0.995
su-33 229 2 0.965 1 0.995 0.647
an-70 229 2 0.94 1 0.995 0.896
tu-22 229 98 0.999 1 0.997 0.817
Class Images Labels P R mAP@.5 mAP@.5:.95: 100%|██████████| 29/29 [00:09<00:00, 3.13it/s]
all 229 1407 0.963 0.992 0.993 0.736
c17 229 131 0.986 0.992 0.996 0.822
c5 229 68 0.958 1 0.996 0.831
helicopter 229 43 0.949 1 0.982 0.632
c130 229 85 0.987 1 0.996 0.689
f16 229 57 0.99 0.965 0.993 0.685
b2 229 2 0.911 1 0.995 0.846
other 229 86 0.988 0.93 0.987 0.553
b52 229 65 0.978 0.969 0.968 0.817
kc10 229 62 1 0.979 0.986 0.821
command 229 40 0.988 1 0.996 0.817
f15 229 123 1 1 0.996 0.666
kc135 229 91 0.983 0.989 0.982 0.681
a10 229 27 0.992 0.963 0.995 0.467
b1 229 20 0.982 1 0.996 0.696
aew 229 25 0.946 1 0.99 0.785
f22 229 17 0.981 1 0.996 0.694
p3 229 105 0.997 1 0.997 0.803
p8 229 1 0.805 1 0.995 0.697
f35 229 32 0.99 1 0.996 0.575
f18 229 125 0.984 0.992 0.991 0.822
v22 229 41 0.991 1 0.996 0.68
su-27 229 31 0.986 1 0.996 0.824
il-38 229 27 0.988 1 0.996 0.838
tu-134 229 1 0.785 1 0.995 0.896
su-33 229 2 1 1 0.995 0.597
an-70 229 2 0.872 1 0.995 0.846
tu-22 229 98 0.996 1 0.997 0.8
Speed: 11.9/3.9/15.8 ms inference/NMS/total per 640x640 image at batch-size 8
本文尝试使用最新的卷积AKConv改进YoloV7,从实验的结果来看还是不错的。大家可以在自己的数据集上做尝试。