首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >YoloV8改进策略:Hiera改进YoloV8,实现精度和速度的双提升!

YoloV8改进策略:Hiera改进YoloV8,实现精度和速度的双提升!

作者头像
AI浩
发布2024-10-22 12:19:59
发布2024-10-22 12:19:59
15900
代码可运行
举报
文章被收录于专栏:AI智韵AI智韵
运行总次数:0
代码可运行

论文:《Hiera:一个没有花哨的分层视觉转换器》

https://arxiv.org/pdf/2306.00989.pdf 现代分层视觉转换器在追求监督分类性能时增加了几种视觉特定组件。 虽然这些组件可以提高准确性和吸引人的浮点运算次数,但增加的复杂性实际上使这些转换器比普通ViT转换器慢。 在本文中,我们认为这种额外的复杂性是不必要的。 通过使用强大的视觉预训练任务(MAE)进行预训练,我们可以从最先进的视觉转换器中去除所有花里胡哨的东西,同时不会丢失准确性。 在此过程中,我们创建了Hiera,这是一种极其简单的分层视觉转换器,它比以前的模型更准确,同时在推理和训练过程中速度更快。 我们在各种图像和视频识别任务上评估了Hiera。 我们的代码和模型可以在https://github.com/facebookresearch/hiera上找到。

完整链接:

代码语言:javascript
代码运行次数:0
运行
复制
https://jingjing.blog.csdn.net/article/details/134578172?spm=1001.2014.3001.5502

YoloV8的官方结果

代码语言:javascript
代码运行次数:0
运行
复制
YOLOv8l summary (fused): 268 layers, 43631280 parameters, 0 gradients, 165.0 GFLOPs
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 29/29 [
                   all        230       1412      0.922      0.957      0.986      0.737
                   c17        230        131      0.973      0.992      0.995      0.825
                    c5        230         68      0.945          1      0.995      0.836
            helicopter        230         43       0.96      0.907      0.951      0.607
                  c130        230         85      0.984          1      0.995      0.655
                   f16        230         57      0.955      0.965      0.985      0.669
                    b2        230          2      0.704          1      0.995      0.722
                 other        230         86      0.903      0.942      0.963      0.534
                   b52        230         70       0.96      0.971      0.978      0.831
                  kc10        230         62      0.999      0.984       0.99      0.847
               command        230         40       0.97          1      0.995      0.811
                   f15        230        123      0.891          1      0.992      0.701
                 kc135        230         91      0.971      0.989      0.986      0.712
                   a10        230         27          1      0.555      0.899      0.456
                    b1        230         20      0.972          1      0.995      0.793
                   aew        230         25      0.945          1       0.99      0.784
                   f22        230         17      0.913          1      0.995      0.725
                    p3        230        105       0.99          1      0.995      0.801
                    p8        230          1      0.637          1      0.995      0.597
                   f35        230         32      0.939      0.938      0.978      0.574
                   f18        230        125      0.985      0.992      0.987      0.817
                   v22        230         41      0.983          1      0.995       0.69
                 su-27        230         31      0.925          1      0.995      0.859
                 il-38        230         27      0.972          1      0.995      0.811
                tu-134        230          1      0.663          1      0.995      0.895
                 su-33        230          2          1      0.611      0.995      0.796
                 an-70        230          2      0.766          1      0.995       0.73
                 tu-22        230         98      0.984          1      0.995      0.831
Speed: 0.2ms preprocess, 3.8ms inference, 0.0ms loss, 0.8ms postprocess per image


改进一

测试结果

代码语言:javascript
代码运行次数:0
运行
复制
YOLOv8l summary: 364 layers, 35794608 parameters, 0 gradients, 144.6 GFLOPs
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 15/15 [00:02<00:00,  6.48it/s]
                   all        230       1412      0.971      0.982      0.993      0.763
                   c17        230        131       0.99      0.992      0.995       0.85
                    c5        230         68      0.956          1      0.995      0.864
            helicopter        230         43      0.964      0.977      0.983      0.617
                  c130        230         85          1      0.984      0.995       0.67
                   f16        230         57      0.996      0.965      0.992      0.694
                    b2        230          2       0.91          1      0.995      0.851
                 other        230         86          1      0.974      0.978      0.567
                   b52        230         70      0.986      0.978      0.989       0.87
                  kc10        230         62          1      0.983       0.99      0.856
               command        230         40      0.993          1      0.995       0.82
                   f15        230        123      0.993      0.976      0.995      0.704
                 kc135        230         91      0.989      0.979      0.992       0.71
                   a10        230         27          1      0.761      0.989      0.474
                    b1        230         20      0.987          1      0.995      0.717
                   aew        230         25      0.951          1      0.995      0.789
                   f22        230         17      0.983          1      0.995      0.774
                    p3        230        105      0.999          1      0.995      0.812
                    p8        230          1      0.848          1      0.995      0.796
                   f35        230         32          1      0.962      0.995      0.567
                   f18        230        125      0.991      0.992       0.99      0.847
                   v22        230         41      0.993          1      0.995      0.724
                 su-27        230         31       0.99          1      0.995      0.874
                 il-38        230         27      0.989          1      0.995      0.863
                tu-134        230          1      0.826          1      0.995      0.895
                 su-33        230          2          1          1      0.995      0.697
                 an-70        230          2      0.897          1      0.995      0.854
                 tu-22        230         98      0.999          1      0.995      0.844

运算量下降,精度提升!!!

改进二

测试结果

代码语言:javascript
代码运行次数:0
运行
复制
YOLOv8l summary (fused): 277 layers, 46783152 parameters, 0 gradients, 172.5 GFLOPs
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 15/15 [00:02<00:00,  5.55it/s]
                   all        230       1412      0.962      0.973      0.992       0.75
                   c17        230        131      0.979      0.992      0.995      0.826
                    c5        230         68      0.958      0.995      0.994      0.841
            helicopter        230         43      0.977      0.972      0.982      0.614
                  c130        230         85          1       0.99      0.995      0.656
                   f16        230         57      0.991      0.965      0.992      0.674
                    b2        230          2      0.887          1      0.995      0.648
                 other        230         86      0.949      0.942      0.974      0.538
                   b52        230         70      0.986      0.979      0.989      0.845
                  kc10        230         62      0.993      0.984      0.989       0.84
               command        230         40      0.989          1      0.995       0.85
                   f15        230        123      0.973      0.992      0.994      0.715
                 kc135        230         91      0.976      0.989      0.992      0.712
                   a10        230         27          1      0.586      0.967      0.523
                    b1        230         20          1      0.967      0.995      0.722
                   aew        230         25      0.922          1      0.995       0.79
                   f22        230         17       0.98          1      0.995      0.778
                    p3        230        105      0.992          1      0.995      0.809
                    p8        230          1      0.816          1      0.995      0.697
                   f35        230         32      0.968      0.932      0.992      0.573
                   f18        230        125      0.989      0.992      0.992      0.844
                   v22        230         41      0.992          1      0.995      0.734
                 su-27        230         31      0.989          1      0.995       0.86
                 il-38        230         27      0.987          1      0.995      0.854
                tu-134        230          1      0.806          1      0.995      0.995
                 su-33        230          2          1          1      0.995      0.734
                 an-70        230          2      0.879          1      0.995      0.751
                 tu-22        230         98      0.996          1      0.995      0.833
Speed: 0.2ms preprocess, 4.8ms inference, 0.0ms loss, 0.7ms postprocess per image
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-01-22,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AI智韵 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 论文:《Hiera:一个没有花哨的分层视觉转换器》
  • YoloV8的官方结果
  • 改进一
    • 测试结果
  • 改进二
    • 测试结果
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档