首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

目标检测(object detection)系列(九) YOLOv3:取百家所长成一家之言

YOLOv3原理 设计理念 相比于YOLOv2,YOLOv3主要有下面几个改动: YOLOv3的主干网络又变了,设计了基础网络结构Darknet-53; YOLOv3终于加入多层分支了,一共拉取了三层;...YOLOv3选择了更多的archor box先验; YOLOv3类别损失换了,由SoftMax换成了Logistic。...用了三个指标说明Darknet-53好,分别是Bn Ops,BFLOP/s和FPS,一般情况下分类网络都只用一个指标说明网络的计算量那就是FLOPs或MFLOPs,但是YOLOv3用了三个。...而且,这里的Bn Ops的计算方式和常规操作不一样,一般情况下网络去统计FLOPs是不算加操作的,所以在ResNet的原始论文中,ResNet-101和ResNet-152的算力分别是7.6×1097.6...\times10^97.6×109FLOPs和11.3×10911.3\times10^911.3×109FLOPs,折算到Bn Ops应该分别是7.6Bn Ops和11.3Bn Ops,但是上表中给出的是

5.9K51
您找到你想要的搜索结果了吗?
是的
没有找到

卷积操作的参数量和FLOPs

卷积操作的参数量和FLOPs   这里首先需要辨析一个概念就是FLOPsFLOPS可以看到简写的差别仅仅是一个字母大小写的区别。   ...FLOPS(floating-point operations per second),这个缩写长这个样子确实也很奇怪,大致概念就是指每秒浮点数运算次数,最后一个S是秒(second)的缩写,是计组中的概念...FLOPs(floating-point operations),一旦s变为小写,就表示复数的概念,就是浮点数运算次数,这就和计算量相关了,和卷积或者其他算法联系起来基本上就表示计算次数,可用来衡量操作的复杂程度...衡量计算量除了FLOPs外还有一种概念是求MACs(Multiply Accumulate)乘积累加运算次数,一次乘积,然后把这个乘积和另外一个数求和就叫一次MAC,显然与上面计算结果的关系就在于是否要乘

54910

【综述】Pytorch YOLO项目推荐 建议收藏学习

YOLOv3中的代码配置和数据集构建 【从零开始学习YOLOv3】3. YOLOv3的数据加载机制和增强方法 【从零开始学习YOLOv3】4....对于该数据集,对 YOLOv3 进行 channel pruning 之后,模型的参数量、模型大小减少 80% ,FLOPs 降低 70%,前向推断的速度可以达到原来的 200%,同时可以保持 mAP...部分卷积层的通道数大幅度减少 剪枝前后指标对比: 参数数量 模型体积 Flops 前向推断耗时(2070 TI) mAP Baseline (416) 61.5M 246.4MB 32.8B 15.0...剪枝前后模型的参数量、模型大小降为原来的 1/6 ,FLOPs 降为原来的 1/3,前向推断的速度可以达到原来的 2 倍,同时可以保持 mAP 基本不变。...作者对YOLOv3的卷积层通道剪枝(以通道级稀疏化),大幅削减了模型的计算量(~90.8% decrease of FLOPs)和参数量( ~92.0% decline of parameter size

1.6K21

专栏 | 【综述】Pytorch YOLO项目推荐 建议收藏学习

YOLOv3中的代码配置和数据集构建 【从零开始学习YOLOv3】3. YOLOv3的数据加载机制和增强方法 【从零开始学习YOLOv3】4....对于该数据集,对 YOLOv3 进行 channel pruning 之后,模型的参数量、模型大小减少 80% ,FLOPs 降低 70%,前向推断的速度可以达到原来的 200%,同时可以保持 mAP...部分卷积层的通道数大幅度减少 剪枝前后指标对比: 参数数量 模型体积 Flops 前向推断耗时(2070 TI) mAP Baseline (416) 61.5M 246.4MB 32.8B 15.0...剪枝前后模型的参数量、模型大小降为原来的 1/6 ,FLOPs 降为原来的 1/3,前向推断的速度可以达到原来的 2 倍,同时可以保持 mAP 基本不变。...作者对YOLOv3的卷积层通道剪枝(以通道级稀疏化),大幅削减了模型的计算量(~90.8% decrease of FLOPs)和参数量( ~92.0% decline of parameter size

1.2K20

目标检测(object detection)系列(九) YOLOv3:取百家所长成一家之言

YOLOv3原理 设计理念 相比于YOLOv2,YOLOv3主要有下面几个改动: YOLOv3的主干网络又变了,设计了基础网络结构Darknet-53; YOLOv3终于加入多层分支了,一共拉取了三层;...YOLOv3选择了更多的archor box先验; YOLOv3类别损失换了,由SoftMax换成了Logistic。...用了三个指标说明Darknet-53好,分别是Bn Ops,BFLOP/s和FPS,一般情况下分类网络都只用一个指标说明网络的计算量那就是FLOPs或MFLOPs,但是YOLOv3用了三个。...而且,这里的Bn Ops的计算方式和常规操作不一样,一般情况下网络去统计FLOPs是不算加操作的,所以在ResNet的原始论文中,ResNet-101和ResNet-152的算力分别是 FLOPs和...FLOPs,折算到Bn Ops应该分别是7.6Bn Ops和11.3Bn Ops,但是上表中给出的是19.7Bn Ops和29.4Bn Ops,这是因为计算的时候包含了加操作,而Darknet-53

33520

YOLOv3模型剪枝,瘦身80%,提速100%,精度基本不变

在52CV目标检测交流群里,被提及最多的,恐怕就是YOLOv3了。 虽然新出的一些算法号称“完胜”“吊打”某某某算法,但YOLOv3 仍是被推荐最多的。...另一个重要原因是,YOLOv3是被很多人使用验证过的模型,被某个数据库验证过的某算法精度好很重要,但被社区大量验证过效果OK的算法更重要。...今天向大家推荐一个Github新工程,对YOLOv3进行模型剪枝: https://github.com/Lam1360/YOLOv3-model-pruning 这份代码是基于Python 3.6,...作者用 YOLOv3 做人手检测(在 oxford hand 数据集上训练的),并进行了模型剪枝,剪枝后YOLOv3 模型的参数量减少 80% ,FLOPs 降低 70%,推断的速度提高了100%,而

71020

模型FLOPs很低,推理速度却很慢?

然后是EfficientNet很低的FLOPs却伴随着较高的推理时间,比如B3版本的FLOPs不到ResNet50的一半,推理速度却是ResNet50的两倍。...今天主要谈一下FLOPs与模型推理速度的关系,为什么有些模型FLOPs很低,以EfficientNet为代表,其推理速度却很慢。 首先感谢飞哥的科普: 大部分时候,对于GPU,算力瓶颈在于访存带宽。...同时在feature的空间位置上逐元素重复,总的FLOPs为:3*3*10000*56*56。卷积核参数总量为:3*3*1*10000。 可以看到,两个layer的FLOPs和参数量完全相同。...因此EfficientNet可以声称自己是低FLOPs,但不得不说,这是一种“FLOPs假象”。...同时略“讽刺”的是,同等FLOPs情况下,RegNet跟EfficientNet比较“推理速度”,确实提升了5倍,但这其实相当于利用depthwise卷积低FLOPs高数据访存量的弱点,反过来打EfficientNet

4.1K30

YOLOv3模型剪枝,瘦身80%,提速100%,精度基本不变

在52CV目标检测交流群里,被提及最多的,恐怕就是YOLOv3了。 虽然新出的一些算法号称“完胜”“吊打”某某某算法,但YOLOv3 仍是被推荐最多的。...另一个重要原因是,YOLOv3是被很多人使用验证过的模型,被某个数据库验证过的某算法精度好很重要,但被社区大量验证过效果OK的算法更重要。...今天向大家推荐一个Github新工程,对YOLOv3进行模型剪枝: https://github.com/Lam1360/YOLOv3-model-pruning 这份代码是基于Python 3.6,...作者用 YOLOv3 做人手检测(在 oxford hand 数据集上训练的),并进行了模型剪枝,剪枝后YOLOv3 模型的参数量减少 80% ,FLOPs 降低 70%,推断的速度提高了100%,而

3.6K00

目前精度最高效率最快存储最小的目标检测模型(附源码下载)

特别地,是在单模型和单比例尺的情况下,EfficientDet-D7在52M参数和325B FLOPs的情况下,实现了map在 COCO数据集的最高水平(52.2),比之前最好的检测器更小,使用更少的FLOPs...Yolov3: An incremental improvement. arXiv preprint arXiv:1804.02767, 2018;Shaoqing Ren, Kaiming He, Ross...将有效的网络骨架与作者提出的BiFPN和复合缩放相结合,开发了一个新的目标检测器集合,称为EfficientDet,它始终以比以前的目标检测器更少的参数和FLOPs来获得更好的精度。...在类似的Accuracy约束下,EfficinetDet使用的FLOPSYOLOv3少28倍,比RetinaNet少30倍,FLOPs比最近基于ResNet的NAS-FPN少19倍。...Learning data aug- mentation strategies for object detection],同时更小4倍,使用13倍的FLOPs

81540

YOLOv3 精度再次提高 4.3%,训练提速 40%!PaddleDetection全面升级

使用裁剪模型压缩方案大幅降低FLOPs 裁剪策略可以通过分析各卷积层的敏感度得到各卷积核的适宜裁剪率,通过裁剪卷积层通道数来减少卷积层中卷积核的数量,实现减小模型体积,降低模型计算复杂度的作用。...实验表明以ResNet50vd-dcn-YOLOv3为例,在COCO数据集上FLOPS降低了8.4%,mAP提高了0.7%;MobileNet-YOLOv3在COCO数据集上FLOPS降低了28.54%...,mAP提高了0.9%;在Pascal VOC数据集上FLOPs降低了69.57%,mAP提高了1.4%。...当裁剪的FLOPs减少超过50%时,在手机上的耗时减少57%,即加速2.3倍,裁剪的模型在GPU上也有一定的收益。 ?...该方案中使用了PaddleDetection的目标检测模型YOLOv3,并使用了YOLOv3的压缩方案进行部署,可以实现定时拍照、数据收集、智能分析、自动上报等功能。

1.1K10

PPYOLO:2020不容错过的目标检测调参Tricks

网络架构 3.1.1 BackBone骨干网络 yolov3使用的是较为大型的darknet53,考虑到resnet更广泛的应用以及多样化的分支,我们选用ResNet50-vd作为整个架构,并将部分卷积层替换成可变形卷积...关于DropBlock可以看我们写的这篇文章:【科普】神经网络中的随机失活方法 3.2.4 IOU Loss 在yolov3中使用的是smooth L1 Loss来对检测框做一个回归,但这个Loss并不适合以...我们增加了一个额外的IOU预测分支来去衡量检测框定位的准确度,额外引入的参数和FLOPS可以忽略不计 3.2.6 GRID Sensitive 原始Yolov3对应中间点的调整公式如下 ?...为了平衡带来的额外参数和FLOPS,我们只替换掉FPN的1x1卷积层以及detection head的第一层卷积 3.2.9 SPP 空间金字塔池化结构是广泛应用的一种结构 引入{1, 5, 9, 13...}这几种大小的最大池化 该结构不会引入参数,但是会增加后续卷积的输入通道,引入了2%的参数和1%的FLOPS 3.2.10 更好的预训练模型 显然更好的预训练模型在分类任务上能取得更好的效果,后续我们也会进行替换

2.6K40
领券