前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >论文阅读理解 - ResNeXt - Aggregated Residual Transformations for DNN

论文阅读理解 - ResNeXt - Aggregated Residual Transformations for DNN

作者头像
AIHGF
修改2020-06-12 15:08:09
1.4K0
修改2020-06-12 15:08:09
举报
文章被收录于专栏:AIUAIAIUAI

ResNeXt - Aggregated Residual Transformations for Deep Neural Networks

[Paper]

[Code-Torch]

[Code-PyTorch]

[Code-Keras]

[Code-Caffe]

[Code-Tensorflow]

摘要: 高度模块化的网络结构,用于图像分类; 通过重复 build block 来构建网络,每个 build block 聚合了具有相同拓扑结构的变换集; ResNeXt中,同类、multi-branch 结构的设计具有更少的参数. 引入了新的维度,即 Cardinality(涉及的变换集的尺寸),作为网络 depth 和 width 维度之外的一种必要因子. 特点:

  • 基于 ImageNet-1K 数据集,实验结果表明,在严格保证计算复杂度时,增加 Cardinality 能够提高图像分类精度;且,增加 Cardinality 比加深或者加宽网络结构更有效.
  • 与 ResNet 相比,相同的精度, ResNeXt 计算量更少,参数更少. ResNeXt-50 接近 ResNet-101 的准确度.
  • ResNeXt 网络模块化设计更合理,结构更简单,超参数量更少.

VGG-nets/ResNets: 堆叠相同形状的网络 building blocks;—— 网络 depth

Inceptions:split-transform-merge,将输入采用(1×1 Conv)分裂为几个低维 embedding,再经过一系列特定 filters (如3×3,5×5)的变换,最后连接在一起.

ResNeXt:采用 VGGs/ResNets 的网络的 depth 加深方式,同时利用 split-transform-merge 策略.

1. Simple Neurons 回顾

这里写图片描述
这里写图片描述

2.1 ResNet-50 && ResNeXt-50

这里写图片描述
这里写图片描述

Figure 1. Left - ResNet 的一个 block;Right - ResNeXt 的一个块,Cardinality=32. 二者复杂度相同.(#in_channels, #filter_size,#out_channels).

  • 如果 spatial maps 是相同尺寸,blocks 共享相同的参数(width 和 filter sizes)
  • 每次当 spatial map 基于因子 2 进行下采样时,blocks 的 width 乘上因子 2.
这里写图片描述
这里写图片描述

ResNeXt 保留 ResNet 的堆叠 block,而是对单个 building block 改进.

2.2 ResNeXt && Inception-ResNet && Grouped Convolutions

这里写图片描述
这里写图片描述

Figure 3. ResNeXt building blocks 的等价形式. (a) Figure 1 Right 的 Aggregated transformations;(b) 采用提前进行加法操作的等价形式;(c) 采用 grouped conv 的等价形式.

Grouped Convolutions:group conv 层中,输入和输出的 channels 被分为 CCC 个 groups,分别对每个 group 进行 conv.

ResNeXt 只能在 block 的 depth>3时使用. 如果 block 的 depth=2,则会得到宽而密集的模块.

这里写图片描述
这里写图片描述

2.3 参数

这里写图片描述
这里写图片描述

3. Results

这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述

4. 基于 ResNeXt 的 Faster R-CNN 实现

  • 采用 Faster R-CNN框架;
  • 不共享 RPN 和 Fast R-CNN 的特征;
    • RPN 阶段,在 8-GPUs 上训练,每个 GPU min-batch为 2 张图片,每张图片 256 个 anchors;
    • RPN 训练阶段,前 120k mini-batches 的学习率为 learning_rate=0.02,后面 60K mini-batches 学习率为 learning_rate=0.002;
    • Fast R-CNN 阶段,在 8-GPUs 上训练,每个 GPU 1张图片,每个 mini-batch 64 个regions;
    • Fast R-CNN 训练阶段,前120k mini-batches 的学习率为 learning_rate=0.005,后面 60K mini-batches 学习率为 learning_rate=0.0005;
    • weight_decay=0.0001,momentum=0.9.
  • 其它实现类似于 Faster R-CNN.

4.1 COCO 目标检测

这里写图片描述
这里写图片描述

5 Reference

[1] - ResNeXt算法详解 [2] - ResNext与Xception——对模型的新思考

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2017年12月20日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • ResNeXt - Aggregated Residual Transformations for Deep Neural Networks
    • 1. Simple Neurons 回顾
      • 2.1 ResNet-50 && ResNeXt-50
        • 2.2 ResNeXt && Inception-ResNet && Grouped Convolutions
        • 2.3 参数
      • 3. Results
        • 4. 基于 ResNeXt 的 Faster R-CNN 实现
          • 4.1 COCO 目标检测
        • 5 Reference
        领券
        问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档