前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Face++张祥雨&孙剑新作WeightNet,高性能涨点并将SENet与CondConv进行统一

Face++张祥雨&孙剑新作WeightNet,高性能涨点并将SENet与CondConv进行统一

作者头像
AIWalker
发布2020-07-31 17:03:27
6030
发布2020-07-31 17:03:27
举报
文章被收录于专栏:AIWalkerAIWalker

【Happy导语】该文是Face++的研究员提出了一种更通用的、“即插即用”、高性能涨点网络WeightNet,它将SENet与CondConv统一到了同一个空间中。该文属于动态滤波器卷积(即自注意力机制)的范畴,对这个点感兴趣的同学可以深入研究一下。我肯定不会告诉你笔者之前已经尝试过类似大同小异的探索与思考。推荐指数五颗星。

关键词:网络架构、动态滤波器、注意力机制 Paper: https://arxiv.org/abs/2007.11823

Code: https://github.com/megvii-model/WeightNet

Abstract

作者提出一种简单、灵活而有效的框架用于权值生成。该方法是一种通用方法,它将两种独立且非常有效的方法SENet与CondConv纳入到相同框架中。所提方法称之为WeightNet,它通过简单的添加一个额外的组全连接层到注意力激活层得到上述两类方案。WeightNet由全连接层构成并直接输出卷积权值,它即机制简单且易于训练。由于其灵活性,所提方法在ImageNet与COCO均取得了更好的精度-FLOPs和精度-参数均衡。

Method

本文所提WeightNet可以在权值空间角度生成当前两个非常有效的模块:SE与CondConv。下图给出了如何通过WeightNet生成SENet与CondConv的过程示意图。看到这个图后,大家应该可以轻松的将WeightNet与SENet相关联。

其实SENet与CondConv两个都属于注意力机制的范畴,SENet特征层面的注意力机制,而CondConv则属于权值层面的注意力机制。可能之前鲜少有人去研究两者之间是否可以在相同的空间去刻画,而WeightNet就是对此的一个探索。

WeightNet包含GAP操作,故而计算高效。除了GAP外,WeightNet还包含组全连接层操作。下图给出了全连接层示意图以及组全连接层示意图。

上图给出了WeightNet、SENet与WeightNet的区别与联系示意图。可以看到:CondConv与SENet是WeightNet的特例。

在WeightNet中,作者引入了两个参数M和G进行更好的扩展性分析。下表也给出了CondConv、SENet与WeightNet的更进一步区别与联系。注:M用于控制输入数量,G用于控制组数。

Experiments

为验证所提方法的有效性,作者在ImageNet与COCO数据上的进行了验证分析,baseline为ShuffleNetV2和ResNet50。直接上结果咯。

下图给出了不同配置上WeightNet模块添加前后的性能对比,可以看到所提方法取得了更好的精度-FLOPs的均衡。

作者同时还给出了所提方法与其他注意力机制的性能对比,见下图。

下表给COCO检测任务上的性能对比。

最后作者还给出了消融实验分析,见下面几个图。

全文到底结束,更多实验结果建议去查看原文。

Conclusion

该文针对SENet与CondConv这两种简单而有效的方法进行了分析,并在权值空间进行了桥接,从而提出了一种更通用型的方案WeightNet。通过调整WeightNet与的两个超参数,可以得到更好的精度-FLOPs均衡。

题外话

最后吐槽一下,文中的图示Fig4。这个图不太容易理解,添加一下不同的颜色会更好,希望该文作者看到可以调整一下这个图,另外代码应该是有问题的。。

从笔者的角度来看,虽然该文对SENet以及CondConv进行了统一并得到了WeightNet,但挖掘的深度还是稍显不足。还有更近一步挖掘的空间,还可以在WeightNet的基础上引入PostionNet,做成BilaterNet。从这个角度来看,BilateralNet可以将更多的方法纳入到一个更统一的空间,包含但不限于SENet、CondConv、SAN、CAFAFE、MetaSR等。思路已经提出来了,而且笔者也进行了初步的有效性验证,更深入的探索与分析就留给感兴趣的同学去研究咯,感兴趣者也可以后台留言一起讨论哈。

论文与代码下载

在AIWalker公众号后台回复:WeightNet。即可获得上述论文与代码下载链接。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-07-25,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AIWalker 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Abstract
  • Method
  • Experiments
  • Conclusion
  • 题外话
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档