前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >人体姿态估计--Learning Feature Pyramids for Human Pose Estimation

人体姿态估计--Learning Feature Pyramids for Human Pose Estimation

作者头像
用户1148525
发布2019-05-26 11:43:58
4100
发布2019-05-26 11:43:58
举报

Learning Feature Pyramids for Human Pose Estimation ICCV2017 Torch: https://github.com/bearpaw/PyraNet

本文主要关注人体部件中的尺度问题, scale variations of human body parts, 这种尺度变化主要发生在 camera view changes or severe foreshortening happens

提出的解决思路是 learning feature pyramids,设计了 Pyramid Residual Module (PRMs) 来增强 CNN 网络对尺度信息的提取能力。同时我们发现在 initialize the weights of multi-branch networks 存在问题 以及 the problem of activation variance accumulation introduced by identity mapping may be harmful in some scenarios, 对于这两个问题我们分别提出解决的方法。

3 Framework

3.1. Revisiting Stacked Hourglass Network

这里写图片描述
这里写图片描述

在每一个 stack hourglass” network 的末端我们加入了 intermediate supervision

3.2. Pyramid Residual Modules (PRMs) 这里我们设计了四个 PRMs 结构

这里写图片描述
这里写图片描述

我们的 PRM 可以作为 CNN 网络的一个基础模块,用于人体姿态估计 或 图像分类

4.1. Initialization Multi-Branch Networks

Existing weight initialization methods [33, 21, 24] are designed upon the assumption of a plain networks without branches 我们使用了 Multi-Branch Networks,所以现有的初始化策略不太适用,这里经过理论上的推导,我们得出的结论是:

the number of input branches and output branches should be taken into consideration when initializing parameters.

4.2. Output Variance Accumulation identity mappings 的引入让我们的网络层数可以增加很多,但是同时也引入了问题: identity mapping keeps increasing the variances of responses when the network goes deeper, which increases the difficulty of optimization

怎么解决这个问题了? 使用 BN-ReLU-Conv block 替换 identity mappings

这里写图片描述
这里写图片描述

5 Experiments

这里写图片描述
这里写图片描述

注意 使用和没使用 PRMs 的性能对比就是 文献【39】和 Ours 的对比

这里写图片描述
这里写图片描述

用于图像分类

这里写图片描述
这里写图片描述
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2018年03月12日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档