前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >行人姿态估计

行人姿态估计

作者头像
用户1148525
发布2019-05-26 12:05:07
5500
发布2019-05-26 12:05:07
举报
文章被收录于专栏:机器学习、深度学习

Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields CVPR 2017 Code: https://github.com/ZheC/Realtime_Multi-Person_Pose_Estimation 效果演示视频: https://youtu.be/pW6nZXeWlGM 如果可以看youtu 的话

多人姿态实时估计,这里主要亮点还是 多人实时+效果

感兴趣的可以看看相关文献: Convolutional Pose Machines CVPR2016 http://blog.csdn.net/shenxiaolu1984/article/details/51094959

本文算法主要流程如下:

这里写图片描述
这里写图片描述

输入一幅图像,经过卷积网络提取特征,得到一组特征图,然后分成两个岔路,分别使用 CNN网络提取Part Confidence Maps 和 Part Affinity Fields ,得到这两个信息后,我们使用图论中的 Bipartite Matching 将同一个人的关节点连接起来得到最终的结果。

Part Affinity Fields 示意图:

这里写图片描述
这里写图片描述

两个分叉的CNN网络如下图所示:

这里写图片描述
这里写图片描述

a set of feature maps F ,confidence maps S,Part Affinity Fields L。 上面是一个迭代优化过程

这里写图片描述
这里写图片描述

为什么使用 Part Affinity Fields ?

这里写图片描述
这里写图片描述

Graph matching

这里写图片描述
这里写图片描述

结果对比:

这里写图片描述
这里写图片描述

COCO 2016 keypoint challenge:

这里写图片描述
这里写图片描述

有问题的图片:

这里写图片描述
这里写图片描述

时间分析: GTX-1080 GPU The original frame size is 1080×1920, which we resize to 368×654 during testing to fit in GPU memory

Our method has achieved the speed of 8.8 fps for a video with 19 people.

for 9 people, the parsing takes 0.58 ms while CNN takes 99.6 ms

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2017年04月21日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档