DCPose-CVPR2021-充分利用帧间信息的多人姿态估计 | 代码已开源

AI算法与图像处理

发布于 2021-03-26 14:43:31

1.1K0

发布于 2021-03-26 14:43:31

文章被收录于专栏：AI算法与图像处理

视频来源：

https://www.bilibili.com/video/BV1iy4y177Mf?from=search&seid=10675595845989092503

代码:https://github.com/Pose-Group/DCPose

我见了一个项目，以后会整理论文、代码和相关的demo在上面欢迎关注

https://github.com/DWCTOD/CVPR2021-Papers-with-Code-Demo

复杂情况下的多帧人体姿态估计具有很大的挑战性。尽管最先进的人体关节探测器已经在静态图像中显示出了显著的结果，但当我们将这些模型应用于视频序列时，它们的性能就显得不足了。普遍的缺点包括无法处理运动模糊，视频散焦，或姿势遮挡，这是由于无法捕捉视频帧之间的时间依赖性。另一方面，直接使用传统的递归神经网络会在建模空间环境时带来经验上的困难，特别是在处理位姿遮挡时。在本文中，我们提出了一种新的多帧人体姿态估计框架，利用视频帧之间丰富的时间线索来促进关键点检测。在我们的框架中设计了三个模块化组件。位姿时间融合模块对关键的时空背景进行编码，生成有效的搜索范围;位姿残差融合模块在两个方向上计算加权位姿残差。然后通过我们的位姿校正网络处理这些，以有效地细化位姿估计。我们的方法在大规模基准数据集PoseTrack2017和PoseTrack2018的多帧人姿态估计挑战中排名第一。我们已经发布了我们的代码，希望能激发未来的研究。

代码最近已经上传上去了，相关研究方向的小伙伴可以关注一波哦