论文地址:http://arxiv.org/pdf/2003.04262v2.pdf 代码:https://github.com/tfzhou/c-hoi 来源:Inception人工智能研究所,阿联酋 论文名称:Cascaded Human-Object Interaction Recognition 原文作者:Tianfei Zhou
人-物交互(HOI)识别已经取得了快速的进展,但现有的模型大多局限于single-stage推理步骤。考虑到任务的内在复杂性,我们引入了一个级联架构来实现从粗到细的multi-stage HOI理解。在每个阶段,实例定位网络逐步细化HOI方案,并将其输入交互识别网络。这两个网络中的都与自身的前一阶段相连接,从而实现跨阶段的信息传播。该交互识别网络有两个重要部分:用于选择高质量HOI方案的关系排序模块和用于关系预测的三流分类器。通过精心设计的以人为中心的关系特征,这两个模块可以协同工作,实现有效的交互理解。除了在边界框级别上检测关系之外,本文的框架还能灵活地执行细粒度的像素级关系分割,这为关系建模提供了一个新的视角。在 ICCV2019 Person in Context Challenge大赛中,本文方法在关系检测和分割任务上都获得了第一名。同时,在V-COCO上结果也优良。
下面是论文具体框架结构以及实验结果:









声明:文章来自于网络,仅用于学习分享,版权归原作者所有。