前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >论文阅读理解 - Human Attribute Recognition by Deep Hierarchical Contexts

论文阅读理解 - Human Attribute Recognition by Deep Hierarchical Contexts

作者头像
AIHGF
发布2019-02-18 10:39:34
7370
发布2019-02-18 10:39:34
举报
文章被收录于专栏:AIUAIAIUAI

Human Attribute Recognition by Deep Hierarchical Contexts

基于深度层次内容信息的人体属性识别

[Projects]

1. 摘要

训练CNN网络,以从所有检测部位中选取最具描述属性的人体部分;并结合整体人体作为归一化的姿态深度表示.

采用从以人为中心层次到场景层次的深度层次内容信息,进一步提升识别结果.

以人为中心的内容信息捕捉了人体间的关系,在CNN特征图的金字塔上计算最邻近的其它人体的部位,匹配的部分再进行平均池化(average pooled),以此作为相似性正则项.

场景内容信息,采用CNN中联合学习的全局场景分类分数来重新对以人为中心的预测结果进行重新打分,以得到最终的场景相关预测.

人体属性,比如性别、衣服风格等,有益于如视频中人体识别等许多应用.

遇到的挑战有,图片中人体视角变化、姿态、光照及缺失等很多因素. 如,

这里写图片描述
这里写图片描述

Figure1 中,由于缺失问题和图像质量低问题,只根据目标人物来对“西装”、“太阳镜”进行推断是困难的. 但是可以利用目标人物所在的图片全局信息,找到相似邻近人物的相关部分,得到分层的内容信息.

2. 网络结构

这里写图片描述
这里写图片描述

Figure2 采用深度层次内容信息的无约束人体属性识别的网络结构.

给定输入图片,计算其Gaussian金字塔,并送入CNN网络中,以得到多尺度的特征图.

从特征图中,提取四种边界框区域的特征集合:整个目标人物、目标人物的选定部位、图像金字塔中的邻近部位、全局图像场景. 后两种特征集分别对应分层内容信息:以人为中心信息和场景信息. 分别对四种区域进行分数计算,并相加以得到最终的属性分数.

基于 Fast R-CNN. 采用在ImageNet分类上预训练的VGG16作为基础网络,Fast R-CNN 首先得到候选区域,然后利用分类器和学习的特征将候选区域进行分类. 考虑到计算效率,共享了图像级的卷积操作,得到全局 conv5 特征图,以便于其后对各区域的ROI Pooling操作都基于conv5 特征图.

3. WIDER Attribute 数据集

[Images (Google Drive)], [ Annotations]

这里写图片描述
这里写图片描述
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2017年09月04日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Human Attribute Recognition by Deep Hierarchical Contexts
    • 1. 摘要
      • 2. 网络结构
        • 3. WIDER Attribute 数据集
        相关产品与服务
        人体分析
        腾讯云神图·人体分析(Body Analysis)基于腾讯优图领先的人体分析算法,提供人体检测、行人重识别(ReID)等服务。支持识别图片或视频中的半身人体轮廓;支持通过人体检测,识别行人的穿着、体态等属性信息。可应用于人像抠图、背景特效、人群密度检测等场景。
        领券
        问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档