论文名称:Rotation-invariant Mixed Graphical Model Network for 2D Hand Pose Estimation
作者:Kong Deying /Ma Haoyu /Chen Yifei /Xie Xiaohui
发表时间:2020/2/5
论文链接:https://arxiv.org/abs/2002.02033v1
推荐原因
这篇论文发表于WACV 2020,考虑的是二维手姿势估计问题。
这篇论文提出了一种名为旋转不变混合图形模型网络(R-MGMN)的网络架构,用来解决单摄像头采集的RGB图像中的二维手姿势估计问题。通过集成一个旋转网络,R-MGMN可以应对图像中手的旋转。R-MGMN还具有一个图形模型库,可以根据输入图像来选择图形模型的组合。R-MGMN通过在每个图形模型上执行置信传播来生成一组边际分布,然后将这些边际分布作为手部关键点位置的置信度映射,最终所有的置信度映射合在一起得到最终的置信度映射。这篇论文在两个公共手势数据集上评估了R-MGMN,实验结果表明R-MGMN明显优于其他的算法。
论文名称:Learning Fine Grained Place Embeddings with Spatial Hierarchy from Human Mobility Trajectories
作者:Shimizu Toru /Yabe Takahiro /Tsubouchi Kota
发表时间:2020/2/6
论文链接:https://arxiv.org/abs/2002.02058v1
推荐原因
这篇论文考虑的是位置嵌入问题。
以往的研究通过人员流动轨迹来生成位置嵌入,而实际应用需要具有高空间分辨率的位置嵌入。由于数据稀疏性,许多应用不得不降低空间分辨率,从而导致位置嵌入质量的降低。为了解决这个问题,这篇论文提出了一种生成细粒度位置嵌入的方法,根据观察到的数据点的局部密度来利用空间层次信息。基于日本3个城市的真实世界轨迹数据,这篇论文实验了下一个位置的预测任务,验证了所提的位置嵌入方法的有效性。
论文名称:Person Re-identification by Contour Sketch under Moderate Clothing Change
作者:Yang Qize /Wu Ancong /Zheng Wei-Shi
发表时间:2020/2/6
论文链接:https://arxiv.org/abs/2002.02295v1
推荐原因
这篇论文要解决的是行人重识别问题。
与以往只考虑同一个着装的行人重识别问题不同,这篇论文定义了跨服饰行人重识别问题,即在不同着装下的行人重识别任务。这篇论文考虑的是在短时间内,天气没有变化,因此行人穿着的衣服的厚度没有大的变化,从而通过处理行人图像的轮廓草图,而不是通过衣服的颜色信息,来提取特征。这种方式可以对于服饰的变化更加鲁棒。这篇论文还为了这个问题建了一个来自221个行人的包含33698张图像的数据集。通过在新数据集上的实验,这篇论文验证了所提方法的有效性。
论文名称:A Comprehensive Database for Benchmarking Imaging Systems
作者:Karen Panetta /Qianwen Wan /Sos Agaian /Srijith Rajeev /Shreyas Kamath /Rahul Rajendran /Shishir Paramathma Rao /Aleksandra Kaszowska /Holly A. Taylor / Arash Samani /Xin Yuan
发表时间:2018/11/30
论文链接:https://ieeexplore.ieee.org/document/8554155
推荐原因
这篇论文贡献了Tufts大学收集的人脸数据库,包含了来自15个以上国家/地区的113位个人的10,000多张图像,包含了不同的性别身份、年龄和种族背景。这些人脸图像是从Tufts大学的学生、教职员工及其家属那里采集的,能够为人脸识别相关的研究提供更加鲁棒的算法测试。同时这篇论文也回顾了目前已有的其他人脸识别相关的数据集。
论文名称:Semi-supervised sequence tagging with bidirectional language models
作者:Matthew E. Peters /Waleed Ammar /Chandra Bhagavatula /Russell Power
发表时间:2017/4/29
论文链接:https://arxiv.org/pdf/1705.00108.pdf
推荐原因
本文解决的问题:本论文是针对训练语料不足的问题,解决这个问题的核心就是使用迁移学习的思想以及半监督的方式。
创新点:该论文使用海量无标注语料库训练了一个双向神经网络语言模型,然后使用这个训练好的语言模型来获取当前要标注词的语言模型向量(LM embedding),然后将该向量作为特征加入到原始的双向RNN-CRF模型中。
研究意义:实验结果表明,在少量标注数据上,加入这个语言模型向量能够大幅度提高NER效果,即使在大量的标注训练数据上,加入这个语言模型向量仍能提供原始RNN-CRF模型的效果。