前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >今日 Paper | 点云分类框架;多模式Transformer;神经网络;有序神经元等

今日 Paper | 点云分类框架;多模式Transformer;神经网络;有序神经元等

作者头像
AI科技评论
发布2020-03-06 16:31:16
4910
发布2020-03-06 16:31:16
举报
文章被收录于专栏:AI科技评论AI科技评论

目录

用于行人重识别的三元组在线实例匹配丢失

用于DSTC8 AVSD挑战的带指针网络的多模式Transformer

PointAugment:一种自动增强的点云分类框架

寻找稀疏、可训练的神经网络

有序神经元:将树结构集成到递归神经网络中

用于行人重识别的三元组在线实例匹配丢失

论文名称:Triplet Online Instance Matching Loss for Person Re-identification

作者:Li Ye /Yin Guangqiang /Liu Chunhui /Yang Xiaoyu /Wang Zhiguo

发表时间:2020/2/24

论文链接:https://arxiv.org/abs/2002.10560

推荐原因

这篇论文要解决的是行人重识别问题。

在线实例匹配(OIM)损失函数和三元组(Triplet)损失函数是行人重识别问题的主要方法。但这两个损失函数都有缺点,OIM损失对所有样本均等对待,没有关注困难样本,三重损失以复杂且繁琐的方式来处理批处理样本,因此收敛速度很缓慢。针对这些问题,这篇论文提出了三元组在线实例匹配(TOIM)损失函数,该函数能着重于困难样本并能有效地提高行人重识别模型的准确性。TOIM结合了OIM损失和Triplet损失的优点,并简化了批处理过程,从而使收敛更快。

用于DSTC8 AVSD挑战的带指针网络的多模式Transformer

论文名称:Multimodal Transformer with Pointer Network for the DSTC8 AVSD Challenge

作者:Le Hung /Chen Nancy F.

发表时间:2020/2/25

论文链接:https://arxiv.org/abs/2002.10695

推荐原因

这篇论文要解决的是视听场景感知对话(Audio-Visual Scene-Aware Dialog,AVSD)问题。

视听场景感知对话要求对话代理生成自然语言响应以解决用户查询并进行对话。这是一项具有挑战的任务,因为其包含多模态视频功能,例如包括文本、视觉和音频特征。对话代理还需要学习用户话语和系统响应之间的语义依赖,以便与人类进行连贯对话。这篇论文介绍该团队向第八届对话系统技术挑战赛(Dialogue System Technology Challenge)提交的AVSD参赛作品,采用了点积方式来结合输入视频的文本和非文本特征,通过在每个生成步骤中采用指针网络指向来自多个源序列的Tokens,进一步增强对话代理的生成能力。

PointAugment:一种自动增强的点云分类框架

论文名称:PointAugment: an Auto-Augmentation Framework for Point Cloud Classification

作者:Li Ruihui /Li Xianzhi /Heng Pheng-Ann /Fu Chi-Wing

发表时间:2020/2/25

论文链接:https://arxiv.org/abs/2002.10876

推荐原因

这篇论文被CVPR 2020接收,要解决的是点云分类的问题。

这篇论文提出了一个名为PointAugment的点云分类框架,当训练分类网络时,该框架会自动优化和扩充点云样本以丰富数据多样性。与现有的2D图像自动增强方法不同,PointAugment具有样本感知功能,并采用对抗学习策略来共同优化增强器网络和分类网络,学习生成最适合分类器的增强样本。PointAugment根据形状分类器和点位移来构造可学习的点增强函数,并根据分类器的学习进度精心设计损失函数以采用增强样本。PointAugment在改善形状分类和检索中的有效性和鲁棒性得到了实验的验证。

寻找稀疏、可训练的神经网络

论文名称:THE LOTTERY TICKET HYPOTHESIS: FINDING SPARSE, TRAINABLE NEURAL NETWORKS

作者:Jonathan Frankle /Michael Carbin

发表时间:2019/3/3

论文链接:https://openreview.net/pdf?id=rJl-b3RcF7

推荐原因

核心问题:一个标准的剪枝技术能够自然地发现子网络结构,这些子网络的初始化能够帮助网络更有效地训练。

创新点:本研究提出一种 lottery ticket hypothesis:对于那些包含子网络 结构的密集、随机初始化前馈网络,当单独训练这些子网络时,通过相似的训练迭代次数能够取得与原始网络相当的测试性能。而

研究意义:实验结果表明,在 MNIST 和 CIFAR-10 数据集上,子网络的规模始终比几种全连接结构和卷积神经网络小10%-20%。当规模超过这个范围时,子网络能够比原始网络有更快的学习速度和更好的测试精度表现。

有序神经元:将树结构集成到递归神经网络中

论文名称:ORDERED NEURONS: INTEGRATING TREE STRUCTURES INTO RECURRENT NEURAL NETWORKS

作者:Yikang Shen /Shawn Tan /Alessandro Sordoni /Aaron Courville

发表时间:2019/5/8

论文链接:https://openreview.net/pdf?id=B1l6qiR5F7

推荐原因

核心问题:标准的 LSTM 结构允许不同的神经元跟踪不同时间维度信息,但它对于层级结构建模中的各组成没有明确的偏向。

创新点:本文提出神经元排序策略来添加一个归纳偏置量,当主输入向量和遗忘门结构确保给定的神经网络更新时,后续跟随的所有神经元也将随之更新。

研究意义:这种集成树结构的新颖循环神经网络 ON-LSTM在四种不同的 NLP 任务:语言建模、无监督解析、目标句法评估和逻辑推理上都取得了良好的表现。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-03-05,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AI科技评论 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 目录
  • 用于行人重识别的三元组在线实例匹配丢失
  • 用于DSTC8 AVSD挑战的带指针网络的多模式Transformer
  • PointAugment:一种自动增强的点云分类框架
  • 寻找稀疏、可训练的神经网络
  • 有序神经元:将树结构集成到递归神经网络中
相关产品与服务
人体分析
腾讯云神图·人体分析(Body Analysis)基于腾讯优图领先的人体分析算法,提供人体检测、行人重识别(ReID)等服务。支持识别图片或视频中的半身人体轮廓;支持通过人体检测,识别行人的穿着、体态等属性信息。可应用于人像抠图、背景特效、人群密度检测等场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档