正经炼丹师如何完美安排国庆长假?

Hi,各位炼丹师

听说还有不到0.5天

我就要开启快乐肥宅模式

你的国庆长假都有哪些安排呢?

景区看人,开车堵车,

回家被嫌弃,单身还要出份子钱,

这些国庆常规 bug,你真的想要吗……

为了帮你合理安排国庆假期

小编连夜整理了一份最新论文清单

希望你们都能从中找到些许小灵感

请看

@zhoujie17 推荐

#Graph-to-Sequence Learning

本文提出了一种新的 encoder-decoder 框架来进行 graph-to-sequence 即图到序列的学习,在 AMR 图的序列生成和基于句法的神经机器翻译任务上取得了较好的结果。本文提出的方法解决了之前工作中存在的问题,包括将图结构线性化造成的信息丢失以及参数爆炸问题。

本文提出了一种图的转换方法,通过将图转换为 Levi 图从而解决了上述问题。同时该框架将 Gated Graph Neural Network 加入到 encoder 部分,其余部分采用 seq2seq 的原始结构,在两个任务上取得了超越了 seq2seq 的结果。

论文链接

https://www.paperweekly.site/papers/2301

源码链接

https://github.com/beckdaniel/acl2018_graph2seq

@paperweekly 推荐

#Dialog Systems

本文是上海交大发表于 COLING 2018 的工作,研究的问题是检索型对话系统。论文提出了一个深度对话整合模型,解决了以往对话理解模型中将多句对话话语直接拼接而忽略话语间关系的问题。

具体来说,论文模型将过往对话整合到 context 中,根据话语和回复挖掘关键信息,然后将每一个过往话语与回复进行语义匹配得到匹配分数。其中将最重要的回复前最后一句话语(可视为 query),与其他过往话语的向量表示进行了融合,并通过编码使每句话语中的关键信息得到凸显、过滤冗余信息。

论文链接

https://www.paperweekly.site/papers/2352

源码链接

https://github.com/cooelf/DeepUtteranceAggregation

@guohao916 推荐

#Machine Reading Comprehension

生活中,人们通常根据一系列相互关联的问答情况来收集信息。因此使用基于对话的机器阅读理解可以更有利于信息的收集。针对该场景,本文发布了一个基于对话的机器阅读理解数据集 CoQA。与以往的机器阅读理解数据集如 SQUAD 不同,该数据集存在以下特点:

1. 与之前数据集中答案通常存在于篇章的句子片段中的情况不同,该数据集在生成过程中尽量避免使用句子中已经存在的短语或者片段,以短语或者片段的同义词或者同义片段的形式呈现;

2. 问题的答案中存在自由形式的短语片段,即需要对多条篇章句子加以归纳总结;

3. 篇章分别来自一系列不同的领域;

4. 和多轮对话的情况类似,问答对呈现出连续多轮的特点,平均轮数为 15 轮。问答对呈现出序列性的依赖关系。

该问题可以看成对话系统和问答系统的一个综合性的应用。论文使用多种基准算法进行对比实验,包括 Seq2Seq, PGNet, DrQA 以及 DrQA+PGNet。实验结果表明效果最优的模型 DrQA+PGNet 依然比人工标注得到的 F1 指标数目要低很多,因此该数据集具有很大的模型提升空间。

论文链接

https://www.paperweekly.site/papers/2251

源码链接

https://github.com/stanfordnlp/coqa-baselines

@tobiaslee推荐

#Text Generation

本文是北京大学发表于 NAACL 2018 的工作。论文借鉴了 Attention is All your Need 的思想,通过 Query 的方式来进行文本的生成。

传统文本生成的方式会使用一层全连接层将隐层状态映射到词表上,获得一个概率分布,这样做存在两个问题:参数量巨大和语言关系的丢失(没考虑到词的概率之间的关联关系)。

本文采用将候选词作为 value, 而对应的 word embedding 则是 key,通过将 RNN 的输出作为 query,根据 query 和 embedding 的 similarity 来进行生成词的选取。

论文链接

https://www.paperweekly.site/papers/2302

源码链接

https://github.com/lancopku/WEAN

@paperweekly 推荐

#Question Answer Matching

本文是汉诺威大学发表于 SIGIR 2018 的工作。Answer Selection 是 QA 任务中的重要子任务,现有方法往往先通过单个向量对问题和回答进行表示,然后再计算打分。论文提出了一种多阶段的 Sequential Attention 机制,将问题进行多次 attention,从而使得能够在不同阶段注意到答案不同的阶段,有效处理了长文本语义的表达问题。

实验表明,本文提出的模型在各主流 QA 数据集(TREC-QA、WikiQA、InsuranceQA、FiQA)上均取得了最优表现。

论文链接

https://www.paperweekly.site/papers/2338

@mrililili 推荐

#Natural Language Inference

本文来自赫尔辛基大学,论文主要关注的是自然语言推理任务。作者利用多层双向 LSTM 进行句子编码,并用上一个 LSTM 的结果初始化下一个 LSTM,取得了较好的结果。此外,实验表明本文提出的句子嵌入方法可应用于各类迁移学习任务。

论文链接

https://www.paperweekly.site/papers/2323

源码链接

https://github.com/Helsinki-NLP/HBMP

@paperweekly 推荐

#Natural Language Understanding

自然语言处理任务的成功取决于标注数据的数量和质量,训练数据不足将直接影响任务精度和准确度。针对文本语料不足的情况,本文提出了一种将神经网络和正则表达式相结合的方法,来改进 NLP 的监督学习。

本文提出的方法在少量学习和完整注释设置上都明显提高了神经网络的性能。此外,本文为如何将 REs 与 NNs 和 RE 注释相结合提供了一套指南。

论文链接

https://www.paperweekly.site/papers/2344

数据集链接

http://www.lancaster.ac.uk/staff/wangz3/publications/ACLData.zip

@lunar 推荐

#Dataset Creation

本文是由 CMU 的一众科学家发布的一个公开数据集,他们组织了 4 个受试者去观察 5000 张图片,并在他们观察图片时记录下当时脑部的核磁共振图。 通过该数据集,我们可以将人工神经网络和人类神经网络联合起来分析,可以想象通过这个数据集,可以做出许多有趣的工作。

论文链接

https://www.paperweekly.site/papers/2325

源码链接

https://bold5000.github.io/

@paperweekly 推荐

#Pedestrian Detection

本文是中科院自动化发表于 ECCV 2018 的工作。本文重点关注行人检测中的遮挡问题,并为此提出了两种遮挡处理策略。作者在Faster R-CNN的基础上提出了一种全新方法——OR-CNN,其主要包括两个部分:第一阶 段RPN 产生目标候选框,第二阶段 Fast R-CNN 对目标候选框进行进一步的分类和回归。

论文链接

https://www.paperweekly.site/papers/2364

@paperweekly 推荐

#Semantic Segmentation

本文是 UC Berkeley 发表于 ECCV 2018 的工作,论文提出了一种以自适应相似场(Adaptive Affinity Fields )来辅助语义分割的方法,增强了网络对目标结构推理的能力,取得了非常显著的性能提升。

此外,本文提出的方法也是一种全新的深度学习结构建模方法,不仅可以用于语义分割,理论上也适用于图像深度估计、光流计算等对图像进行像素级理解的任何场景。

论文链接

https://www.paperweekly.site/papers/2365

源码链接

https://github.com/twke18/Adaptive_Affinity_Fields

@paperweekly 推荐

#Person Re-ID

本文是复旦大学发表于 ECCV 2018 的工作,论文主要研究的是行人重识别任务中的人体姿态变化问题。作者利用 GAN 生成新的姿态行人图片,然后融合原图和生成图的 ReID 特征作为最终特征。在测试阶段,论文定义了八种代表性的姿态,然后生成八张人造图,加上原图总共可以得到九个特征,最后使用 max pooling 得到最终的 ReID 特征。

论文链接

https://www.paperweekly.site/papers/2361

源码链接

https://github.com/naiq/PN_GAN

@DanielTANG 推荐

#Object Tracking

本文来自 UCL,论文提出了一种动态 RGBD SLAM 方案,不仅能实现实时的场景感知 3D 重建,而且利用了 Mask RCNN 以及几何分割对 2D 图像进行实例分割,同时映射到 3D,建立 3D 模型的语义分割。并且将要开放源码,对于语义 SLAM 研究有着一定帮助。

论文链接

https://www.paperweekly.site/papers/2314

@woonchao 推荐

#3D Reconstruction

本文是中国香港中文大学和腾讯优图联合发表于 ECCV 2018 的工作,论文提出了一个用于基于点云的 3D 模型重建损失函数,相较于传统的 Chamfer distance,这个损失能更好的刻画全局信息,对于提升 3D 模型重建效果有很大帮助。

论文用 GAL 来刻画重建之后的模型损失,它由两个术语组成,其中几何损失确保从不同视点接近 Groundtruth 的重建 3D 模型的一致形状,条件对抗性损失生成具有语义意义的点云。

论文链接

https://www.paperweekly.site/papers/2334

@paperweekly 推荐

#Image Retrieval

本文是厦门大学和悉尼科技大学发表于 ECCV 2018 的工作,论文提出了一种异质同源学习方法来解决无监督域适应问题,归根结底其依然是基于 GAN 生成图的工作。

本文工作主要基于两个假设:1. 相机不变性,同未标注的正样本对来学习到相机的风格;2. 域连通性,即 source 和 target 域的行人图片默认没有重叠,是负样本对。第一点是同源学习,因为用的样本都是相同域的。第二点是异质学习,因为用到了两个域的样本。

论文链接

https://www.paperweekly.site/papers/2362

源码链接

https://github.com/zhunzhong07/HHL

@xuehansheng推荐

#Network Embedding

本文是中国香港科技大学和腾讯发表于 IJCAI 2018的工作,论文提出了一种可扩展的多路复用网络嵌入模型(scalable multiplex network embedding model),将多字形关系的信息表示为一个统一的嵌入空间。

为了在保持其独特属性的同时组合不同类型关系的信息,对于每个节点,作者为每种类型的关系提出一个高维公共嵌入和低维附加嵌入。然后,可以基于统一的网络嵌入模型联合学习多个关系。

论文链接

https://www.paperweekly.site/papers/2305

源码链接

https://github.com/HKUST-KnowComp/MNE

@simonhua推荐

#Neural Networks

本文利用 ML 对网络进行建模用来评估网络性能,成功对网络建模有利于网络优化,配合 SDN 在 SDN 控制器的帮助下能够有效对网络配置进行合理优化。本文提出了使用神经网络根据输入流量函数准确对网络时延进行建模。

作者基于不同计算机网络参数(网络拓扑,网络大小,流量强度,路由策略)训练了不同神经网络模型,研究了不同的计算机网络参数对于学习能力有何影响,对未来使用机器学习对网络建模的可行性进行了验证并提出了几点讨论建议,可以作为实际环境部署的指南方针。

论文链接

https://www.paperweekly.site/papers/2312

@MADONG 推荐

#Deep Reinforcement Learning

本文来自 DeepMind,论文主要贡献如下:

1. 关系推理中深度学习的加入:深度学习让关系表达的对象得以加入到我们的控制中,原先无法直接处理的物理对象可以引入了,这样 agent 与真实世界的交互变得可能了,推理也就变得有意义了。 深度学习对特征的提取功能,让关系强化学习能够关注在深度学习抽象后的特征中,把特征对应成自己需要掌握的关系对象。这样其实比直接对应真实的物体更进一步;

2. Attention 模块的加入:Attention 模块让关系强化学习中关系的表达得以更优秀。原本的 RNN 等算法对于序列的长短比较敏感,但是在 attention 机制下,两个向量之间关系的计算不再受向量之间距离的影响。同一个场景下欧式距离较远的对象也可以很好的提取出存在的关系;

3. 强化学习的加入:在这里主要是监督 attention 模块中权值 w 的改变调整。

论文链接

https://www.paperweekly.site/papers/2300

@xuehansheng 推荐

#Network Embedding

本文来自亚利桑那州立大学,论文提出了一种新颖的多级网络嵌入框架 BoostNE,它可以学习从粗到细的不同粒度的多个网络嵌入表示,而不会强加普遍的全局低秩假设。方法新颖值得深入研究。

论文链接

https://www.paperweekly.site/papers/2269

@linxi2333 推荐

#Audio Generation

本文是对 DeepMind 的 Tacotron2 的改进,Tacotron2 是一种端到端的语音合成系统。论文单高斯简化了 parallel WaveNet 的 KL 目标函数,改进了蒸馏算法(distillation),使得结构更简单,更稳定;通过 Bridge-net 连接了 Tacotron(特征预测网络)和 WaveNet,彻底实现端到端。

论文链接

https://www.paperweekly.site/papers/2290

Demo链接

https://clarinet-demo.github.io/

@Ttssxuan 推荐

#Reinforcement Learning

本文对 ALE (Arcade Learning Environment) 平台做了进一步深入介绍,主要从以下几点出发:1. 总结了关于 ALE 相关问题的经验,如:Frame skipping, Color averaging and frame pooling 等;2. 总结最新成果,以及当前待解决的一些问题 ;3. 新的 ALE 版本,介绍了新平台的特性,如:sticky actions, multiple game modes 等。

论文链接

https://www.paperweekly.site/papers/2343

源码链接

https://github.com/mgbellemare/Arcade-Learning-Environment

#推 荐 有 礼#

本期所有入选论文的推荐人

均将获得PaperWeekly纪念周边一份

深度学习主题行李牌/卡套 + 防水贴纸

礼物领取方式

推荐人请根据论文详情页底部留言

添加小助手领取礼物

想要赢取以上周边好礼?

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180930B0YJG600?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券