开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

社区首页 >专栏 >今日 Paper | 模态平衡模型；组合语义分析；高表达性SQL查询；多人姿态估计模型等

今日 Paper | 模态平衡模型；组合语义分析；高表达性SQL查询；多人姿态估计模型等

AI科技评论

发布于 2020-02-21 11:51:26

4950

发布于 2020-02-21 11:51:26

举报

文章被收录于专栏：AI科技评论

目录

视觉对话的模态平衡模型
对注意力的通用攻击和对应的数据集DAmageNet
半结构化表的组合语义分析
从输入输出示例合成高表达性SQL查询
DeeperCut: 一种更深入,更强,更快速的多人姿态估计模型

视觉对话的模态平衡模型

论文名称：Modality-Balanced Models for Visual Dialogue

作者：Kim Hyounghun /Tan Hao /Bansal Mohit

发表时间：2020/1/17

论文链接：https://arxiv.org/abs/2001.06354v1

推荐原因

这篇论文考虑的是视觉对话问题。

视觉对话任务需要一个模型来利用图像和对话以生成针对当前对话的下一个响应。然而存在大量对话问题是不需要通过任何上下文历史信息就可以根据查询图像而得以解答。这篇论文认为以往的联合模式（历史加图像信息）模型过于依赖且更易记住对话历史，而仅图像模型更加具有通用性，并且在允许多个正确答案时表现更好。因此这篇论文鼓励维护两个模型，即仅图像模型和图像-历史联合模型，并将它们的互补能力结合起来以形成更平衡的多峰模型。这篇论文通过集成和共有参数的共识落差融合，提出了两种方法用于这两个模型的集成，并且在2019年视觉对话挑战赛上取得了出色的成绩。

对注意力的通用攻击和对应的数据集DAmageNet

论文名称：Universal Adversarial Attack on Attention and the Resulting Dataset DAmageNet

作者：Chen Sizhe /He Zhengbao /Sun Chengjin /Huang Xiaolin

发表时间：2020/1/16

论文链接：https://arxiv.org/abs/2001.06325v1

https://paper.yanxishe.com/review/9324

这篇论文研究的是深度神经网络的对抗性攻击。这篇论文提出了注意力集中攻击（Attack on Attention, AoA)，这是很多深度神经网络目前会采用的。在不超过10次决策查询的情况下，AoA可以对很多常用的深度神经网络达到接近100%的成功率。这篇论文应用AoA在ImageNet上生成了96020个对抗样本，并且将这些样本组成的数据集命名为DAmageNet。在这个数据集上，这篇论文测试了20个深度神经网络，当它们没有对抗训练时，错误率都超过90%。通过DAmageNet这个数据集的提出，可以为未来的深度神经网络的鲁棒性研究提供一个新的基准。

半结构化表的组合语义分析

论文名称：Compositional Semantic Parsing on Semi-Structured Tables

作者：Panupong Pasupat /Percy Liang

发表时间：2015/1/24

论文链接：https://cs.stanford.edu/~pliang/papers/compositional-acl2015.pdf

https://paper.yanxishe.com/review/9240

推荐原因

核心问题：本文完成的是一个问答系统

创新点：本文训练了一个语义分析器，首先将关系和实体从半结构化HTML表中编码。然后，系统分析问题成为覆盖率高的候选逻辑形式语法，用对数线性重新排列候选项模型，然后执行得分最高的逻辑形式来产生答案的表示

研究意义：作者构建了一个数据集，在这个数据集的效果证实了，这种方法比传统的基准模型要好。

从输入输出示例合成高表达性SQL查询

论文名称：Synthesizing Highly Expressive SQL Queries from Input-Output Examples

作者：Chenglong Wang /Alvin Cheung /Rastislav Bodik

发表时间：2017/1/5

论文链接：https://scythe.cs.washington.edu/media/scythe-pldi.pdf

https://paper.yanxishe.com/review/9239

推荐原因

核心问题：SQL语言具有特定的语法结构，这就导致要想熟练使用SQL语言需要较高的门槛，本论文就是解决这个问题，

创新点：本论文开发一种如下的方式：

新的抽象-抽象查询语言-分解原来具有挑战性的综合问题。

这种语言中的抽象查询在语法上类似于SQL查询，但筛选器谓词替换为可以用任何有效谓词。总的来说就是分为两个过程，第一个过程是可能实例化为SQL的抽象查询。第二个过程是为每个合成抽象查询，将其实例化为所需的SQL查询并将顶级候选项返回给用户。

研究意义：自从抽象查询中的运算符不再由参数化谓词，抽象查询的搜索空间显著比原来的减少了

DeeperCut: 一种更深入,更强,更快速的多人姿态估计模型

论文名称：DeeperCut: A Deeper, Stronger, and Faster Multi-Person Pose Estimation Model

作者：Insafutdinov Eldar /Pishchulin Leonid /Andres Bjoern /Andriluka Mykhaylo /Schiele Bernt

发表时间：2016/5/10

论文链接：https://arxiv.org/abs/1605.03170

https://paper.yanxishe.com/review/9238

推荐原因

研究目标：多人场景中提高关节姿态估计的技术水平

改进了DeepCut

(1)改进的体部检测器，为体部生成有效的自底向上的建议;

(2)新颖的、以图像为条件的成对术语，允许将建议组合成数量可变的、一致的身体部分配置;

(3)增量优化策略，更有效地探索搜索空间，从而导致更好的性能和显著的加速因素。

在两个单人和两个多人位姿估计基准上进行评估。该方法显著优于最著名的多人姿态估计结果，同时在单人姿态估计任务中表现出了较强的竞争能力。

模型和代码可以从http://pose.mpi-inf.mpg.de获得

ECCV 2016

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2020-02-07，如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AI科技评论微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

评论

登录后参与评论

0 条评论

热度

最新

LV.

目录

目录
视觉对话的模态平衡模型
对注意力的通用攻击和对应的数据集DAmageNet
半结构化表的组合语义分析
从输入输出示例合成高表达性SQL查询
DeeperCut: 一种更深入,更强,更快速的多人姿态估计模型