专栏首页arxiv.org翻译专栏用于学习多模式表示的自适应变压器(CS CL)
原创

用于学习多模式表示的自适应变压器(CS CL)

转换器的使用已从学习语言语义发展为形成有意义的视觉语言表示。这些架构经常被参数化,需要大量的计算。在这项工作中,我们扩展了自适应方法,以更多地了解模型的可解释性和计算效率。具体来说,我们研究注意力的分散,稀疏和结构化的辍学方法,以帮助了解他们的注意力机制如何扩展到视觉和语言任务。我们进一步证明,这些方法可以帮助我们更多地了解网络如何感知输入序列的复杂性,针对不同模式的稀疏性偏好以及其他相关现象。

原文标题:Adaptive Transformers for Learning Multimodal Representations

原文:The usage of transformers has grown from learning about language semantics to forming meaningful visiolinguistic representations. These architectures are often over-parametrized, requiring large amounts of computation. In this work, we extend adaptive approaches to learn more about model interpretability and computational efficiency. Specifically, we study attention spans, sparse, and structured dropout methods to help understand how their attention mechanism extends for vision and language tasks. We further show that these approaches can help us learn more about how the network perceives the complexity of input sequences, sparsity preferences for different modalities, and other related phenomena.

原文作者:Prajjwal Bhargava

原文地址:https://arxiv.org/abs/2005.07486

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 古典法国剧院放词和POS标签的语料库和模型(CS CL)

    本文介绍了为法国古典文学建立带注释的语料库和训练模型的过程,重点是戏剧,尤其是诗歌中的喜剧。它最初是作为在Cafiero和Camps [2019]中进行的笔势分...

    刘子蔚
  • 基于深度学习技术的自动问答医学模型(CS CL)

    人工智能现在可以为不同的问题提供更多的解决方案,尤其是在医疗领域。这些问题之一是缺少对任何给定的医疗/健康相关问题的答案。互联网上充斥着许多论坛,人们可以通过这...

    刘子蔚
  • 表达性描述逻辑的自然诱拐—技术报告(CS AI)

    基于签名的绑架旨在针对一组特定的名称(即签名)建立假设,这些假设解释了相对于某些背景知识的观察结果。此类绑架可用于诊断等任务,其中用于观察到的症状的词汇与预期用...

    刘子蔚
  • 语言模型的批判性思维

    本文首次迈出了神经自回归语言模型的批判性思维课程的第一步。我们引入了一个演绎有效论据的合成文本语料库,并利用这个人工论元语料库对GPT-2进行训练和评估。从中我...

    用户7724216
  • 识别非平稳顺应表面上的接触参数和导纳力调制(CS RO)

    尽管已经研究了机器人机械手的自主控制数十年,但是由于缺乏安全性和性能保证,它们在安全关键型应用中并不常用-其中许多涉及相互作用力的调节。 本文提出了一种机械探测...

    时代在召唤
  • Tumblr用户的大规模性别/年龄预测(Machine Learning)

    作为领先的内容提供商和社交媒体,Tumblr吸引了3.71亿的月访问量、2.8亿个博客和5330万个每日帖子。Tumblr的流行为广告客户提供了通过赞助帖子推广...

    李欣颖6837176
  • 用程序变换求解词方程(cs)

    本文给出了一个用WE(R,E)结构特化来解词方程的实验,程序WE可以看作是一个解释器,测试一个替换组合R是否产生一个词方程E的解。当使用基本展开/折叠策略时,这...

    用户7454091
  • 机器学习中的最优化算法总结

    对于几乎所有机器学习算法,无论是有监督学习、无监督学习,还是强化学习,最后一般都归结为求解最优化问题。因此,最优化方法在机器学习算法的推导与实现中占据中心地位。...

    SIGAI学习与实践平台
  • Hexo搭建个人博客(三)—— Hexo博客的美化

    通过前两节的学习,我们已经搭建好自己的博客,就像盖房子一样要对内部进行装修,也就是对博客进行美化。 ---- 安装Hexo博客主题 Hexo博客可以安装不同的...

    木制robot
  • BRAIN:中重度脑外伤后进行性脑体积萎缩的空间模式

    脑外伤导致显著脑体积萎缩并持续至慢性期,可被MRI容积分析测量。来自英国帝国理工学院计算,认知和临床神经成像实验室David J Sharp研究组对中重度脑外伤...

    用户1279583

扫码关注云+社区

领取腾讯云代金券