专栏首页technewsworld翻译专栏科学出版物视觉总结识别的自我监督学习(CS)

科学出版物视觉总结识别的自我监督学习(CS)

提供科学出版物的可视化摘要可以增加读者获得信息的机会,从而有助于应对科学出版物数量的指数级增长。然而,很少有提供视觉出版物摘要, 而且主要侧重于生物医学领域。这主要是因为有注释的黄金标准有限,这妨碍了可靠和高绩效监督学习技术的应用。为了解决这些问题 ,我们创建一个新的基准数据集,用于选择数字,以根据出版物摘要作为出版物的可视化摘要,涵盖计算机科学的几个领域。此外,我们开发一种自我监督的学习方法,基于对数字与数字标题的内联引用的启发式匹配。生物医学和计算机科学领域的实验表明,尽管我们自我监督,并因此不依赖任何带注释的培训数据,但我们的模型能够超越最先进的技术。

Self-Supervised Learning for Visual Summary Identification in Scientific Publications

Providing visual summaries of scientific publications can increase information access for readers and thereby help deal with the exponential growth in the number of scientific publications. Nonetheless, efforts in providing visual publication summaries have been few and fart apart, primarily focusing on the biomedical domain. This is primarily because of the limited availability of annotated gold standards, which hampers the application of robust and high-performing supervised learning techniques. To address these problems we create a new benchmark dataset for selecting figures to serve as visual summaries of publications based on their abstracts, covering several domains in computer science. Moreover, we develop a self-supervised learning approach, based on heuristic matching of inline references to figures with figure captions. Experiments in both biomedical and computer science domains show that our model is able to outperform the state of the art despite being self-supervised and therefore not relying on any annotated training data.

原文链接:https://arxiv.org/abs/2012.11213

原文作者:Shintaro Yamamoto, Anne Lauscher, Simone Paolo Ponzetto, Goran Glavaš, Shigeo Morishima

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 微软为假日购物做好准备

    鉴于这一大流行,我们今年可能会有新的网上购物记录。对COVID-19的担忧和实体店(尤其是大商店)的持续关闭,将促使我们网上购物创下纪录。

    zstt8054929
  • 内核平滑、平均移位及其使用定向数据的学习理论(CS)

    定向数据由分布在(超)球面上的观测结果组成,并出现在许多应用领域,如天文学、生态学和环境科学。本文研究了定向数据内核平滑的统计和计算问题。我们将经典平均移位算法...

    zstt8054929
  • 点击包装技术为数字交易带来速度和效率

    由杰克·杰曼 » 电子商务时报 » ECT新闻网 2020年12月11日 4:30上午PT

    zstt8054929
  • 导师团队霸气登场,“微信全球MBA创新大赛”再掀高潮!

    本文转自微信全球MBA创新大赛官方公众帐号WeWinwithWeChat ? “微信全球MBA创新大赛——创意中国2015”(We Win with WeCh...

    腾讯高校合作
  • STCN

    https://www.arxiv-vanity.com/papers/1902.06568/

    用户1908973
  • 实现OCC模型的可视化简体汉字情感仿真器(cs AI)

    在这篇论文中,我们提出了一个可视化的仿真人物在故事中的情绪。该系统基于Ortony、Clore和Collins (OCC模型)对情绪认知结构的简化观点。本文的目...

    RockNPeng
  • 【论文推荐】最新六篇视频分类相关论文—层次标签推断、知识图谱、CNNs、DAiSEE、表观和关系网络、转移学习

    【导读】专知内容组整理了最近六篇视频分类(Video Classification)相关文章,为大家进行介绍,欢迎查看! 1. Hierarchical Lab...

    WZEARW
  • 走向下一代计算范式:近似计算在机器人系统中的应用实验、案例研究和实际意义(CS RO)

    近似计算是一个计算领域,它可以用来用时间和能量来换取质量,因此在嵌入式系统中很有用。在电池驱动的嵌入式系统中,能源是首要资源,如机器人。近似计算可以作为一种技术...

    用户8128510
  • How to Select an Object-Relational Mapping Tool for .NET

    The single, most important trap to watch out for when choosing an object-relatio...

    张善友
  • 视听资源在19世纪作为一种教学工具,其效率的实证分析

    由COVID病毒引起的全球大流行导致了大学教学方式转向了远程模式的改变。乌拉圭共和国大学经济科学和行政学院注册会计师职业的“Modelos y Sistemas...

    VasiliaSun

扫码关注云+社区

领取腾讯云代金券