专栏首页arxiv.org翻译专栏自动解码图(CS ML)
原创

自动解码图(CS ML)

我们提出了一个系统,允许用户在依赖图上使用句法模式搜索大型语言注释语料库。与之前的尝试不同,我们引入了一种轻量级的查询语言,它不需要用户知道底层语法表示的细节,而是通过提供一个示例语句和简单的标记来查询语料库。由于高效的语言图索引和检索引擎,搜索以交互的速度进行。这允许快速探索、开发和完善基于语法的查询。我们使用两个语料库的查询来演示这个系统:英语维基百科和一组英语公开摘要。wikipedia系统的演示可以在以下网址获得:这个https URL

原文标题:Syntactic Search by Example

原文:We present a system that allows a user to search a large linguistically annotated corpus using syntactic patterns over dependency graphs. In contrast to previous attempts to this effect, we introduce a light-weight query language that does not require the user to know the details of the underlying syntactic representations, and instead to query the corpus by providing an example sentence coupled with simple markup. Search is performed at an interactive speed due to an efficient linguistic graph-indexing and retrieval engine. This allows for rapid exploration, development and refinement of syntax-based queries. We demonstrate the system using queries over two corpora: the English wikipedia, and a collection of English pubmed abstracts. A demo of the wikipedia system is available at: this https URL

原文作者:Micah Shlain, Hillel Taub-Tabib, Shoval Sadde, Yoav Goldberg

原文地址:https://arxiv.org/abs/2006.03010

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 无约束多视点视频中动态事件的4D可视化(CS CV)

    我们提出了一种基于数据驱动的手持式多摄像机动态事件4D时空可视化方法。我们方法的关键是使用特定于场景的自监督神经网络来组成事件的静态和动态方面。虽然从离散的视角...

    蔡秋纯
  • 基于图粗化和深度图学习的层次化快速图相似度计算(CS)

    在这项工作中,我们感兴趣的是大型图相似性计算问题,这是一个最重要的基于图的问题。传统的计算图编辑距离(GED)和最大公共子图(MCS)的精确值或近似值的技术要求...

    蔡秋纯
  • 基于深度学习的细粒度分层学习方法在强劲恶意软件分类中的应用(CS)

    物联网(IoT)在家庭和工业应用中的广泛应用伴随着一些安全问题。一个主要的安全问题是他们可能被对手滥用,以达到恶意的目的。理解和分析物联网恶意行为至关重要,尤其...

    蔡秋纯
  • 一个用于Android隐私政策文档结构分析的语料库(CS CY)

    随着移动设备的日益普及和移动应用的广泛应用,隐私问题逐渐受到关注。隐私政策作为一种表明法律条款的适当媒介,如GDPR,被认为是约束服务提供商和用户之间的法律协议...

    奥斯特洛夫斯萌
  • 基于技能要求的开放式教育视频推荐系统(CS CS)

    在本文中,我们建议一种新颖的方法来帮助学习者找到相关的开放式教育视频,以掌握劳动力市场上所需的技能。我们建立了一个原型,该原型包括:1)在职位空缺公告中应用文本...

    小童
  • [Hot Technology系列]从此之后再无Load Balancer--SmartStack

    什么是SmartStack? SmartStack is an automated service discovery and registration fr...

    包子面试培训
  • WEE &SEE角色设定

    腾讯ISUX
  • Paul Graham:梦寐以求的编程语言

    这是一篇2001年发表的博文,距今超过10年。但是,好的文章是不会随时间流逝而贬值滴。 作者 Paul Graham 是硅谷大牛。对许多问题(包括:编程技术、...

    一个会写诗的程序员
  • 周志华:Learnware 将是机器学习的未来

    【新智元导读】《机器学习》作者、南京大学教授周志华在本文中,针对当前机器学习环境适应低、数据共享难等局限,提出新概念 learnware(学件)。Learnwa...

    新智元
  • Know Kubernetes — Pictorially

    Recently, I started my Kubernetes journey and wanted to understand its internals...

    麒思妙想

扫码关注云+社区

领取腾讯云代金券