动态 | ACL 2018 公布四篇最佳 demo 候选论文,三篇论文第一作者来自中国

雷锋网 AI 科技评论按:7 月 9 日,自然语言处理顶会 ACL 公布了最佳 demo 论文的四篇候选论文,名单如下:

  • CRUISE: Cold-Start New Skill Development via Iterative Utterance Generation
  • Out-of-the-box Universal Romanization Tool
  • Platforms for Non-Speakers Annotating Names in Any Language
  • YEDDA: A lightweight Collaborative Text Span Annotation Tool

值得注意的是,四篇论文中有三篇论文的一作是中国研究者,他们分别是目前任职于三星美国研究中心的 Yilin Shen,伦斯勒理工学院博士生 Ying Lin,新加坡科技设计大学(SUTD)博士生 Jie Yang。最佳 demo 论文奖将在主会最佳论文 session 环节揭晓,届时雷锋网 AI 科技评论将会第一时间带来现场报导。

本文将对这四篇论文进行简单介绍。

最佳 demo 论文

CRUISE: Cold-Start New Skill Development via Iterative Utterance Generation

  • CRUISE:基于迭代语料生成的冷启动新技能开发
  • 论文摘要:我们提出了 CRUISE 系统,它可以指导普通软件开发者从头开始构建高质量的自然语言理解(NLU)引擎。构建该引擎是给个人助手(智能语音助手)添加新技能的基础步骤。与开发者或众包手动标注大量语料的现有解决方案不同,我们设计了一种基于规则和数据驱动的混合方法,该方法可以迭代生成越来越多的语料。我们的系统只需要少量人工在迭代中修改错误语料即可。CRUISE 系统会生成一个「训练有素」的 NLU 引擎,同时还会生成一个大型已注释语料库,第三方可以基于此来开发自定义技能。通过使用基准数据集和自定义数据集,我们收集到了现实世界的设定,NLU 性能比赛和人类评价则证实了 CRUISE 生成语料的高质量。我们的工作大幅降低了人类认知负荷,同时缩短了人工剪枝时间。
  • 论文作者:Yilin Shen, Avik Ray, Abhishek Patel,Hongxia Jin

Out-of-the-box Universal Romanization Tool

  • 开箱即用的通用罗马化工具
  • 论文摘要:我们想介绍 uroman,这个工具可以把五花八门的语言和文字(如中文、阿拉伯语、西里尔文)转换为普通拉丁文。该工具基于 Unicode 数据以及其他表,可以处理几乎所有的字符集(包括一些晦涩难懂的语言比如藏文和提非纳文)。uroman 还可以将不同文本中的数字转换为阿拉伯数字。罗马化让比较不同文本的字符串相似性变得更加容易,因为不再需要将两种文字翻译成中间文字再比较。本工具作为一个 Perl 脚本,可以免费提供,可用于数据处理管道和交互式演示网页。
  • 论文作者:Ulf Hermjakob, Jonathan May,Kevin Knight

Platforms for Non-Speakers Annotating Names in Any Language

  • 未知语言标注平台
  • 论文摘要:我们将演示两个标注平台,在该平台上,英语母语者即使不熟悉某种语言也可以用该语言进行标注。这些平台可以为低资源语言提供高质量的「银标」注释。平台目前在 LoreHLT20171 上的奥罗莫语和提格里尼亚语上取得了最佳成绩,在 TAC-KBP EDL2017 的十项语言上取得了最佳成绩。我们讨论了平台的优点和局限性,并与其他的未知语言标注方法进行了比较。我们将向研究者们公开该工具。
  • 论文作者:Ying Lin, Cash Costello, Boliang Zhang, Di Lu, Heng Ji, James Mayfield,Paul McNamee
  • 地址:http://aclweb.org/anthology/P18-4001

YEDDA: a lightweight collaborative text span annotation tool

  • YEDDA:一种轻量型文本范围注释工具
  • 论文摘要:在论文中,我们将介绍 YEDDA——一个轻量、高效且全面的开源文本范围注释工具。Yedda 为文本范围注释提供了系统化的解决方案,涵盖了用户协作标注到管理员评估与分析等需求。Yedda 可以用命令行和快捷键对文本进行标注,并以此克服传统文本标注工具的低效率,用户可以自定义命令行和快捷键。Yedda 还可以通过学习最新标注文本智能化为用户提供标注意见。我们还开发了管理员客户端用以评估多个注释器的标注质量,并为每个注释器生成详细的比较报告。实验表明,相较于现有标注工具,我们的系统可以节省一半的时间,使用智能推荐还能再节省 16.47% 的时间。
  • 论文作者:Jie Yang, Yue Zhang, Linwei Li and Xingxuan Li
  • 地址:https://arxiv.org/abs/1711.03759

via:https://acl2018.org/2018/07/09/best-demo-candidates/

雷锋网 AI 科技评论将会第一时间为大家带来 ACL 现场报道,敬请关注。

原文发布于微信公众号 - AI科技评论(aitechtalk)

原文发表时间:2018-07-12

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器之心

业界 | 微软RobustFill:无需编程语言,让神经网络自动生成程序

选自Microsoft Research blog 作者:Rishabh Singh等 参与:李泽南 长久以来,摆脱编程语言的束缚,让计算机自我生成程序一直是开...

34750
来自专栏CreateAMind

TensorFlow-dev-summit:那些TensorFlow上好玩的和黑科技

本文属于介绍性文章,其中会介绍许多TensorFlow的新feature和summit上介绍的一些有意思的案例,文章比较长,可能会花费30分钟到一个小时

13720
来自专栏技术翻译

10个用于人工智能的开源工具/框架

TensorFlow™是一个开源软件库,最初由研究Google Brain Team的研究人员和工程师开发。TensorFlow用于使用数据流图进行数值计算。图...

1.8K20
来自专栏新智元

让神经网络替你编程:如何用深度学习实现程序自动合成

【新智元导读】本文介绍了训练神经网络学习用复杂的函数式语言(FlashFill DSL)进行编程取得的成功,标志着神经程序合成方面一个令人兴奋的突破。 ● 作...

44680
来自专栏机器学习人工学weekly

机器学习人工学weekly-2018/3/11

换了个新职位非常忙,我还会每周更新,但是估计是没时间仔细读论文了,所以评论可能就没什么深度了,精力有限,哎。 1. DeepMind新RL学习方式SAC-X,尝...

32660
来自专栏月色的自留地

从锅炉工到AI专家(11)(END)

24770
来自专栏PPV课数据科学社区

【数据挖掘】rattle:数据挖掘的界面化操作

R语言是一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。这里的统计计算可以是数据分析、建模或是数据挖掘等,通过无数大牛提供的软件包,...

36260
来自专栏PPV课数据科学社区

如何利用 Excel 进行高级数据分析?

高级的数据分析会涉及回归分析、方差分析和T检验等方法,不要看这些内容貌似跟日常工作毫无关系,其实往高处走,MBA的课程也是包含这些内容的,所以早学晚学都得学,干...

32540
来自专栏达观数据

技术干货 |“搜你所想”之用户搜索意图识别

人类自诞生以来就伴随着各种信息的生产和获取,如今这个信息爆炸的 DT 时代,人们更是被各种信息所包围。我们知道,人获取信息的方式主要有被动获取和主动获取两种,其...

1K60
来自专栏华章科技

为什么你的数据分析那么好,图表做得那么烂?

所有优秀的数据可视化依赖优异的设计,并非仅仅选择正确的图表模板那么简单。全在于以一种更加有助于理解和引导的方式去表达信息,尽可能减轻用户获取信息的成本。当然并非...

13820

扫码关注云+社区

领取腾讯云代金券