专栏首页arxiv.org翻译专栏土耳其命名实体识别中最新神经序列标签模型的评估(CS CL)
原创

土耳其命名实体识别中最新神经序列标签模型的评估(CS CL)

命名实体识别(NER)是一项经过广泛研究的任务,用于提取文本中的命名实体并对其进行分类。NER不仅在下游语言处理应用程序(例如关系提取和问题解答)中至关重要,而且在大规模大数据操作(例如在线数字媒体内容的实时分析)中也至关重要。最近对土耳其语的研究工作表明,土耳其语是一种形态学丰富的自然语言,很少有人研究,它通过将任务表述为序列标签问题,证明了神经结构在格式正确的文本上的有效性,并产生了最新的结果。在这项工作中,我们以经验方式研究了在同一环境中为土耳其语NER标签建议的最新神经体系结构(双向长短期记忆和基于变压器的网络)的使用。我们的结果表明,可以对远程上下文进行建模的基于变压器的网络克服了BiLSTM网络的局限性,在BiLSTM网络中,字符,子词和词级别使用了不同的输入特征。我们还提出了一种基于变压器的网络,该网络具有条件随机场(CRF)层,可在公共数据集上得出最新结果(95.95%的f度量)。我们的研究有助于量化迁移学习对处理形态丰富的语言的影响的文献。95%的f度量)。我们的研究有助于量化迁移学习对处理形态丰富的语言的影响的文献。95%的f度量)。我们的研究有助于量化迁移学习对处理形态丰富的语言的影响的文献。

原文标题:An Evaluation of Recent Neural Sequence Tagging Models in Turkish Named Entity Recognition

原文:Named entity recognition (NER) is an extensively studied task that extracts and classifies named entities in a text. NER is crucial not only in downstream language processing applications such as relation extraction and question answering but also in large scale big data operations such as real-time analysis of online digital media content. Recent research efforts on Turkish, a less studied language with morphologically rich nature, have demonstrated the effectiveness of neural architectures on well-formed texts and yielded state-of-the art results by formulating the task as a sequence tagging problem. In this work, we empirically investigate the use of recent neural architectures (Bidirectional long short-term memory and Transformer-based networks) proposed for Turkish NER tagging in the same setting. Our results demonstrate that transformer-based networks which can model long-range context overcome the limitations of BiLSTM networks where different input features at the character, subword, and word levels are utilized. We also propose a transformer-based network with a conditional random field (CRF) layer that leads to the state-of-the-art result (95.95\% f-measure) on a common dataset. Our study contributes to the literature that quantifies the impact of transfer learning on processing morphologically rich languages.

原文作者:Gizem Aras, Didem Makaroglu, Seniz Demir, Altan Caki

原文地址:https://arxiv.org/abs/2005.07692

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 一组最大化提高被检测物体的数量和质量的无人机监控器位置的自主和协作设计(CS AI)

    本文解决了将无人机群放置在完全未知的地形内的问题,目的是最大限度地提高整体态势感知能力。情境意识是由无人机视场内感兴趣的独特对象的数量和质量表示的。使用YOLO...

    刘子蔚
  • 研究用于社交媒体中仇恨语音检测的深度学习方法(CS CL)

    互联网的迅猛发展有助于增强个人的表达能力,但滥用表达自由的行为也导致各种网络犯罪和反社会活动的增加。仇恨言论就是一个这样的问题,需要非常认真地解决,否则,这可能...

    刘子蔚
  • 策略渐变方法的操作员视图(CS AI)

    我们将策略梯度方法转换为两个运算符的重复应用:策略改进运算符 一世,它映射任何策略 π 更好的一个 一世π和投影运算符 P,它找到的最佳近似值 一世π在可实现的...

    刘子蔚
  • 大图像数据集:计算机视觉的胜利吗?(CS CY)

    本文中,我们调查了有问题的做法和大规模视觉数据集的后果。我们研究了广泛的问题,例如同意和正义问题,以及特定的问题,例如在数据集中包含可验证的色情图片。以Imag...

    小童
  • 数据分段算法:单变量均值变化

    数据分割,即多变化点分析在时间序列分析和信号处理中的重要性,在自然科学和社会科学、医学、工程和金融等各个领域的应用,得到了相当大的关注。 在本次调查的第一部分...

    zstt8054929
  • 利用多语言变换器进行仇恨的语音检测(cs.CL)

    检测和分类社交媒体文本中的仇恨实例是近年来自然语言处理领域的一个重要问题。我们的工作利用最先进的Transformer语言模型来识别多语言环境中的仇恨言论。要捕...

    用户8078797
  • 语言与领域假说在范畴学习中的相互作用(CS)

    对于要学习以对世界各地进行分类和区分的人们而言,他们对潜在类别结构所持的一组假设与他们的学习过程直接相关。在这项工作中,我们检查了两个过度假设对于类别学习的影响...

    用户8078865
  • 2018 MCM Problem B C Notes

    2018 MCM Problem B: How Many Languages?(pr1)

    magic2728
  • A Tutorial on Energy-Based Learning

    Yann LeCun, Sumit Chopra, Raia Hadsell, Marc’Aurelio Ranzato, and Fu Jie Huang T...

    用户1908973
  • 捕捉在阿根廷COVID-19大流行期间的社交媒体表达,并预测心理健康和情绪

    目的:我们提出了一种基于社交媒体中使用的语言表达方式来预测COVID-19大流行期间特定人群的心理健康状况和情绪的方法。这种方法可以在短期到中期的时间范围内预测...

    VasiliaSun

扫码关注云+社区

领取腾讯云代金券