专栏首页arxiv.org翻译专栏古典法国剧院放词和POS标签的语料库和模型(CS CL)
原创

古典法国剧院放词和POS标签的语料库和模型(CS CL)

本文介绍了为法国古典文学建立带注释的语料库和训练模型的过程,重点是戏剧,尤其是诗歌中的喜剧。它最初是作为在Cafiero和Camps [2019]中进行的笔势分析的第一步而开发的。使用基于神经网络和CRF标记器的最新lemmatiser可以实现超出域内测试的当前技术水平的精度,并且在域外测试(即第20位)中被证明是可靠的c.novels。

原文标题:Corpus and Models for Lemmatisation and POS-tagging of Classical French Theatre

原文:This paper describes the process of building an annotated corpus and training models for classical French literature, with a focus on theatre, and particularly comedies in verse. It was originally developed as a preliminary step to the stylometric analyses presented in Cafiero and Camps [2019]. The use of a recent lemmatiser based on neural networks and a CRF tagger allows to achieve accuracies beyond the current state-of-the art on the in-domain test, and proves to be robust during out-of-domain tests, i.e.up to 20th c.novels.

原文作者:Jean-Baptiste Camps, Simon Gabay, Paul Fièvre, Thibault Clérice, Florian Cafiero

原文地址:https://arxiv.org/abs/2005.07505

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 基于深度学习技术的自动问答医学模型(CS CL)

    人工智能现在可以为不同的问题提供更多的解决方案,尤其是在医疗领域。这些问题之一是缺少对任何给定的医疗/健康相关问题的答案。互联网上充斥着许多论坛,人们可以通过这...

    刘子蔚
  • 超越排行榜:揭示自然语言推理数据和模型中弱点的方法的调查(CS CL)

    近年来,越来越多的出版物分析自然语言推理(NLI)数据集的表面暗示,它们是否破坏了这些数据集背后的任务的复杂性,以及它们如何影响对这些数据进行优化和评估的模型。...

    刘子蔚
  • 用于学习多模式表示的自适应变压器(CS CL)

    转换器的使用已从学习语言语义发展为形成有意义的视觉语言表示。这些架构经常被参数化,需要大量的计算。在这项工作中,我们扩展了自适应方法,以更多地了解模型的可解释性...

    刘子蔚
  • 通过位置历史评估疾病暴露风险并保护隐私:应对全球流行病的密码学方法(CS AI)

    世界各地的政府和研究人员正在实施数据联系追踪解决方案,以阻止传染病COVID-19的传播。这些解决方案中的大多会威胁个人权利和隐私。我们的目标是打破接触追踪中高...

    用户7035935
  • 5G的构建:构建端到端支持5G的系统(CS)

    本文介绍了世界上第一个商用前符合标准的端到端5G系统。本文聚焦于标准化的5G架构,包括底层3GPP组件、ETSI网络功能虚拟化(NFV)管理和编排功能。我们讨论...

    Pamela_Lin
  • 基于需求的黑箱反应系统自动化测试(CS)

    本文提出了一种黑箱无功系统一致性测试的新方法。我们将系统规范视为线性时序逻辑公式,将测试生成为输入/输出对序列:输入从对应于规范的Buchi自动机中提取,输出通...

    蔡秋纯
  • 从外表和行为来检测假冒视频(multimedia)

    合成生成的音频和视频——所谓的“深度伪造”——继续吸引着计算机图形和计算机视觉社区的想象力。与此同时,技术的民主化仍然令人担忧,因为它有可能破坏民主选举,造成小...

    用户6869393
  • 蝙蝠式在结构上栖息动作的仿生研究:惯性动力学(CS RO)

    蝙蝠的飞行特性在无人机设计中被忽视了。与其他动物不同,蝙蝠在栖息时利用惯性动力学来表现空中翻转。受这一独特动作的启发,这项工作开发并使用了一个名为“鱼叉”的微型...

    时代在召唤
  • Flink Forward 2019系列文章--实战相关(1)--农业机械公司John Deere

    How John Deere uses Flink to process millions of sensor measurements per second-...

    阿泽
  • Python Algorithms - C1 Introduction

    算法导论是一本经典的大而全的算法书籍,而本书Python Algorithms不是来取代而是来补充算法导论的,因为算法导论提供的是简易的伪代码和详细的证明,而本...

    宅男潇涧

扫码关注云+社区

领取腾讯云代金券