前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >AllenNLP系列文章之五:语义角色标注

AllenNLP系列文章之五:语义角色标注

作者头像
sparkexpert
发布2019-05-27 19:12:51
1.8K0
发布2019-05-27 19:12:51
举报

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://cloud.tencent.com/developer/article/1436703

代码语言:txt
复制
 序列标注,是自然语言处理的基础工作,它广义上可以将分词、词性标注、实体识别、依存分析等NLP的基础工作都涵盖在内。序列标注问题是NLP中最常见的问题,因为绝大多数NLP问题都可以转化为序列标注问题,虽然很多NLP任务看上去大不相同,但是如果转化为序列标注问题后其实面临的都是同一个问题。所谓“语义角色标注”,它是句子分析的重要工具之一。语义角色标注(SRL)系统的目标是恢复一个句子的谓词-论元结构,来做出基本判断:“谁对谁做了什么”,“何时”和“哪里”。
代码语言:txt
复制
传统的最常用的解决序列标注问题的方案是最大熵、CRF等模型,尤其是CRF,基本是最主流的方法。随着深度学习的不断探索和发展,LSTM+CRF等成为解决序列标注问题的标配解决方案。

AllenNLP提供了序列标注的模型,其基本介绍如下:

Semantic Role Labeling

Semantic Role Labeling (SRL) models recover the latent predicate argument structure of a sentence. SRL builds representations that answer basic questions about sentence meaning, including "who" did "what" to “whom," etc. The AllenNLP SRL model is a reimplementation of a deep BiLSTM model (He et al, 2017). The implemented model closely matches the published model, achieving a F1 of 78.9% on English Ontonotes 5.0 dataset using the CONLL 2011/12 shared task format. These results were state of the art in 2017.

1、论文原理

代码语言:txt
复制
  论文采用了ACL 2017年论文《Deep Semantic Role Labeling: What Works and What’s Next》来实现序列标注。该论文也被称为:取得了NLP “2005 年以来首个大突破”,在准确率提升了10%。
代码语言:txt
复制
   该论文引入了一个新的深度学习模型(如下图),显著提高了现有技术水平,同时对其优缺点进行了详细的分析。我们使用了约束译码(constrained decoding)的深度 highway BiLSTM 架构,同时考察了近来初始化和正则化的最佳做法。我们的 8 层模型在 CoNLL 2005 测试集上达到 83.2 F1,在 CoNLL 2012 测试集上达到了 83.4 F1。与以前的技术水平相比,大约减少了 10% 的相对误差率。对研究结果的实证分析表明:(1)深度模型在恢复长距离语义依存关系方面表现出色,但仍然会犯明显错误;(2)语义分析仍然有改进空间。
代码语言:txt
复制
   该模型的成功有两个原因:(1)应用训练深度循环神经网络中的最新进展,如 highway connections(Srivastava等,2015)和RNN dropout(Gal和Ghahramani,2016)(2)使用A \*解码算法(Lewis 和Steedman,2014; Lee 等人,2016),以强化预测时间的结构一致性,而不增加训练过程的复杂性。

2、论文实践 AllenNLP

(1) 测试句子:The sentence has a verb.

(2) 测试句子:However, voters decided that if the stadium was such a good idea someone would build it himself, and rejected it 59% to 41%.

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2018年04月09日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Semantic Role Labeling
相关产品与服务
NLP 服务
NLP 服务(Natural Language Process,NLP)深度整合了腾讯内部的 NLP 技术,提供多项智能文本处理和文本生成能力,包括词法分析、相似词召回、词相似度、句子相似度、文本润色、句子纠错、文本补全、句子生成等。满足各行业的文本智能需求。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档