文章/答案/技术大牛

发布

自然语言处理基础技术之语义角色标注实战

文章来源：企鹅号 - 小白人工智能入门

nlpnet语义角色标注

安装：pip install nlpnet

国内源安装：pip install nlpnet -i https://pypi.tuna.tsinghua.edu.cn/simple

1.nlpnet是一个基于神经网络的自然语言处理任务的Python库。目前，它支持词性标注、依存分析以及语义角色标记。

2.首先要下载预训练模型：http://nilc.icmc.usp.br/nlpnet/models.html#srl-portuguese 目前语义角色标注只提供了葡萄牙语的预训练模型

importnlpnet

tagger=nlpnet.SRLTagger('nlpnet-model\srl-pt',language='pt')

sents=tagger.tag(u'O rato roeu a roupa do rei de Roma.')[]

sents.arg_structures

[('roeu', {'A0': ['O', 'rato'], 'A1': ['a', 'roupa', 'do', 'rei', 'de', 'Roma'], 'V': ['roeu']})]

pyltp语义角色标注

pyltp安装有点麻烦-.-，这里记录window 10下的安装方法

1.首先，pip install pyltp安装报错：error: command 'C:\Program Files (x86)\Microsoft Visual Studio 14.0\VC\BIN\x86_amd64\cl.exe' failed with exit status 2

安装cmake，下载地址，https://cmake.org/download/

安装VS2008 EXPRESS，下载网址：https://visualstudio.microsoft.com/zh-hans/vs/express/

2.然后，我选择使用python setup.py install安装 - 下载pyltp，地址：https://github.com/hit-scir/pyltp - 下载ltp，地址：https://github.com/hit-scir/ltp - 解压ltp，然后将解压之后文件命名为ltp，覆盖pyltp文件夹中的ltp - 打开cmd，进入到pyltp目录下，找到setup.py - 先执行命令：python setup.py build - 然后执行命令：python setup.py install

使用里面的预训练模型，需要先下载，然后指定相应目录

下载地址：http://ltp.ai/download.html

要先进行分词，词性标注，依存分析

sentence="我爱自然语言处理技术！"

frompyltpimportSegmentorseg=Segmentor()#生成对象

seg.load("pyltp-model\ltp_data_v3.4.0\cws.model")#加载分词预训练模型

seg_words=seg.segment(sentence)print(" ".join(seg_words))

seg.release()#释放资源

我爱自然语言处理技术！

frompyltpimportPostagger pos=Postagger()#加载词性预训练模型

pos.load("pyltp-model\ltp_data_v3.4.0\pos.model")

words_pos=pos.postag(seg_words)

fork,vinzip(seg_words,words_pos):print(k+'\t'+v)pos.release()

我 r爱 v自然 n语言 n处理 v技术 n！ wp

frompyltpimportParserparser=Parser()parser.load("pyltp-model\ltp_data_v3.4.0\parser.model")

arcs=parser.parse(seg_words,words_pos)

print([(arc.head,arc.relation)forarcinarcs])

parser.release()

[(2, 'SBV'), (0, 'HED'), (4, 'ATT'), (5, 'FOB'), (2, 'VOB'), (5, 'VOB'), (2, 'WP')]

frompyltpimportSementicRoleLabellerlabeller=SementicRoleLabeller()

labeller.load("pyltp-model\ltp_data_v3.4.0\pisrl_win.model")

roles=labeller.label(seg_words,words_pos,arcs)

forroleinroles:print(role.index,"".join(["%s:(%d,%d)"%(arg.name,arg.range.start,arg.range.end)forarginrole.arguments]))

labeller.release()

1 A0:(0,0)A1:(2,5)4 A1:(5,5)

另外，代码我已经上传github：https://github.com/yuquanle/StudyForNLP/blob/master/NLPbasic/SRL.ipynb

更多个人笔记请关注：

公众号：StudyForAI（小白人工智能入门学习）

知乎专栏：https://www.zhihu.com/people/yuquanle/columns

发表于: 2018-12-052018-12-05 17:00:16
原文链接：https://kuaibao.qq.com/s/20181205A12Q4K00?refer=cp_1026
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货

自然语言处理基础技术之语义角色标注实战

相关快讯

扫码

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐