前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >自然语言处理之命名实体识别-tanfordcorenlp-NER(一)

自然语言处理之命名实体识别-tanfordcorenlp-NER(一)

作者头像
学到老
发布2019-01-25 11:01:54
2.2K0
发布2019-01-25 11:01:54
举报
文章被收录于专栏:深度学习之tensorflow实战篇

简介

CoreNLP 项目是Stanford开发的一套开源的NLP系统。包括tokenize, pos , parse 等功能,与SpaCy类似。SpaCy号称是目前最快的NLP系统, 并且提供现成的python接口,但不足之处就是目前还不支持中文处理, CoreNLP则包含了中文模型,可以直接用于处理中文, 但CoreNLP使用Java开发,python调用稍微麻烦一点。

Stanford CoreNLP是一个比较厉害的自然语言处理工具,很多模型都是基于深度学习方法训练得到的。

先附上其官网链接:

https://stanfordnlp.github.io/CoreNLP/index.html https://nlp.stanford.edu/nlp/javadoc/javanlp/ https://github.com/stanfordnlp/CoreNLP

安装Installation

windows 10 环境 安装依赖 1.首先需要配置JDK,安装JDK 1.8及以上版本。。 2.之后到 https://stanfordnlp.github.io/CoreNLP/history.html 下载对应的jar包。 将压缩包解压得到目录,再将语言的jar包放到这个目录下即可。 3.下载Stanford CoreNLP文件:http://stanfordnlp.github.io/CoreNLP/download.html

在这里插入图片描述
在这里插入图片描述

4.下载中文模型jar包(注意一定要下载这个文件,否则它默认是按英文来处理的)。

在这里插入图片描述
在这里插入图片描述

5.接下来py安装 stanfordcorenlp

在这里插入图片描述
在这里插入图片描述

6. 解压配置 下载完成后两个文件加起来1G+下载完成后两个文件加起来1G+

在这里插入图片描述
在这里插入图片描述

把解压后的Stanford CoreNLP文件夹下载的Stanford-chinese-corenlp-2018—models.jar放在同一目录下(注意:一定要在同一目录下,否则执行会报错)

在这里插入图片描述
在这里插入图片描述

7. 在Python中引用模型,执行下面语句:

from stanfordcorenlp import StanfordCoreNLP nlp=StanfordCoreNLP(r’D:\D:\stanford_nlp\stanford-corenlp-full-2018-10-05’,lang=‘zh’)

应用

代码语言:javascript
复制
#encoding="utf-8"
from stanfordcorenlp import StanfordCoreNLP
import os

if os.path.exists('D:\\stanford_nlp\\stanford-corenlp-full-2018-10-05'):
    print("corenlp exists")
else:
    print("corenlp not exists")
nlp=StanfordCoreNLP('D:\\stanford_nlp\\stanford-corenlp-full-2018-10-05',lang='zh')
sentence = '王明是清华大学的一个研究生'
print(nlp.ner(sentence))

输出: corenlp exists

[(‘王明’, ‘PERSON’), (‘是’, ‘O’), (‘清华’, ‘ORGANIZATION’), (‘大学’, ‘ORGANIZATION’), (‘的’, ‘O’), (‘一’, ‘NUMBER’), (‘个’, ‘O’), (‘研究生’, ‘O’)]

三、查看词性标注 在浏览器中访问:http://localhost:9000/

在这里插入图片描述
在这里插入图片描述
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2018年12月18日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 简介
  • 安装Installation
  • 应用
相关产品与服务
NLP 服务
NLP 服务(Natural Language Process,NLP)深度整合了腾讯内部的 NLP 技术,提供多项智能文本处理和文本生成能力,包括词法分析、相似词召回、词相似度、句子相似度、文本润色、句子纠错、文本补全、句子生成等。满足各行业的文本智能需求。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档