基于stanza实现Python3调用Stanford NLP

stanford NLP(源码:https://github.com/stanfordnlp/CoreNLP)是业界非常著名的自然语言处理(NLP)套件之一,提供了面向多种语言的多种自然语言处理任务,具体如下:

Stanford Parser

Stanford POS Tagger

Stanford Named Entity Recognizer

Stanford RegexNER

Stanford Coreference Resolution

Stanford Word Segmenter

Stanford Classifier

Stanford EnglishTokenizer

Stanford TokensRegex

Stanford Temporal Tagger (SUTime)

Stanford Pattern-based Information Extraction and Diagnostics (SPIED)

Stanford Relation Extractor

(1)stanza工程介绍

实现python来调用stanford NLP,是PYTHON程序员进行数据处理经常需要用到的工具,coreNLP本身也提供了官方进行python调用的程序包(https://github.com/stanfordnlp/python-stanford-corenlp),而本文主要是基于stanforfd提供的另外一个开源程序stanza(https://github.com/stanfordnlp/stanza)来实现python调用。

其介绍如下:

Stanza is the Stanford NLP group’s shared repository for Python infrastructure. The goal of Stanza is not to replace your modeling tools of choice, but to offer implementations for common patterns useful for machine learning experiments.

(2)stanza调用的步骤

A:启动coreNLP服务,在下载包中,进行服务的启动

# Run the server using all jars in the current directory (e.g., the CoreNLP home directory)
java -mx4g -cp "*" edu.stanford.nlp.pipeline.StanfordCoreNLPServer -port 9000 -timeout 15000

主要启动界面如下:

B:在浏览器中输入网址:http://localhost:9000,可以进行测试和查看NLP处理结果。

(3)基于stanza来实现corenlp调用。

这里采用python3来进行源码的重构,去掉一些原始python2.*风格的错误。

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏生信技能树

得到一个物种所有基因的TSS(转录起始位点)区域的bed文件。

首先在UCSC的table browser 里面下载下面这个文件: ? 可以看到我这里选择的mm10的refseq系统的所有基因,共有29037个不同的tss,...

3068
来自专栏AI研习社

Github 项目推荐 | 基于 Unity/OpenAI Gym/PyTorch/TF 的深度强化学习研究框架

SLM Lab 是一个基于 Unity, OpenAI Gym, PyTorch, Tensorflow 的深度增强学习研究框架。

1162
来自专栏黑白安全

高清无码!比鬼片还刺激!且听“诡娃”远控的这首惊魂曲

近日,360云安全系统发现一款名为“诡娃”的远控木马,正通过钓鱼软件、网页挂马等多渠道扩散。“诡娃”除了能进行操控中招电脑等行为外,还会通过控制指令让中招机器弹...

692
来自专栏DeveWork

WordPress Ajax 异步加载 自定义评论表情

最近为了考试都复习成狗熊样啦~~我要缓缓折腾折腾WordPress 先。今天带来本人最新的折腾成果: Ajax异步加载自定义评论表情。由于评论表情那22个gif...

1949
来自专栏Coding01

有机器人要菜单没什么用

微信开发,从未如此简单 每一个功能设计,都经过精心打磨,只为了提供更好的开发体验 https://www.easywechat.com/

692
来自专栏王金龙的专栏

编程语言中那些有趣的命名

      学习NodeJS的时候,一定会用到其包管理器npm。npm的字面意思是node package manager,实际的含义也是这样,但是npm真正的...

732
来自专栏Android 技术栈

Macbook Pro键帽拆解安装图文教程

前段时间把可乐洒在电脑上了,大概有1/5的罐装可乐,紧急之下把电脑翻转过来,万幸的是电脑没出问题。就是过了两天之后,键盘黏黏的,特别是空格键。 送修的话,这属...

1K1
来自专栏人工智能头条

Python热门文章推荐Top10

1304
来自专栏Android开发经验

调用系统相机拍照,并且保存到系统相册的一般套路

1285
来自专栏二次元

给你的博客加上个Live2D看板娘吧

本文章中所用模型解包自药水制作师手机游戏,版权归该官方所有。(没错,我也是来安利这款游戏的)

1320

扫码关注云+社区