基于stanza实现Python3调用Stanford NLP

stanford NLP(源码:https://github.com/stanfordnlp/CoreNLP)是业界非常著名的自然语言处理(NLP)套件之一,提供了面向多种语言的多种自然语言处理任务,具体如下:

Stanford Parser

Stanford POS Tagger

Stanford Named Entity Recognizer

Stanford RegexNER

Stanford Coreference Resolution

Stanford Word Segmenter

Stanford Classifier

Stanford EnglishTokenizer

Stanford TokensRegex

Stanford Temporal Tagger (SUTime)

Stanford Pattern-based Information Extraction and Diagnostics (SPIED)

Stanford Relation Extractor

(1)stanza工程介绍

实现python来调用stanford NLP,是PYTHON程序员进行数据处理经常需要用到的工具,coreNLP本身也提供了官方进行python调用的程序包(https://github.com/stanfordnlp/python-stanford-corenlp),而本文主要是基于stanforfd提供的另外一个开源程序stanza(https://github.com/stanfordnlp/stanza)来实现python调用。

其介绍如下:

Stanza is the Stanford NLP group’s shared repository for Python infrastructure. The goal of Stanza is not to replace your modeling tools of choice, but to offer implementations for common patterns useful for machine learning experiments.

(2)stanza调用的步骤

A:启动coreNLP服务,在下载包中,进行服务的启动

# Run the server using all jars in the current directory (e.g., the CoreNLP home directory)
java -mx4g -cp "*" edu.stanford.nlp.pipeline.StanfordCoreNLPServer -port 9000 -timeout 15000

主要启动界面如下:

B:在浏览器中输入网址:http://localhost:9000,可以进行测试和查看NLP处理结果。

(3)基于stanza来实现corenlp调用。

这里采用python3来进行源码的重构,去掉一些原始python2.*风格的错误。

原创声明,本文系作者授权云+社区-专栏发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏量子位

GitHub上大热的Deep Photo终于有TensorFlow版了!

王小新 编译整理 量子位 出品 | 公众号 QbitAI Prisma这个应用,你可能很熟悉。这是一个能将不同的绘画风格,迁移到照片中,形成不同艺术风格的图片。...

3496
来自专栏数据派THU

机器学习和深度学习视频资料精选(附学习资料)

来源:大数据挖掘DT数据分析 本文长度为633字,建议阅读3分钟。 本文为你介绍机器学习和深度学习的视频资料。 第一部分 基础语言 pandax视频教程链接: ...

5128
来自专栏应兆康的专栏

19. 总结:基本错误分析

1151
来自专栏SnailTyan

Caffe模型对比

Caffe模型训练完成后,在实际生产环境中部署时需要对Caffe模型使用的显存(使用CPU时是内存)及模型分类的时间进行评估,下面是对比结果。测试使用的GPU为...

2167
来自专栏AI研习社

Github 项目推荐 | 用手势输入表情符号 —— Emojinator

此代码可以帮助开发者识别和分类不同的 Emoji 图像,不过目前只支持手绘的 Emoji 图像。

823
来自专栏专知

【前沿】见人识面,TensorFlow实现人脸性别/年龄识别

【导读】近期,浙江大学学生Boyuan Jiang使用TensorFlow实现了一个人脸年龄和性别识别的工具,首先使用dlib来检测和对齐图片中的人脸,然后使用...

8046
来自专栏专知

在浏览器上也能训练神经网络?TensorFlow.js带你玩游戏~

【导读】一直以来训练神经网络给我们的印象都是复杂、耗时、对硬件要求高。你有没有想过有一天在浏览器上也能训练神经网络~ 本文通过一篇详细的TensorFlow.j...

830
来自专栏IT派

资源 | 深度学习图像标注工具汇总

对于监督学习算法而言,数据决定了任务的上限,而算法只是在不断逼近这个上限。世界上最遥远的距离就是我们用同一个模型,但是却有不同的任务。但是数据标注是个耗时耗力的...

842
来自专栏目标检测和深度学习

YOLO v3的tf+keras实现

1354
来自专栏YoungGy

ML基石_12_NonLinearTransformation

retro quadratic hypothesis nonlinear transform price on nonlinear transform stru...

1778

扫码关注云+社区