前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Hanlp汉字转拼音使用python调用详解

Hanlp汉字转拼音使用python调用详解

作者头像
IT小白龙
修改2019-03-21 10:35:33
7160
修改2019-03-21 10:35:33
举报

1、hanlp简介

HanLP是一系列模型与算法组成的NLP工具包,由大快搜索主导并完全开源,目标是普及自然语言处理在生产环境中的应用。HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。

开源网址:HanLP: Han Language Processing

但由于hanlp是用java来实现的,要在python中使用hanlp,只能通过调用pyhanlp这个包来。

但是pyhanlp里面有一些功能仍然不支持python直接调用,比如汉字转拼音,这时候就需要从python中启动jvm并指定Hanlp的jar路径来使用其他功能了。

2、下载并配置文件

(1)从开源网址中下载jar、data、hanlp.properties并修改配置文件:

1、下载:data.zip

下载后解压到任意目录,接下来通过配置文件hanlp.properties告诉HanLP数据包的位置。

data

├─dictionary

└─model

用户可以自行增删替换,如果不需要句法分析等功能的话,随时可以删除model文件夹。

3、下载jar和配置文件:hanlp-release.zip

(1)配置文件hanlp.properties的作用是告诉HanLP数据包的位置,只需修改第一行为data的父目录即可:

root=D:/JavaProjects/HanLP/

比如data目录是/Users/hankcs/Documents/data,那么root=/Users/hankcs/Documents/ 。

(2)从python中启动jvm以及添加jar包路

其中-Djava.class.path是用来添加jar包到classpath中,然后用startJVM来启动jvm。

startJVM第一个参数是系统内的jvm位置,第二个为*arg参数,此处放置classpath。

以上得到的是java的ArrayList类型,需要将他装换为string类型:

结果如下:

4、最后记得关闭JVM

本文系转载,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文系转载前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
NLP 服务
NLP 服务(Natural Language Process,NLP)深度整合了腾讯内部的 NLP 技术,提供多项智能文本处理和文本生成能力,包括词法分析、相似词召回、词相似度、句子相似度、文本润色、句子纠错、文本补全、句子生成等。满足各行业的文本智能需求。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档