hanlp学习笔记

21 篇文章
14 人订阅

其他

用户3492023

python调用HanLP

首先各种坑,jdk和python 版本位数必须一致,我用的是JPype1-py3 版本号0.5.5.2 、1.6jdk和Python3.5,win7 64位下亲...

1220
用户3492023

hanlp源码解析之中文分词算法

词图指的是句子中所有词可能构成的图。如果一个词A的下一个词可能是B的话,那么A和B之间具有一条路径E(A,B)。一个词可能有多个后续,同时也可能有多个前驱,它们...

1622
用户3492023

hanlp安装和使用

在https://github.com/hankcs/HanLP/releases中下载data然后覆盖HanLP-1.3.4.zip解压后的data

2133
用户3492023

hanlp安装和使用

在https://github.com/hankcs/HanLP/releases中下载data然后覆盖HanLP-1.3.4.zip解压后的data

1320
用户3492023

Spark应用HanLP对中文语料进行文本挖掘--聚类

用到的知识:HanLP、Spark TF-IDF、Spark kmeans、Spark mapPartition;

1270
用户3492023

hanlp中的N最短路径分词

N-最短路径 是中科院分词工具NLPIR进行分词用到的一个重要算法,张华平、刘群老师在论文《基于N-最短路径方法的中文词语粗分模型》中做了比较详细的介绍。该算法...

1430
用户3492023

HanLP分词器的使用方法

之前我有想过用机器学习的方法来进行词法分析,但是在项目中测试时正确率不够。于是这时候便有了 HanLP-汉语言处理包 来进行提取关键词的想法。

1950
用户3492023

Hanlp使用Bug记录

最近一直比较忙,好多私信也没时间回复。以后要完全从CV转NLP,所以博客内容可能要作调整了。

1000

扫码关注云+社区

领取腾讯云代金券