腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
hadoop学习笔记
专栏成员
举报
176
文章
190551
阅读量
28
订阅数
订阅专栏
申请加入专栏
全部文章(176)
编程算法(38)
java(34)
大数据(29)
其他(24)
NLP 服务(22)
hadoop(22)
中文分词(19)
开源(17)
python(14)
jar(12)
git(10)
分布式(9)
github(8)
http(7)
机器学习(6)
sql(6)
linux(6)
缓存(6)
txt(6)
神经网络(5)
c++(4)
html(4)
api(4)
apache(4)
spring(4)
spark(4)
jvm(4)
面向对象编程(4)
Elasticsearch Service(4)
node.js(3)
xml(3)
maven(3)
analyzer(3)
深度学习(3)
人工智能(3)
大数据解决方案(3)
存储(3)
数据处理(3)
dictionary(3)
数据库(2)
云数据库 SQL Server(2)
nosql(2)
ide(2)
eclipse(2)
tomcat(2)
搜索引擎(2)
mapreduce(2)
网站(2)
政务云专区(2)
运维(2)
压力测试(2)
数据可视化(2)
数据结构(2)
https(2)
hbase(2)
code(2)
data(2)
jieba(2)
text(2)
登录(2)
对象存储(1)
负载均衡(1)
腾讯云gme(1)
区块链(1)
自动驾驶(1)
数据挖掘(1)
bash(1)
css(1)
android(1)
云数据库 Redis(1)
打包(1)
全文检索(1)
lucene/solr(1)
nginx(1)
bash 指令(1)
容器镜像服务(1)
文件存储(1)
TDSQL MySQL 版(1)
腾讯云测试服务(1)
电商(1)
数据安全(1)
容器(1)
互联网金融(1)
爬虫(1)
无人驾驶(1)
hive(1)
spring boot(1)
hashmap(1)
监督学习(1)
cdn(1)
kernel(1)
gradle(1)
spring cloud(1)
anaconda(1)
数据分析(1)
windows(1)
系统架构(1)
微服务(1)
nat(1)
腾讯云开发者社区(1)
云计算(1)
虚拟化(1)
es(1)
智能推荐平台(1)
load(1)
naivebayes(1)
properties(1)
python3(1)
root(1)
工具(1)
搜索文章
搜索
搜索
关闭
HanLP-最短路径分词
node.js
github
java
https
git
今天介绍的内容是最短路径分词。最近换回了thinkpad x1,原因是mac的13.3寸的屏幕看代码实在是不方便,也可能是人老了吧,^_^。等把HanLP词法分析介绍结束后,还是会换回macbook pro的。个人有强迫症,只要看或写Java或C/C++代码或者用开发机的化,还是喜欢在windows下工作。看论文特别是理论的研究还是习惯用mac了。感觉开发还是windows比较顺手,理论研究还是mac比较顺手。
IT小白龙
2019-06-05
815
0
部分常用分词工具使用整理
git
github
开源
中文分词
面向对象编程
HanLP是一系列模型与算法组成的NLP工具包,由大快搜索主导并完全开源,目标是普及自然语言处理在生产环境中的应用。HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。
IT小白龙
2019-05-29
1.3K
0
自然语言处理工具pyhanlp分词与词性标注
java
python
git
github
Pyhanlp分词与词性标注的相关内容记得此前是有分享过的。可能时间太久记不太清楚了。以下文章是分享自“baiziyu”所写(小部分内容有修改),供大家学习参考之用。
IT小白龙
2019-05-18
978
0
java中利用hanlp比较两个文本相似度的步骤
github
jar
智能推荐平台
使用 HanLP - 汉语言处理包 来处理,他能处理很多事情,如分词、调用分词器、命名实体识别、人名识别、地名识别、词性识别、篇章理解、关键词提取、简繁拼音转换、拼音转换、根据输入智能推荐、自定义分词器
IT小白龙
2019-05-06
3K
0
如何在java中去除中文文本的停用词
github
git
开源
第一步:先将中文文本进行分词,这里使用的HanLP-汉语言处理包进行中文文本分词。
IT小白龙
2019-04-29
1.3K
0
中文自然语言处理工具HanLP源码包的下载使用记录
NLP 服务
ide
github
git
开源
这篇文章主要分享的是hanlp自然语言处理源码的下载,数据集的下载,以及将让源代码中的demo能够跑通。Hanlp安装包的下载以及安装其实之前就已经有过分享了。本篇文章主要还是备忘之用,同时算是给新手朋友的一些参考吧!
IT小白龙
2019-02-15
1.2K
0
目前常用的自然语言处理开源项目/开发包大汇总
NLP 服务
github
git
开源
中文分词
中文主要有:NLTK,FoolNLTK,HanLP(java版本),pyhanlp(python版本),Ansj,THULAC,结巴分词,FNLP,哈工大LTP,中科院ICTCLAS分词,GATE,SnowNLP,东北大学NiuTrans,NLPIR,;
IT小白龙
2018-11-26
3K
0
Android环境下hanlp汉字转拼音功能的使用介绍
android
github
jar
git
开源
由于项目需要在Android手机设备上实现汉字转拼音功能(支持多音字),于是首先想到了Pinyin4j+多音字映射对照表的实现方案,并在项目中试用了一段时间,发现数据量大时,其耗时非常严重。后来寻找其他方案,在github上找到了HanLP开源库,其多音字转换速度非常快,但是没有针对Android平台进行适配,于是对代码进行了一些修改,终于可以在Android手机上运行。修改后的工程已上传至github,如有需要,可以clone HanLP-Android代码后,导出jar文件使用。
IT小白龙
2019-04-01
730
0
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
立即查看
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档