首页
学习
活动
专区
工具
TVP
发布

hanlp学习笔记

专栏成员
21
文章
20575
阅读量
17
订阅数
汉语言处理包Hanlp的使用
本来想通过python调用Java实现Hanlp的使用,参考文章:http://t.cn/RUrIF7z
用户3492023
2018-12-04
8160
汉语言处理包Hanlp的使用
本来想通过python调用Java实现Hanlp的使用,参考文章:http://t.cn/RUrIF7z
用户3492023
2018-11-21
6310
Eclipse安装试用Hanlp
http://hanlp.linrunsoft.com/services.html
用户3492023
2018-11-21
6180
Eclipse安装试用Hanlp
http://hanlp.linrunsoft.com/services.html
用户3492023
2018-11-09
6150
NLP学习------HanLP使用实验
在之前的实验中得到了不在词向量里的词与分词结果,结果有500多个词不在词向量里,解决方案就是重新分词,或再追加训练这些词到词向量里。但后者相对麻烦且目前样本量不大。我跟据词向量的作者[6]所使用的分词工具来分词,会比不同工具(jieba)的效果要好,因为都是同一模式的分词,分出来的词应该都会存在于大型语料库中。实验证明思路是对的,最后结果是只有60几个词不在词向量里,其中大部分为名词,还有些为因语音翻译问题所造成的出错连词,所有这些词也只出现一次,这部分可以考虑最后删去也不会影响结果。改善未出现词是个关键步骤,因为此后模型会用到词向量,如果未出现词过多,会影响词向量效果。
用户3492023
2018-10-15
9630
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档