前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >初学者|一步步掌握FoolNLTK

初学者|一步步掌握FoolNLTK

作者头像
yuquanle
发布2019-10-08 16:41:36
4580
发布2019-10-08 16:41:36
举报
文章被收录于专栏:AI小白入门AI小白入门

跟着博主的脚步,每天进步一点点

本文介绍了FoolNLTK的使用方法,是一个使用双向 LSTM 构建的便捷的中文处理工具包,该工具不仅可以实现分词、词性标注和命名实体识别,同时还能使用用户自定义字典加强分词的效果。

简介

FoolNLTK是一个使用双向 LSTM 构建的便捷的中文处理工具包,该工具不仅可以实现分词、词性标注和命名实体识别,同时还能使用用户自定义字典加强分词的效果。根据该项目所述,这个中文工具包可能不是最快的开源中文分词,但很可能是最准的开源中文分词。

Github地址:https://github.com/rockyzhengwu/FoolNLTK

实战

1.安装

代码语言:javascript
复制
# 基于神经网络(BiLSTM)训练
# 可能不是最快但是最精确的中文分词工具
# 高精度的分词,词性标注,实体识别
# Java版本:https://github.com/rockyzhengwu/JFoolNLTK
# 我的安装环境:- window10 - python 3.56
# pip install foolnltk -i https://pypi.tuna.tsinghua.edu.cn/simple

2.分词

代码语言:javascript
复制
import fool
sentence = "我爱自然语言处理!"
sen_cut = (fool.cut(sentence))
print(sen_cut)

[['我', '爱', '自然', '语言', '处理', '!']]

3.词性标注

代码语言:javascript
复制
sen_cut = (fool.cut(sentence))
print(fool.pos_cut(sentence))

[[('我', 'r'), ('爱', 'v'), ('自然', 'n'), ('语言', 'n'), ('处理', 'v'), ('!', 'wt')]]

4.命名实体识别

代码语言:javascript
复制
sentence = "我想去北京学习自然语言处理!"
words, ners = fool.analysis(sentence)
print(ners)

[[(3, 6, 'location', '北京')]]

代码已上传:https://github.com/yuquanle/StudyForNLP/blob/master/NLPtools/FoolNLTKDemo.ipynb

The End

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-10-05,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AI小白入门 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
NLP 服务
NLP 服务(Natural Language Process,NLP)深度整合了腾讯内部的 NLP 技术,提供多项智能文本处理和文本生成能力,包括词法分析、相似词召回、词相似度、句子相似度、文本润色、句子纠错、文本补全、句子生成等。满足各行业的文本智能需求。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档