首页
学习
活动
专区
工具
TVP
发布

房东的猫

专栏作者
245
文章
352063
阅读量
61
订阅数
Elasticsearch分词:自定义分词器
虽然Elasticsearch带有一些现成的分析器,然而在分析器上Elasticsearch真正的强大之处在于,你可以通过在一个适合你的特定数据的设置之中组合字符过滤器、分词器、词汇单元过滤器来创建自定义的分析器。
HLee
2021-07-20
6.5K1
Elasticsearch分词:Ansj分词器
这是一个基于n-Gram+CRF+HMM的中文分词的java实现。分词速度达到每秒钟大约200万字左右(mac air下测试),准确率能达到96%以上。目前实现了中文分词、中文姓名识别、用户自定义词典、关键字提取、自动摘要、关键字标记等功能。可以应用到自然语言处理等方面,适用于对分词效果要求高的各种项目。
HLee
2021-07-16
3.4K0
Elasticsearch分词:拼音分词器
Git地址:https://github.com/medcl/elasticsearch-analysis-pinyin
HLee
2020-12-28
1.9K0
Elasticsearch分词:内置分词器
"Set the shape to semi-transparent by calling set_trans(5)" 标准分词器(默认使用) 分词结果: set, the, shape, to, semi, transparent, by, calling, set_trans, 5 POST _analyze { "analyzer": "standard", "text": "Like X 国庆放假的" } { "tokens" : [ { "token"
HLee
2020-12-18
2.1K0
没有更多了
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档