腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
房东的猫
专栏成员
举报
245
文章
377808
阅读量
62
订阅数
订阅专栏
申请加入专栏
全部文章(245)
Elasticsearch Service(88)
全文检索(41)
搜索引擎(37)
任务调度(18)
开发者实验室(14)
linux(14)
java(11)
对象存储(10)
官方产品(9)
归档存储(9)
架构设计(9)
spring boot(8)
数据结构(7)
jvm(6)
云数据库 SQL Server(5)
python(4)
vue.js(4)
中文分词(4)
即时通信 IM(4)
api(3)
spring(3)
单元测试(3)
openapi(3)
认证考试(2)
django(2)
flask(2)
ide(2)
lucene/solr(2)
域名注册(2)
scrapy(2)
git(1)
maven(1)
apache(1)
nginx(1)
element ui(1)
搜索文章
搜索
搜索
关闭
Elasticsearch分词:自定义分词器
Elasticsearch Service
中文分词
虽然Elasticsearch带有一些现成的分析器,然而在分析器上Elasticsearch真正的强大之处在于,你可以通过在一个适合你的特定数据的设置之中组合字符过滤器、分词器、词汇单元过滤器来创建自定义的分析器。
HLee
2021-07-20
7.3K
1
Elasticsearch分词:Ansj分词器
中文分词
Elasticsearch Service
这是一个基于n-Gram+CRF+HMM的中文分词的java实现。分词速度达到每秒钟大约200万字左右(mac air下测试),准确率能达到96%以上。目前实现了中文分词、中文姓名识别、用户自定义词典、关键字提取、自动摘要、关键字标记等功能。可以应用到自然语言处理等方面,适用于对分词效果要求高的各种项目。
HLee
2021-07-16
3.6K
0
Elasticsearch分词:拼音分词器
Elasticsearch Service
中文分词
Git地址:https://github.com/medcl/elasticsearch-analysis-pinyin
HLee
2020-12-28
2.1K
0
Elasticsearch分词:内置分词器
Elasticsearch Service
中文分词
"Set the shape to semi-transparent by calling set_trans(5)" 标准分词器(默认使用) 分词结果: set, the, shape, to, semi, transparent, by, calling, set_trans, 5 POST _analyze { "analyzer": "standard", "text": "Like X 国庆放假的" } { "tokens" : [ { "token"
HLee
2020-12-18
2.1K
0
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
立即查看
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档