腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
山行AI
山行AI(原开发架构二三事),后续专注于AI应用领域
专栏成员
举报
303
文章
763748
阅读量
57
订阅数
订阅专栏
申请加入专栏
全部文章(303)
模型(85)
https(69)
数据(55)
网络安全(54)
java(50)
编程算法(47)
开源(39)
http(28)
数据库(26)
node.js(23)
工具(19)
javascript(17)
存储(17)
大数据(16)
代理(16)
sql(15)
github(15)
搜索(15)
flink(14)
spring(13)
html(12)
linux(12)
机器人(12)
gpt(11)
系统(11)
云数据库 Redis(10)
容器(10)
数据结构(10)
Elasticsearch Service(10)
测试(10)
开发(10)
php(9)
网站(9)
dubbo(9)
部署(9)
api(8)
教程(8)
框架(8)
配置(8)
go(7)
bash(7)
云数据库 SQL Server(7)
git(7)
bash 指令(7)
人工智能(7)
缓存(7)
openai(7)
服务器(7)
nginx(6)
hashmap(6)
socket编程(6)
com(6)
pdf(6)
脚本(6)
视频(6)
索引(6)
vue.js(5)
access(5)
ide(5)
分布式(5)
agent(5)
chatgpt(5)
论文(5)
LLM(5)
自动驾驶(4)
bootstrap(4)
搜索引擎(4)
金融(4)
jvm(4)
kotlin(4)
windows(4)
prompt(4)
编码(4)
翻译(4)
服务(4)
工作(4)
开发者(4)
网络(4)
优化(4)
原理(4)
python(3)
css(3)
unix(3)
apache(3)
文件存储(3)
知识图谱(3)
jdk(3)
数据分析(3)
kafka(3)
迁移(3)
插件(3)
工作流(3)
函数(3)
基础(3)
解决方案(3)
连接(3)
量化(3)
浏览器(3)
内存(3)
软件工程(3)
设计(3)
图表(3)
性能(3)
比特币(2)
ios(2)
c#(2)
servlet(2)
json(2)
android(2)
composer(2)
tomcat(2)
lucene/solr(2)
批量计算(2)
SSL 证书(2)
腾讯云测试服务(2)
yarn(2)
serverless(2)
自动化(2)
hadoop(2)
面向对象编程(2)
jdbc(2)
tcp/ip(2)
spring cloud(2)
安全(2)
processing(2)
unicode(2)
aigc(2)
编译(2)
产品(2)
程序(2)
客户端(2)
可视化(2)
压缩(2)
音频(2)
语音(2)
终端(2)
负载均衡(1)
其他(1)
官方文档(1)
区块链(1)
数据挖掘(1)
tensorflow(1)
c 语言(1)
c++(1)
actionscript(1)
.net(1)
scala(1)
xml(1)
typescript(1)
memcached(1)
打包(1)
jar(1)
maven(1)
analyzer(1)
负载均衡缓存(1)
容器镜像服务(1)
深度学习(1)
laravel(1)
mapreduce(1)
访问管理(1)
云数据库 MongoDB(1)
TDSQL MySQL 版(1)
数据加密服务(1)
文字识别(1)
医疗(1)
企业(1)
运维(1)
压力测试(1)
spark(1)
强化学习(1)
正则表达式(1)
spring boot(1)
npm(1)
二叉树(1)
pytorch(1)
aop(1)
selenium(1)
scrapy(1)
markdown(1)
rpc(1)
kernel(1)
iis(1)
小程序(1)
数据处理(1)
hbase(1)
云计算(1)
utf8(1)
raft(1)
es(1)
智能识别(1)
图像标签(1)
auto(1)
chat(1)
chrome(1)
click(1)
cloud(1)
count(1)
deployment(1)
embedding(1)
figure(1)
marker(1)
migrate(1)
next(1)
ocr(1)
pid(1)
plugin(1)
ram(1)
rank(1)
search(1)
sentinel(1)
streamlit(1)
system(1)
ui(1)
umi(1)
web(1)
笔记(1)
编程(1)
编辑器(1)
变量(1)
表格(1)
布局(1)
操作系统(1)
代码质量(1)
登录(1)
地图(1)
动画(1)
对象(1)
管理(1)
行业(1)
互联网(1)
计算机(1)
架构(1)
加密(1)
接口(1)
镜像(1)
开源框架(1)
流量(1)
命令行(1)
前端(1)
日志(1)
入门(1)
软件开发(1)
算法(1)
调试(1)
同步(1)
图数据库(1)
效率(1)
隐私(1)
硬件(1)
源码(1)
原型(1)
字符串(1)
自然语言处理(1)
搜索文章
搜索
搜索
关闭
Elasticsearch索引、搜索流程及集群选举细节整理
lucene/solr
https
网络安全
Elasticsearch Service
数据库
最近在做搜索推荐相关的优化,在对elasticsearch进行优化时查阅了比较多的资料,现在对其中的一部分进行整理和翻译,做一个记录。主要分为三个部分:
山行AI
2021-08-18
1.7K
0
elasticsearch之Roaring Bitmaps的结构
缓存
lucene/solr
编程算法
搜索引擎
如果你是刚刚接触搜索引擎,你可能会感到奇怪,构建搜索引擎中存储块的一个很重要的原因是搜索引擎能够有效地压缩和快速解码有序的数字集合。 为什么这个很有用?你可能知道elasticsearch的分片,是基于lucene的索引基础上的,将数据分割成一个个小片段(segment)进行存储的, 然后有规律地将这些小片段进行合并。在每个片段里面,每个文档都会有一个从0到2的31次方减1之间的唯一标识。这种结构像是数组的下标一样: 它存储在任何地方,而且足以标识一个条目。文档有序地存储在片段中,而且doc ID就是文档在存储片段中的索引。所以存储片段中的第一篇文档 的doc ID为0,第二篇为1。直到最后一篇文档,它的doc ID和这个存储片段中所有文档的数量减一是一样的。
山行AI
2019-06-28
4.2K
2
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
立即查看
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档