文章/答案/技术大牛

发布

首页视频044 - Elasticsearch - 进阶 - 文档搜索

044 - Elasticsearch - 进阶 - 文档搜索

2022-12-022022-12-02 16:01:53播放39

点赞0 收藏 0

尚硅谷项目课程系列之Elasticsearch/7.x/视频/044 - Elasticsearch - 进阶 - 文档搜索.mp4

原链接：http://www.atguigu.com/

视频文本

温馨提示：文本由机器自动转译，部分词句存在误差，以视频为准

00:00
接下来我们来讲解一下文档搜索。早期的全文检索呢，它会为整个文档集合建立一个很大的倒排索引，并将其写入到磁盘当中，一旦新的索引就绪，旧的就会被替换掉，这样的话，最近的变化便可以被检索到。倒排索引被写入到磁盘之后是不可改变的，那么这样的话呢，我们在多线程并发执行，并行执行的时候就不会对它进行修改操作，也就不会产生所谓的线程安全问题，数据就不会出现冲突，对不对？还有一个因为你不可变，所以把你的内容读取到内存当中的时候，这个内存就不会发生变化。那么这样的话，我们在匹配数据的时候，会大量的请求匹配到内存当中，这样的话就减少了磁盘的IO，性能可以得到一个极大的提升，还有一个当一个大的倒排索引。被生成之后，它是可以呢进行压缩的，减少磁盘IO，并且呢，可以将我们缓存到内存的所引的使用量减少，那这样的话不是挺好的吗？对不对？同学们，所以这都是它的优势，但是不好的地方在哪呢？不好的地方在于当你创建好之后，你不能发生改变，如果你频繁的修改它的话，就会导致它要重建整个索引，那么你的更新频率比较高，你的性能就会变差，就是因为你的倒排索引它的不可修改，不可变，那我们如何能够解决这个问题呢？诶大家可以看到我们采用一种方式叫做什么呢？叫新的补充索引，就意味着之前呢确实不变，但是一旦有了修改之后，之前的还是不变，我现在干嘛呢？添加一个新的补充索引来体现最近的修改，而不是将整个之前的索引重新建立。不是这样的。
01:44
那这样的话，在我查询的时候，我只要保证每一个倒排索引都能被查到，然后将我们匹配的结果做合并不就可以了吗？诶，就是这个意思，那么这样的话呢，在我们查询过程当中就有一个段的概念，一段一段的概念，那么每一段其实就是一个倒排索引，这个大家能明白吧？啊那这样的话，你在查询的时候会按段查询，而且最早的会被先查询，哎，就是这个意思啊，然后呢，我们这里再说一个什么呢？就是我们的那个删除的问题，因为啊，我们在去查询的过程当中，我们这个段它是不可改变的，那如果我们有些数据要被删除了怎么办？
02:21
你被删除了，但是你不可改变呢，所以说你删除的数据是体现不了删除的概念呢，那怎么办？诶我们加标记，我们给某些数据呢，诶给它加标记表示你删除了，但是并不会真正的删。那么这样的话，在我查询之后，如果发现了有删除标记的话，那么就把它过滤掉，你不就查不出来了吗？就好像跟删除的感觉是一样的，对吗？这个我们称之为叫逻辑删除，那老师那不对呀，那你这个逻辑删除的话，你数据还在那，那数据越集越多，越积越多，不是不好吗？没错。我们也确实存在这个问题，其实大家想一想，当我们那个倒排索引太多了之后，每个都挨个找一下，是不是也比较慢呢？所以其实它不光有什么呢？诶我们创建新的倒排索引的概念，它有合并的概念，当我们把多个我们的倒排索引合成一个的情况下，那么这时候我就可以把那个删除的数据给它真正的删除掉，这个我们就称之为叫物理删除了，好不好，同学们就是这么个概念，这是我们文档搜索需要注意的地方啊。

展开

我来说两句

0 条评论

登录后参与评论

作者

腾讯云开发者课程

【合辑】尚硅谷项目课程系列之Elasticsearch/7.x

（44/62）

3分14秒

001 - Elasticsearch - 开篇

560

3分8秒

002 - Elasticsearch - 技术选型

390

47秒

003 - Elasticsearch - 教学大纲

430

2分40秒

004 - Elasticsearch - 入门 - 环境准备

460

6分52秒

005 - Elasticsearch - 入门 - RESTful & JSON

360

1分17秒

006 - Elasticsearch - 入门 - Postman客户端工具

470

5分11秒

007 - Elasticsearch - 入门 - 倒排索引

470

3分16秒

008 - Elasticsearch - 入门 - HTTP - 索引 - 创建

420

2分29秒

009 - Elasticsearch - 入门 - HTTP - 索引 - 查询 & 删除

420

5分20秒

010 - Elasticsearch - 入门 - HTTP - 文档 - 创建（Put & Post）

450

2分15秒

011 - Elasticsearch - 入门 - HTTP - 查询 - 主键查询 & 全查询

390

5分23秒

012 - Elasticsearch - 入门 - HTTP - 全量修改 & 局部修改 & 删除

440

7分18秒

013 - Elasticsearch - 入门 - HTTP - 条件查询 & 分页查询 & 查询排序

490

5分16秒

014 - Elasticsearch - 入门 - HTTP - 多条件查询 & 范围查询

350

4分4秒

015 - Elasticsearch - 入门 - HTTP - 全文检索 & 完全匹配 & 高亮查询

330

2分51秒

016 - Elasticsearch - 入门 - HTTP - 聚合查询

420

5分24秒

017 - Elasticsearch - 入门 - HTTP - 映射关系

480

4分48秒

018 - Elasticsearch - 入门 - JavaAPI - 环境准备

380

3分59秒

019 - Elasticsearch - 入门 - JavaAPI - 索引 - 创建

360

4分37秒

020 - Elasticsearch - 入门 - JavaAPI - 索引 - 查询 & 删除

360

8分56秒

021 - Elasticsearch - 入门 - JavaAPI - 文档 - 新增 & 修改

370

4分4秒

022 - Elasticsearch - 入门 - JavaAPI - 文档 - 查询 & 删除

410

5分20秒

023 - Elasticsearch - 入门 - JavaAPI - 文档 - 批量新增 & 批量删除

370

5分24秒

024 - Elasticsearch - 入门 - JavaAPI - 文档 - 高级查询 - 全量查询

380

7分25秒

025 - Elasticsearch - 入门 - JavaAPI - 文档 - 高级查询 - 分页查询 & 条件查询 & 字段查询

580

5分51秒

026 - Elasticsearch - 入门 - JavaAPI - 文档 - 高级查询 - 组合查询 & 范围查询

340

5分28秒

027 - Elasticsearch - 入门 - JavaAPI - 文档 - 高级查询 - 模糊查询 & 高亮查询

290

3分59秒

028 - Elasticsearch - 入门 - JavaAPI - 文档 - 高级查询 - 最大值查询 & 分组查询

470

2分26秒

029 - Elasticsearch - 环境 - 简介

430

9分6秒

030 - Elasticsearch - 环境 - Windows集群部署

410

7分15秒

031 - Elasticsearch - 环境 - Linux单节点部署

470

9分46秒

032 - Elasticsearch - 环境 - Linux集群部署

250

7分11秒

033 - Elasticsearch - 进阶 - 核心概念

410

2分35秒

034 - Elasticsearch - 进阶 - 系统架构 - 简介

380

3分58秒

035 - Elasticsearch - 进阶 - 单节点集群

400

2分8秒

036 - Elasticsearch - 进阶 - 故障转移

330

4分38秒

037 - Elasticsearch - 进阶 - 水平扩容

440

2分52秒

038 - Elasticsearch - 进阶 - 应对故障

380

7分24秒

039 - Elasticsearch - 进阶 - 路由计算 & 分片控制

470

7分18秒

040 - Elasticsearch - 进阶 - 数据写流程

470

4分2秒

041 - Elasticsearch - 进阶 - 数据读流程

470

2分4秒

042 - Elasticsearch - 进阶 - 更新流程 & 批量操作流程

420

6分46秒

043 - Elasticsearch - 进阶 - 倒排索引

460

3分24秒

044 - Elasticsearch - 进阶 - 文档搜索

390

15分54秒

045 - Elasticsearch - 进阶 - 文档刷新 & 文档刷写 & 文档合并

420

12分1秒

046 - Elasticsearch - 进阶 - 文档分析

300

8分33秒

047 - Elasticsearch - 进阶 - 文档控制

400

2分30秒

048 - Elasticsearch - 进阶 - 文档展示 - Kibana

390

2分48秒

049 - Elasticsearch - 框架集成 - SpringData - 整体介绍

420

8分7秒

050 - Elasticsearch - 框架集成 - SpringData - 代码功能集成

330

2分49秒

051 - Elasticsearch - 框架集成 - SpringData - 集成测试 - 索引操作

400

8分0秒

052 - Elasticsearch - 框架集成 - SpringData - 集成测试 - 文档操作

300

3分33秒

053 - Elasticsearch - 框架集成 - SpringData - 集成测试 - 文档搜索

330

10分51秒

054 - Elasticsearch - 框架集成 - SparkStreaming - 集成

420

10分54秒

055 - Elasticsearch - 框架集成 - Flink - 集成

400

2分17秒

056 - Elasticsearch - 优化 - 硬件选择

360

5分20秒

057 - Elasticsearch - 优化 - 分片策略

430

1分6秒

058 - Elasticsearch - 优化 - 路由选择

320

5分32秒

059 - Elasticsearch - 优化 - 写入速度优化

380

2分25秒

060 - Elasticsearch - 优化 - 内存设置

370

2分39秒

061 - Elasticsearch - 优化 - 重要配置

350

21分44秒

062 - Elasticsearch - 面试题

390

044 - Elasticsearch - 进阶 - 文档搜索

我来说两句

作者

相关推荐

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐