文章/答案/技术大牛

发布

首页视频007 - Elasticsearch - 入门 - 倒排索引

007 - Elasticsearch - 入门 - 倒排索引

2022-12-022022-12-02 16:01:53播放47

点赞0 收藏 0

尚硅谷项目课程系列之Elasticsearch/7.x/视频/007 - Elasticsearch - 入门 - 倒排索引.mp4

原链接：http://www.atguigu.com/

视频文本

温馨提示：文本由机器自动转译，部分词句存在误差，以视频为准

00:00
Search是面向文档型的no circle存储数据库，它存储一条数据就等同于存储了一个文档。存储结构中有索引、index类型、type文档、document字段、field的概念。ES软件设计时将这些概念和关系数据库进行了类比，方便大家的理解和使用。那么这里的索引就类似于数据库，类型类似于表，文档类似于行，字段类似于列。那我们查询某一个数据库，某张表的数据，我们会写蛇口文对吧？那么同样道理，我们在ES中想查询某条数据，也会按照类似的规则，比方说索引呢，类型啊，文档啊，字段按照这个规则去进行查询。那么早期版本啊，这么设计是没有任何问题的，可是这种概念它违背了全文检索的原则和基本思想，什么意思？首先咱们先说说索引的问题，在关形数据库中，索引其实是为了优化查询所涉及的数据库对象，没有索引它也能查询，对吧，它就是慢。
01:01
而ES软件呢，专门用于全文检索数据，所以索引是整个搜索引擎当中的关键，甚至我们说在搜索引擎中万物皆索引也不为过。那么ES中为了能够做到快速准确的查询，它使用了一个特殊的概念来进行数据的存储和查询，这个概念我们称之为叫倒排索引。那么有道牌索引其实就应该对应于什么，我们叫正牌索引，咱们叫正牌索引，这个正牌呢，我们也称之为叫做什么呢？叫正向索引，叫正向索引咱们举个例子，比如我保存一篇文章，那么里面应该有文章编号，文章内容、作者以及发布时间，那咱们简单一点，我这里就是编号，文章编号还有呢，文章内容，那这里呢，我们给他来一个，咱们叫1001，哎，文章编号，然后内容是my name，咱们叫it张三好BY一个1002 MY，咱们的name，嗯，咱们叫李四。
02:04
好了，写完以后我们就可以通过我们的文章编号去快速查询到文章的内容，那么之所以检索是比较快的，是因为我们将文章编号设定为组键，同时生成组件索引，然后通过组件索引快速关联到咱们存储的信息。那么这种索引我们就称之为叫正向索引，也称之为叫正牌索引。可是呀，我们如果想要查询文章的内容中包含了哪些热门词汇，那么这个时候就比较麻烦了，为什么？因为我们需要做模糊查询，模糊查询的效率就明显差了很多，而且它要每条数据要去辨利一下，那么性能会差了很多。而且啊，你查询内容的大小写、时态等等都会影响查询的准确率。比方说我想查询张三，那如果你的这个张三是个大写的怎么办？你要查还是不查？
03:00
你这边是小写，我想查的是大写，那你说它算不算？它算匹配了呢，还算不匹配呢，对不对，所以啊，它都会影响咱们的查询准确率，所以这就需要我们换一种方式来将索引和数据关联，这就需要用到我们之前所提到的叫倒排索引啊，举个例子。我们现在呢，我们需要干嘛呢？将我们的这个ID保存数据保持不变，但是我们的索引不像刚才一样了啊，我们需要换一种方式，我把这个呢，写一个叫keyword，我把关键字呀，和咱们那个文章的ID和一个关联好了，来大家看一下我叫什么呢？ID，然后呢，在这种情况下，比方说我想查询这个name，诶拿它做一个关键字，那这个name呢，它就对应了什么呢？诶对应了1001，哎1001，它对应了一个什么呢？1001好了。那如果我想查询那个张三的那个章啊，哎这么写，那这个时候呢，我们的文章当中啊，在保存的时候我就知道哦，我有个章，那马上呢，1001就会放到这儿来，所以你会发现我们现在是通过关键字来查询我们的，诶组建ID，然后再关联咱们的文章内容，以前呢，咱们是通过组件ID关联文件内容，再去找它的关键字，所以正好跟之前是相反的，这个咱们就统称为叫倒排缩引。
04:21
那么这个倒排索引呢？其实你会发现它的查询效率应该是比较快的，可是你会发现我们这里会体现表的概念吗？不会。如果是模糊查询的话，他会告诉你啊，我们的这个数据啊，它在哪张表里面，它的模糊查询的规则是什么，对不对，但是在倒排索影当中，它强调的是关键字和这个文档编号的一个关联，所以那个表的作用已经没有那么明显了，所以咱们课件当中大家可以看到他就说了，我们这里的type的概念已经被逐渐弱化在search当中，我们现在啊，在当前版本已经被删除了。所以它就没有这样的一个概念了，好吧，所以别的呢，我们还可以对应上，比方说索引呢，数据库，我们的文档行，我们的字段列，这个都没问题，但这个类型的概念已经不复存在了啊，咱们在用的时候也希望大家注意这一点，好吧。

展开

我来说两句

0 条评论

登录后参与评论

作者

腾讯云开发者课程

【合辑】尚硅谷项目课程系列之Elasticsearch/7.x

（7/62）

3分14秒

001 - Elasticsearch - 开篇

560

3分8秒

002 - Elasticsearch - 技术选型

390

47秒

003 - Elasticsearch - 教学大纲

430

2分40秒

004 - Elasticsearch - 入门 - 环境准备

460

6分52秒

005 - Elasticsearch - 入门 - RESTful & JSON

360

1分17秒

006 - Elasticsearch - 入门 - Postman客户端工具

470

5分11秒

007 - Elasticsearch - 入门 - 倒排索引

470

3分16秒

008 - Elasticsearch - 入门 - HTTP - 索引 - 创建

420

2分29秒

009 - Elasticsearch - 入门 - HTTP - 索引 - 查询 & 删除

420

5分20秒

010 - Elasticsearch - 入门 - HTTP - 文档 - 创建（Put & Post）

450

2分15秒

011 - Elasticsearch - 入门 - HTTP - 查询 - 主键查询 & 全查询

390

5分23秒

012 - Elasticsearch - 入门 - HTTP - 全量修改 & 局部修改 & 删除

440

7分18秒

013 - Elasticsearch - 入门 - HTTP - 条件查询 & 分页查询 & 查询排序

490

5分16秒

014 - Elasticsearch - 入门 - HTTP - 多条件查询 & 范围查询

350

4分4秒

015 - Elasticsearch - 入门 - HTTP - 全文检索 & 完全匹配 & 高亮查询

330

2分51秒

016 - Elasticsearch - 入门 - HTTP - 聚合查询

420

5分24秒

017 - Elasticsearch - 入门 - HTTP - 映射关系

480

4分48秒

018 - Elasticsearch - 入门 - JavaAPI - 环境准备

380

3分59秒

019 - Elasticsearch - 入门 - JavaAPI - 索引 - 创建

360

4分37秒

020 - Elasticsearch - 入门 - JavaAPI - 索引 - 查询 & 删除

360

8分56秒

021 - Elasticsearch - 入门 - JavaAPI - 文档 - 新增 & 修改

370

4分4秒

022 - Elasticsearch - 入门 - JavaAPI - 文档 - 查询 & 删除

410

5分20秒

023 - Elasticsearch - 入门 - JavaAPI - 文档 - 批量新增 & 批量删除

370

5分24秒

024 - Elasticsearch - 入门 - JavaAPI - 文档 - 高级查询 - 全量查询

380

7分25秒

025 - Elasticsearch - 入门 - JavaAPI - 文档 - 高级查询 - 分页查询 & 条件查询 & 字段查询

580

5分51秒

026 - Elasticsearch - 入门 - JavaAPI - 文档 - 高级查询 - 组合查询 & 范围查询

340

5分28秒

027 - Elasticsearch - 入门 - JavaAPI - 文档 - 高级查询 - 模糊查询 & 高亮查询

290

3分59秒

028 - Elasticsearch - 入门 - JavaAPI - 文档 - 高级查询 - 最大值查询 & 分组查询

470

2分26秒

029 - Elasticsearch - 环境 - 简介

430

9分6秒

030 - Elasticsearch - 环境 - Windows集群部署

410

7分15秒

031 - Elasticsearch - 环境 - Linux单节点部署

470

9分46秒

032 - Elasticsearch - 环境 - Linux集群部署

250

7分11秒

033 - Elasticsearch - 进阶 - 核心概念

410

2分35秒

034 - Elasticsearch - 进阶 - 系统架构 - 简介

380

3分58秒

035 - Elasticsearch - 进阶 - 单节点集群

400

2分8秒

036 - Elasticsearch - 进阶 - 故障转移

330

4分38秒

037 - Elasticsearch - 进阶 - 水平扩容

440

2分52秒

038 - Elasticsearch - 进阶 - 应对故障

380

7分24秒

039 - Elasticsearch - 进阶 - 路由计算 & 分片控制

470

7分18秒

040 - Elasticsearch - 进阶 - 数据写流程

470

4分2秒

041 - Elasticsearch - 进阶 - 数据读流程

470

2分4秒

042 - Elasticsearch - 进阶 - 更新流程 & 批量操作流程

420

6分46秒

043 - Elasticsearch - 进阶 - 倒排索引

460

3分24秒

044 - Elasticsearch - 进阶 - 文档搜索

390

15分54秒

045 - Elasticsearch - 进阶 - 文档刷新 & 文档刷写 & 文档合并

420

12分1秒

046 - Elasticsearch - 进阶 - 文档分析

300

8分33秒

047 - Elasticsearch - 进阶 - 文档控制

400

2分30秒

048 - Elasticsearch - 进阶 - 文档展示 - Kibana

390

2分48秒

049 - Elasticsearch - 框架集成 - SpringData - 整体介绍

420

8分7秒

050 - Elasticsearch - 框架集成 - SpringData - 代码功能集成

330

2分49秒

051 - Elasticsearch - 框架集成 - SpringData - 集成测试 - 索引操作

400

8分0秒

052 - Elasticsearch - 框架集成 - SpringData - 集成测试 - 文档操作

300

3分33秒

053 - Elasticsearch - 框架集成 - SpringData - 集成测试 - 文档搜索

330

10分51秒

054 - Elasticsearch - 框架集成 - SparkStreaming - 集成

420

10分54秒

055 - Elasticsearch - 框架集成 - Flink - 集成

400

2分17秒

056 - Elasticsearch - 优化 - 硬件选择

360

5分20秒

057 - Elasticsearch - 优化 - 分片策略

430

1分6秒

058 - Elasticsearch - 优化 - 路由选择

320

5分32秒

059 - Elasticsearch - 优化 - 写入速度优化

380

2分25秒

060 - Elasticsearch - 优化 - 内存设置

370

2分39秒

061 - Elasticsearch - 优化 - 重要配置

350

21分44秒

062 - Elasticsearch - 面试题

390

007 - Elasticsearch - 入门 - 倒排索引

我来说两句

作者

相关推荐

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐