专栏首页武培轩的专栏ElasticSearch 文档的增删改查都不会?

ElasticSearch 文档的增删改查都不会?

本文主要是介绍 ElasticSearch 的文档增删改查和批量操作,同时会介绍一些 REST API 返回状态码的具体含义。

我们先来看下这个表:

这个表包含了 Index、Create、Read、Update、Delete 这五种方法,我们先来看下 CRUD 操作的 HTTP 请求都长什么样子?

首先是提供一个 HTTP 的 method,后面是索引名字,在 7.0 之后所以的 Type 都用 _doc 表示,后面是文档 id。

再简单了解了 CURD 操作的 HTTP 请求后,那么让我们先来了解下如何创建文档:

创建文档

Create 支持两种方式,一种是指定文档 id 创建文档,像上面这张图就是;另一种是通过调用 post /users/_doc 去让 ES 自动生成文档 id

自己指定文档 id创建文档,需要考虑 id 的均衡性,避免产生分配不均衡的问题。 ES 的 hash 函数会确保文档 id 被均匀分配到不同的分片。

当我们执行刚才的命令,可以返回如下结果:

其中 _version 每一次操作,都会 + 1,它是一个锁的机制,当并行修改文档的时候,更新的版本号比文档当前的版本号小时就会报错,不允许做修改。

创建文档时,如果索引不存在,ES 会自动创建对应的 index 和 type。

接下来看下另一种创建文档的方式,不指定 id 创建文档,HTTP 请求也变为了 POST,具体的请求如下:

返回的结果如下:

Index 和 Create 区别为:如果文档不存在,就索引新的文档,否则现有文档就会被删除,新的文档被索引,版本信息 _version + 1。

查询文档

Get 方法比较简单,只需要 Get 索引名称/_doc/文档 id,通过执行这个命令就可以知道文档的具体信息了。

当执行这条语句后会返回 HTTP 200,具体返回结果如下:

其中 _index 为索引,_type 为类型,_id 为文档 id,_version 为版本信息,_source 存储了文档的完整原始数据。

当查询的文档 id 不存在的时候,会返回 HTTP 404,且 foundfalse,具体结果如下:

更新文档

Update 方法采用 HTTP POST,在请求体中必须指明 doc,在把具体文档提供在 HTTP 的 body 里。Update 和 Index 方法不同,Update 方法不会删除原来的文档,而是实现真正的数据更新。

比如在原来的文档 id 为 1 的文档上增加字段,具体请求如下:

执行后,版本信息 _version + 1,让我们再去查询下该文档:

可以看到,新增字段已经成功了。

删除文档

Delete 方法也很简单,Delete 索引名称/_doc/文档 id 就可以了,再这里就不再做代码演示了。

在介绍完文档的基本 CRUD 操作后,让我们来看看批量操作吧:

Bulk API

在一个 REST 请求中,重新建立网络开销是十分损耗性能的,因此 ES 提供 Bulk API,支持在一次 API 调用中,对不同的索引进行操作,从而减少网络传输开销,提升写入速率。

它支持 IndexCreateUpdateDelete 四种类型操作,可以在 URI 中指定索引,也可以在请求的方法体中进行。

同时多条操作中如果其中有一条失败,也不会影响其他的操作,并且返回的结果包括每一条操作执行的结果。

比如输入如下代码:

当我们执行命令后,结果如下:

took 表示消耗了 93 毫秒,errorstrue 表示在这些操作中错误发生,发现是 update 操作发生了错误,id 为 2 的文档不存在,所以报错了。

在使用 Bulk API 的时候,当 errorstrue 时,需要把错误的操作修改掉,防止存到 ES 的数据有缺失。

批量查询文档

批量查询需要指明要查询文档的 id,可以在一个 _mget 操作里查询不同索引的数据,可以减少网络连接所产生的开销,提高性能。

下面我们来实际操作下,输入以下代码执行,就可以得到文档 id 为 1,3 的数据。

运行结果如下:

在介绍完文档的一些操作,最后让我们看下 REST API 常见错误返回有哪些吧!

REST API 常见错误返回

刚才在演示中,当查询文档 id 不存在的时候就会报 404 错误,而且 ES 还有各种各样的返回,下面通过一个表格了解下:

总结

本文主要介绍了文档的 CRUD 操作,还有 Bulk API、_mget API,这些批量操作可以提高 API 调用性能,但是不要一次发送过多数据,也有可能会对 ES 集群产生过大的压力,导致性能有所下降。一般建议是 1000-5000 个文档,如果你的文档很大,可以适当减少队列,大小建议是 5-15 MB,默认不能超过 100 M。

参考文献 Elastic Stack从入门到实践 Elasticsearch顶尖高手系列 Elasticsearch核心技术与实战 https://www.elastic.co/guide/en/elasticsearch/reference/7.1/docs-index_.html

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • Spring Boot 集成 Swagger 构建接口文档

    在应用开发过程中经常需要对其他应用或者客户端提供 RESTful API 接口,尤其是在版本快速迭代的开发过程中,修改接口的同时还需要同步修改对应的接口文档,这...

    武培轩
  • Spring Boot 集成 Elasticsearch 实战

    最近有读者问我能不能写下如何使用 Spring Boot 开发 Elasticsearch(以下简称 ES) 相关应用,今天就讲解下如何使用 Spring Bo...

    武培轩
  • 搜索引擎之倒排索引浅析

    上一篇文章 ElasticSearch 术语中提到了倒排索引,那么这篇文章就来讲解下什么是倒排索引,倒排索引的数据结构以及 ElasticSearch 中的倒排...

    武培轩
  • DevOps 下的文档及其版本管理之实战

    在上一篇《 DevOps 下的文档及其版本管理之设计篇》中简要介绍了文档及其版本管理的设计思路,该篇将讲述其实际操作部分的内容。上篇文章中讲到文档信息保存在两个...

    DevOps时代
  • 在RPA项目中有哪些文档,如何使用这些文档

    RPA项目也同样遵循同样的方式,不同的厂商和公司定义的文档类型也不太相同,多的可能十几种,少的也要几种,具体的遵循方式和使用标准取决于公司内部的使用章程。

    RPA小葵
  • GO 文档笔记

    最开始写 GO 的时候, 发现方法的注释并不支持@param, @return等参数, 搞得我都不知道该如何给自己的方法写文档说明了. 而且网上搜了搜也没有搜到...

    烟草的香味
  • 程序员既要写好代码,又要写好文档

    程序员既要写好代码,又要写好文档 作为一个长期混迹于CSDN社区的人,我对很多拥有高访问量的博主钦佩不已,特别是在参加了CSDN在举办“2014 CSDN博文大...

    用户1289394
  • 细说RESTful API之文档管理

    规范的接口文档管理方式有助于提高组件协同(如:前后端分离)的开发效率,对于项目的接口说明有全局的管理视角,甚至可以方便地实现对外发布。 完善的文档管理应该包含...

    2Simple
  • Swoole 船新版本文档发布了,是兄弟就砍我!

    Swoole的文档一直被人所吐槽,虽然内容很丰富,但看起来很费力,更新也稍有些不足,所以这次识沃科技专门组织了人力和资源重新打造这一船新版本的文档,让人眼前一亮...

    桶哥
  • 读不懂英文文档,能写出代码不?

    作为一个开发人员,开发一个新项目,维护一个项目,想要快速的开展工作。最重要的是干什么?是阅读项目文档,没文档看代码。可见我们首要做的事情是看文档看懂文档,编程初...

    程序员互动联盟

扫码关注云+社区

领取腾讯云代金券