首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

深入浅出 spring-data-elasticsearch 之 ElasticSearch 架构初探(一)

本文目录 一、Elasticsearch 基本术语 1.1 文档(Document)、索引(Index)、类型(Type)文档三要素 1.2 集群(Cluster)、节点(Node)、分片(Shard)分布式三要素 二、Elasticsearch 工作原理 2.1 文档存储的路由 2.2 如何健康检查 2.3 如何水平扩容 三、小结 一、Elasticsearch 基本术语 1.1 文档(Document)、索引(Index)、类型(Type)文档三要素 文档(Document) 文档,在面向对象观念就是一个对象。在 ES 里面,是一个大 JSON 对象,是指定了唯一 ID 的最底层或者根对象。文档的位置由 _index、_type 和 _id 唯一标识。 索引(Index) 索引,用于区分文档成组,即分到一组的文档集合。索引,用于存储文档和使文档可被搜索。比如项目存索引 project 里面,交易存索引 sales 等。 类型(Type) 类型,用于区分索引中的文档,即在索引中对数据逻辑分区。比如索引 project 的项目数据,根据项目类型 ui 项目、插画项目等进行区分。 和关系型数据库 MySQL 做个类比: Document 类似于 Record Type 类似于 Table Index 类似于 Database 1.2 集群(Cluster)、节点(Node)、分片(Shard)分布式三要素 集群(Cluster) 服务器集群大家都知道,这里 ES 也是类似的。多个 ElasticSearch 运行实例(节点)组合的组合体是 ElasticSearch 集群。 ElasticSearch 是天然的分布式,通过水平扩容为集群添加更多节点。 集群是去中心化的,有一个主节点(Master)。主节点是动态选举,因此不会出现单点故障。 那分片和节点的配置呢? 节点(Node) 一个 ElasticSearch 运行实例就是节点。顺着集群来,任何节点都可以被选举成为主节点。主节点负责集群内所以变更,比如索引的增加、删除等。所以集群不会因为主节点流量的增大成为瓶颈。因为任何节点都会成为主节点。 下面有 3 个节点,第 1 个节点有:2 个主分片和 1 个副分片。如图:

04

【ES三周年】ES最佳实践案例

Elasticsearch 是一个高效、快速且高度可扩展的搜索引擎。它已经成为许多公司和组织的首选搜索引擎,特别是在大型数据集的情况下。 根据经验,在使用 Elasticsearch 时遵循一些最佳实践可以帮助您实现更好的性能和可维护性。 第一项最佳实践是对数据进行良好的设计和建模。这意味着数据需要在索引之前进行精心设计和建模,以确保正确的搜索和过滤。在建立索引之前,首先需要确定索引的字段,并确定如何解析和存储需要索引的数据。为了减少查询的处理时间,必须避免不必要的字段嵌套。 第二项最佳实践是索引和分片的优化。在 Elasticsearch 中,索引通常是垂直划分数据的方式。对于大型数据集,我们需要对索引进行水平分片,以便每个节点都可以处理一部分索引。此外,我们还需要进行分片的恰当设置和大小的控制,以便避免节点过载,从而每个节点在集群中受益平均。 第三项最佳实践是对查询进行优化。良好的查询设计可以极大地增加性能。为了最大限度地减少搜索的时间,我们建议在搜索操作中使用一些基本的 Elasticsearch 查询优化技巧,例如使用 match 查询,尽可能减小过滤器查询的数量等。 第四项最佳实践是监控 Elasticsearch 的健康状况。在 Elasticsearch 集群中,节点状态、索引状态、负载均衡、缓存大小、查询速度等都可以影响整个集群的性能。因此,借助 Elasticsearch 的监控工具,每天都对集群进行定期监控的有效健康状况的大有裨益。 最后一项最佳实践是在维护 Elasticsearch 系统时进行数据重建和性能分析。数据重建有助于缩小索引大小,释放磁盘空间,并确保数据有序。同时,定期对 Elasticsearch 进行性能分析有助于发现性能瓶颈和优化 Elasticsearch 集群,以便其在提供服务和响应时间方面获得更好的结果。 综上所述,Elasticsearch 是一个强大的搜索引擎,但需要遵循一些有效的最佳实践,从而发挥其最大的潜力。事实上,良好的 Elasticsearch 系统设计和性能优化,可以帮助您的公司提高效率,改善搜索结果质量,并提高整个系统的可靠性,还可以保证您的系统能够保持最新状态并且运作更加高效。

02
领券