在弹性搜索上重建索引需要很长时间

，这是因为重建索引是一个耗时且资源密集的过程。当索引需要被更新或者重新构建时，弹性搜索会将数据从源索引复制到新的目标索引中，同时进行必要的数据转换和处理。这个过程涉及到大量的数据读取、写入和计算操作，因此会消耗大量的时间和计算资源。

重建索引的时间长短取决于多个因素，包括索引的大小、数据的复杂性、硬件资源的可用性等。较大的索引和复杂的数据结构会导致重建索引的时间更长。此外，如果系统的硬件资源有限，如CPU、内存和磁盘空间等，也会影响重建索引的速度。

为了加快重建索引的速度，可以采取以下措施：

增加硬件资源：提供更多的CPU、内存和磁盘空间，以提高重建索引的并发处理能力和数据处理速度。
使用分片和副本：将索引分成多个分片，并在多个节点上创建副本。这样可以并行处理索引的重建，提高整体的处理能力和容错性。
优化索引设计：合理设计索引的结构和映射，减少不必要的字段和冗余数据，以提高索引的性能和重建速度。
使用异步重建：将重建索引的过程放在后台进行，不影响正常的搜索和查询操作。可以使用异步任务或者定时任务来执行重建索引的操作。
利用缓存和预热：在重建索引完成之前，可以使用缓存来提供正常的搜索和查询服务。同时，可以提前预热新索引，使其在重建完成后能够立即提供高性能的搜索服务。

对于弹性搜索上的重建索引，腾讯云提供了一系列相关产品和服务，包括：

云搜索引擎（Cloud Search）：腾讯云的全文搜索服务，提供了高性能、可扩展的搜索能力，支持实时索引和重建索引等功能。
云数据库TDSQL（TencentDB for TDSQL）：腾讯云的分布式数据库服务，支持弹性搜索和索引重建，提供了高可用性和高性能的数据库服务。
云服务器CVM（Cloud Virtual Machine）：腾讯云的弹性计算服务，提供了可扩展的计算资源，可以用于执行重建索引的计算任务。

以上是关于在弹性搜索上重建索引需要很长时间的完善且全面的答案。

相关·内容

在nginx上配置禁止搜索引擎爬虫访问网站

而这个网站不需要爬虫抓取，因此我想到了配置robots.txt来禁止爬虫抓取。...但是，这个网站部署在我们实验室的服务器上，是通过frp映射到阿里云的服务器上，并且由服务器上面的nginx反向代理，最终才能被公网访问。...要禁止爬虫访问，robots.txt的格式只要是这样即可： User-agent: * Disallow: / 这样就能禁止那些搜索引擎来访问它了。...（大部分的bot都是遵守这个协议的）要实现上述功能，而不在磁盘上创建这样一个文件的话，可以在nginx的配置文件中，反向代理的配置之前，加入下面这串配置即可： location =/robots.txt

7114 0

如何更精准的在 Github 上搜索开源库？你需要这些技巧！

正文共： 2468字 8图预计阅读时间： 7分钟一、前言在日常工作中，我们并不推荐去重复造轮子，通常我们会去搜索一些稳定的第三方开源库来使用。...如何在这一大片资源中，找到我们需要的，就是需要技巧的了。本文就这个话题，展开讨论，看看如何高效的在 Github 上，搜索我们需要的开源项目。...二、搜索技巧 2.1 搜索结果先来看看，当我们直接在 Github 上，搜索项目的时候，出现的效果。...三、小结本文知识提点了一些 Github 上，可以使用的常用搜索技巧，能更快的帮你找到你需要的开源库。...一些高级技巧确实不常用过一段时间就忘记了，不过还好有 Advanced Search 页面，可以帮我们快速的找到我们需要的筛选条件。对于知识，有时候知道如何找到它，比掌握它更加重要。

7686 0

如何更精准的在 Github 上搜索开源库？你需要这些技巧！

2K7 0

干货 | 在搜索引擎广告关键词生成上，算法可以做什么？

一、背景随着不断加快的国际化步伐，携程逐渐开始在海外开展一系列的市场营销布局。搜索引擎广告作为海外营销的重要组成部分，携程也开始在海外各个搜索引擎上投放广告。...当用户在搜索引擎上搜索到广告主投放的关键词时，相应的广告就会展示，并在用户点击后对广告主进行收费。 ? 下图为携程在谷歌搜索引擎上购买“携程”广告关键词后，在搜索结果会展现相关的广告截屏。 ?...许多OTA（Online Travel Agency）都会投入大量资金进行搜索引擎广告的投放，来获得旅游相关需求的搜索流量，以提高订单量和公司收入，比如booking.com在18年单季度在谷歌上投放广告就达...以下会阐述各个模块的一些细节： 2.1 产品信息供给模块产品信息供给模块一方面负责存储可以在搜索引擎上投放的产品或者服务的相关数据。...，从搜索引擎广告平台拿到的用户搜索语句是会与一个产品落地页一一对应的，因此直接基于广告落地页相关实体信息构建命名实体识别规则就有比较好的效果，也免除了耗费大量的精力在构建训练集上。

1K2 0

搜索引擎上都是您的网站信息，需要用到哪些SEO优化技术才能实现

每个平台每天发10篇文章，收录率一般都是80%以上，最低可以达到800篇的收录率，而在长尾词排名这一块，只要收录了，几乎都可以上去，因为根本就没什么竞争对手，想达到1000个词排名并不是难，如果按照这种方法操作，上几百万个词排名都是很简单的...当把所有的文章都分发出去以后，3-7天收录了以后，排名自然就上来了，这个时候单单一篇文章页面是形成不了转化的，就需要把文章页面转化成销售页面，但是你一转的话，就会进行连接跳转，当前收录排名的页面很快就会掉下去...，这需要用到一个技术，百度抓取快照技术。...用户访问后就是销售页面，这种技术就是利用框架嵌套技术，而且很核心的地方就是页面URL链接并没有变，如果页面URL改变了就变成跳转劫持了，无论是蜘蛛访问页面文章URL，还是用户访问页面URL都没有变，始终都是在同一个...这个技术就是在文章URL下嵌套用户销售页面。

2962 0

【ES三周年】海量笔记 | 在云上，如何搭建属于自己的全文搜索引擎 Web应用-个人站点

**描述：基于Lucene搜索服务器，提供了一个分布式多用户能力的全文搜索引擎，基于RESTful Web接口，基于Java语言开发，并作为Apache许可条款下的开放源码发布，是一种流行的企业级搜索引擎...猜想：除了对服务器配置以及JVM内存的调优，ES搜索引擎为何如此之快？...图片举例：现在，需要从我们的笔记搜索引擎中检索出一则七言律诗（七律-可以作为诗词检索的类型），用户输入关键词-长江，如何从海量的笔记记录中快速检索出关于长江的诗词？...在传统DBMS关系型数据库中，一般常用like %长江% ，这种需要遍历所有笔记记录数据作匹配-顺序扫描，不但检索效率较低，并且还只能搜索到长江连在一起的诗词，若是同时需要搜索到长、江、长江的诗词，like...想必我们自学习语文知识以来，都用过很长一段时间的新华字典，查拼音，查偏旁部首，查询效率还是相当nice...

92812 1

关于重建索引 API 使用和故障排查的 3 个最佳实践

解决方案 #1 - 获取在集群上运行的任务列表其实这并不是问题，即使您在 Kibana 中看到这条消息，Elasticsearch 也会在后台运行重建索引 API。...解决方案 #2 - 将重建索引结果存储在 _tasks 上如果已知重建索引操作需要的时间超过 120 秒（120 秒是 Kibana 开发工具的超时时间），可以使用查询参数 wait_for_completion...API，集群需要足够的容量才能运行搜索和索引操作。...，请定义“wait_for_completion=false”设置，以便重建索引 API 结果存储在 _tasks API 上。...运行重建索引 API 时，稳定性是关键因素，参与重建索引 API 的索引需要处于绿色状态（最糟糕的情况是黄色状态），然后确保我们的数据节点中没有很长的 GarbageCollections，并且 CPU

1401 0

大白话mysql之深入浅出索引原理 - 上

平衡二叉树：平衡二叉树是在二叉搜索树的基础上引入的，指的是结点的左子树和右子树的深度差不超过 1. 多叉树：每个结点可以有多个子结点，子节点的大小从左到右依次递增。...因为普通的二叉树可能因为插入的数据最后变成一个很长的链表，查询复杂度退化成O(n)。如果搜索树存于内存中，与多叉树相比，二叉树的搜索速率是最高的，但实际上数据库使用的是 n 叉树而不是二叉树。...innodb 的索引模型在B+树中，我们将节点分为叶子结点和非叶子结点，非叶子结点上保存的是索引，而且一个节点可以保存多个索引；数据全部存于叶子结点上，并且叶子结点之间通过指针连接起来。...一个节点上的所有数据都在一个page中，页越大，每页存放的索引就越多，N就越大。数据页调整后，如果数据页太小层数会太深，数据页太大，加载到内存的时间和单个数据页查询时间会提高，需要达到平衡才行。...当主键索引需要重建时，更好的做法是直接使用alter table t engine=innodb重建表。

4782 0

来聊一聊MySQL的索引吧

为其维护的两个逻辑上的索引文件结构。...，查询就可以走这个辅助索引，这就是最左前缀原则，查询将返回第一个满足查询条件的记录对应的主键id，根据情况看是否需要回表搜索主键索引树。...这个部分，最终得到 id=1和 id=3的两条记录，最后需要回表搜索主键索引树，因为这个联合索引并没有完全做到索引覆盖，缺少了sex字段。...索引重建这里补充一点额外的知识，之前听闻过一个索引使用的中出现的问题案例：有一个线上的记录日志的表，定期会删除早期的数据，经过一段时间的维护，这个表中存放的记录空间稳定在10G，但是索引占用空间有30G...解决：可以通过重建索引的方式，删除之前的旧索引，并重新创建这个索引，因为数据已经在表中，因此重建索引的过程会将表中的数据按顺序插入，使得页面结构重新恢复紧凑（当然具体重建索引的方案需要结合更多的因素去分析

3653 0

雷军强推：小米造最强超分辨率算法，现已开源

，论文基于弹性搜索（宏观+微观）在超分辨率问题上取得了非常好的结果。...而达到这样的效果，论文基于一台 V100 用了不到 3 天时间。需要指出的是，该项技术具有一定的普适性，理论上可以应用于任何监督学习，值得我们关注和学习。」...在该论文中，作者基于弹性神经架构搜索探讨 SISR 任务，提出的方法已经达到与 CARN 和 CARN-M 相当的效果。...一个完整的模型包括预定义的特征提取器（具备 32 个 3 × 3 卷积核的 2D 卷积）、来自微观搜索空间的 n 个单元块和来自宏观搜索空间的跳接、上采样和重建。 ?...此外，基于结合了进化计算和强化学习的混合控制器，我们提出了支持微观搜索和宏观搜索的弹性搜索策略。定量实验表明：在 FLOPS 相当的情况下，我们的生成模型优于大部分 SOTA 方法。

1.6K3 0

每日一面 - mysql 大表批量删除大量数据

但是数据没有被清空，在新一行数据大小小于这一行的时候，可能会占用这一行。这样其实就是存储碎片。之后，相关数据的索引需要更新，清除这些数据。...如果 delete 的数据是大量的数据，则会：如果不加 limit 则会由于需要更新大量数据，从而索引失效变成全扫描导致锁表，同时由于修改大量的索引，产生大量的日志，导致这个更新会有很长时间，锁表锁很长时间...解决方案我们很容易想到，在 delete 后加上 limit 限制控制其数量，这个数量让他会走索引，从而不会锁整个表。但是，存储碎片，主从同步，占用空间的问题并没有解决。...可以在删除完成后，通过如下语句，重建表： alter table 你的表 engine=InnoDB, ALGORITHM=INPLACE, LOCK=NONE; 注意这句话其实就是重建你的表，虽然你的表的引擎已经是...还有一种方案是，新建一张同样结构的表，在原有表上加上触发器： create trigger person_trigger_update AFTER UPDATE on 原有表 for each row

1.9K2 0

用sphinx给PHP加个给力的搜索功能

最近工作上需要实现搜索功能，尝试了几种方案。虽然最终线上部署的还是最low的方案，但是中间的过程还是比较有意思的。业务上根据关键字查找内容。关键字的出处多来源于标题，文章描述等。...测试过程中，在224256行数据中，对3749个字进行like查询，执行总时间长达4003秒。相当于每个查询需要花费1.06秒的查询时间。...使用sphinx作为搜索引擎 sphinx支持全文搜索,所以在sphinx中查询到关键字对应内容id之后再通过数据库获取内容的全部数据。...在224256行数据中，对3749个字进行查找，查找总时间是6.5秒,速度相当快。主要问题有: 1、数据变更之后需要重建索引。...2、需要定期重全量索引，保证增量索引重建速度。增量索引的重建速度影响查询的准确率，避免查询已经变更的历史数据。 3、索引重建可以不关闭服务器，但是会影响内存和磁盘开销。

9714 0

每个软件工程师都应该了解的搜索技能

关于哲学这篇文章很长，但我们所涵盖的大部分内容都基于下面四个基本原则：实际上搜索是一个综合问题：查询是可高度变化的。根据产品需求的不同，搜索问题也是不尽相同的。...影像：用户是在搜索文本、图像、图形关系，还是地理空间数据? 语料库控制和质量：是你在控制的文档的来源，还是来自于（潜在的敌对）第三方?是否所有文档都准备好被索引或者需要清理和选择?...下面是你需要解决的最重要的问题：索引选择：给定一组文档（例如，整个Internet，所有的Twitter帖子，Instagram上的所有图片），选择一个可能更小的文档子集，作为搜索结果可能值得考虑，并且只包括索引中的那些...如果托管解决方案不适合您的需求或资源，您可能需要使用一个开源库或工具。如果有联网的应用程序或网站，我现在就选择弹性搜索。对于嵌入式体验，下面有多种工具。...在将文档上传到搜索索引之前，您可能需要做索引选择并清理文档（比如从HTML页面中提取相关文本）。这将降低索引的大小，并使得到好的结果更容易。

8739 0

就是这么迅猛的实现搜索需求

：检索需求并发大时，可能影响CURD的请求；CURD并发大时，检索会非常的慢；（3）数据量达到百万级别，性能还是会显著降低，查询返回时间很长，业务难以接受（4）比较难水平扩展中级阶段-开源外置索引...外置索引的核心思路是：索引数据与原始数据分离，前者满足搜索需求，后者满足CURD需求，通过一定的机制（双写，通知，定期重建）来保证数据的一致性。...搜索服务数据量最大的“接口耗时数据收集”需求，数据量大概在7亿左右；并发量最大的“经纬度，地理位置搜索”需求，线上平均并发量大概在600左右，压测数据并发量在6000左右。...高级阶段-自研搜索引擎当数据量进一步增加，达到10亿、100亿数据量；并发量也进一步增加，达到每秒10万吞吐；业务个性也逐步增加的时候，就需要自研搜索引擎了，定制化实现搜索内核了。...业务相关的rank就在这一层实现，其无状态性也能够保证增加机器就能扩充merger集群性能（3）底层searcher（暗红色大框）是检索集群，服务和索引数据部署在同一台机器上，服务启动时可以加载索引数据到内存

1.1K4 1

所有您需要了解的关于Elasticsearch 5.0：索引管理

请务必查看本系列中的上一篇文章，如果您尚未阅读（请点击链接），您需要了解Elasticsearch 5.0：Search。在本系列之后的博客文章中，我们将讨论更多主题，如数据摄取策略等。...但是，它确实需要索引在收缩之前是只读的 - 并且大多数巨型索引可以确实允许这样做。...在正常运营期间，有些日子可能比其他日子忙，产生两倍的事件，而可能有几周的停机时间会导致实际上为空的索引。...当然，加班时间你在任何一天收录的文件数量将增加，这将导致臃肿的索引和碎片 - 再次损害搜索性能。目前，将指标从日常变为每小时是一个严格的过程，需要在太多地方进行太多改变。...可以设置索引的别名，例如，一旦索引达到配额，别名将切换到索引到新索引，同时仍启用对此索引和所有先前索引的搜索。这对于在滚动索引用例中也可以平衡索引大小有很长的路要走。

1.7K3 0

Lucene.net(4.8.0) 学习问题记录四: IndexWriter 索引的优化以及思考

2.6 使用更快的分词器事实上建索引的时间大部分都花在了分词的时间上，一个好的分词器，将大大减少索引的时间。...二，优化建索引速度的思考 1.分布建索引（伪）我在做搜索的时候，42个G的索引文件，需要7个小时从头到尾重建完，这里包括了我获取文档的时间，以及接口通信的时间。...然后优化Optimize(1),这也需要1~2个小时的时间。于是我想将重建索引的速度继续降低。通过上面的设置IndexWriter的参数的方法，时间虽然有减少，但是效果不明显。...Lucene的索引性能不会因为改了几个参数而得到显著的提升。所以这个时候我们就需要从分词器，分布建索引，以及整个重建索引的机制下手。...由于公司只给我了一台服务器，所以我选择在这台服务器上跑了两个相同的应用在不同的文件夹分布建索引，再调用IndexWriter.Addindexes合并索引，虽然是在同一台服务器上，分两个应用确实可以最大的发挥

1.2K8 0

【干货】Elasticsearch搜索调优权威指南（13）

内嵌对象模型的缺点如下：为了增加、修改或删除一个内嵌对象文档，整个文档必须重建索引；这就导致内嵌文档越多开销就越大。搜索请求返回整个文档，而不是只返回匹配的内嵌文档。..."match": { "text": "child document" } } } } }' 父子join对管理实体关系非常有用，尤其是在索引时间比检索时间很重要的情形下...无论父子map是否使用了内存缓存或磁盘上的doc value，全局序列号仍然需要在索引发生任何改变时进行重建。分片中的父代越多，全局序列号构建就越耗时。...此时，需要增加refresh_interval，以便refresh的频率更低，而全局序列号保持可用的时间更长。这将大幅减少每秒钟重建全局序列号的CPU消耗。...如果在EBS上创建了一个索引库，请确认使用预分配的IOPS，否则很快就会被限流。如果搜索受限于CPU，那么应当考虑购买更快的CPU。

7772 0

Win10文件资源管理器右键卡死「建议收藏」

昨天自动更新以后，今天使用Windows10，发现文件资源管理器打开的时候慢了很多，打开之后里面的文件夹、文件图标要好久才能显示正常(如下面这样不正常显示很长一段时间)。...解决方法网上查后，试了几种方法，如重建索引、关闭索引，都没有解决问题。然后看到一个方法是清除文件资源管理器历史记录。...方法是“文件资源管理器” -》“文件” -》 “更改文件夹和搜索选项” -》 “常规” -》 “隐私” -》“清除“。过程如下图。但是点击”清除“以后，没有任何反应。我以为没有作用。...今天2019年2月18日，操作系统在自动更新后，前文中文件资源管理器操作响应缓慢的问题又出现了。...使用第一种方法：即“文件资源管理器” -》“文件” -》 “更改文件夹和搜索选项” -》 “常规” -》 “隐私” -》“清除“后，恢复正常了。时间已经到了2022年，这个帖子已经写了快3年了。

2.7K4 0

2021-01-19：mysql中，一张表里有3亿数据，未分表，其中一个字段是企业类型...

来压缩数据表来释放硬盘空间，时间更长，需要几天时间，太慢了！...但是数据没有被清空，在新一行数据大小小于这一行的时候，可能会占用这一行。这样其实就是存储碎片。之后，相关数据的索引需要更新，清除这些数据。...如果 delete 的数据是大量的数据，则会： 1.如果不加 limit 则会由于需要更新大量数据，从而索引失效变成全扫描导致锁表，同时由于修改大量的索引，产生大量的日志，导致这个更新会有很长时间，锁表锁很长时间...可以在删除完成后，通过如下语句，重建表： alter table 你的表 engine=InnoDB, ALGORITHM=INPLACE, LOCK=NONE; 注意这句话其实就是重建你的表，虽然你的表的引擎已经是...还有一种方案是，新建一张同样结构的表，在原有表上加上触发器： create trigger person_trigger_update AFTER UPDATE on 原有表 for each row

1.1K1 0

最近的几个技术问题总结和答疑（三) (r8笔记第83天)

有的在公众号提问，有的私信给我。简单整理了一下。...第二个问题源自我帮助一个网友解决的一个问题，可以参考远程协助解决重建索引的危机问题问题2：跟我之前的系统现象一样一样的，都是大表重建索引，导致执行计划走全表，io和cpu秒升，系统无响应。...在10g里面可能得重启库，11g里面有个包可以临时解决。...引用一个微信朋友的留言：非常典型的一个案例，有时经常会有这种生产系统重建索引或是新增一个有默认值但没有NOT NULL约束的操作，不清楚原理，就不清楚这种操作带来的风险，两者相辅相成。...问题3：请问如何判断建索引的时间呢答：如果执行时间很长，一种比较上手的方法就是写个脚本，执行几秒钟在这个过程中抓取v$session中的sql_id，然后在cursor里面查看对应的执行计划创建索引的语句不难

7128 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

在弹性搜索上重建索引需要很长时间

相关·内容

在nginx上配置禁止搜索引擎爬虫访问网站

如何更精准的在 Github 上搜索开源库？你需要这些技巧！

如何更精准的在 Github 上搜索开源库？你需要这些技巧！

干货 | 在搜索引擎广告关键词生成上，算法可以做什么？

搜索引擎上都是您的网站信息，需要用到哪些SEO优化技术才能实现

【ES三周年】海量笔记 | 在云上，如何搭建属于自己的全文搜索引擎 Web应用-个人站点

关于重建索引 API 使用和故障排查的 3 个最佳实践

大白话mysql之深入浅出索引原理 - 上

来聊一聊MySQL的索引吧

雷军强推：小米造最强超分辨率算法，现已开源

每日一面 - mysql 大表批量删除大量数据

用sphinx给PHP加个给力的搜索功能

每个软件工程师都应该了解的搜索技能

就是这么迅猛的实现搜索需求

所有您需要了解的关于Elasticsearch 5.0：索引管理

Lucene.net(4.8.0) 学习问题记录四: IndexWriter 索引的优化以及思考

【干货】Elasticsearch搜索调优权威指南（13）

Win10文件资源管理器右键卡死「建议收藏」

2021-01-19：mysql中，一张表里有3亿数据，未分表，其中一个字段是企业类型...

最近的几个技术问题总结和答疑（三) (r8笔记第83天)

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐