实体内容太长` ElasticSearch - RestHighLevelClient with scrollAPI抛出`抑制: org.apache.http.ContentTooLongException:实体内容太长`

ElasticSearch是一个开源的分布式搜索和分析引擎，它基于Lucene库构建而成。它提供了一个分布式的、多租户的全文搜索引擎，具有高性能、可伸缩性和强大的搜索功能。

RestHighLevelClient是ElasticSearch官方提供的Java客户端，用于与ElasticSearch集群进行交互。它提供了一组简单易用的API，可以执行各种操作，包括索引、搜索、更新和删除文档等。

在使用RestHighLevelClient进行搜索时，如果返回的结果集较大，可能会出现抛出org.apache.http.ContentTooLongException:实体内容太长的异常。这是因为默认情况下，ElasticSearch的HTTP请求有一个最大内容长度限制。

为了解决这个问题，可以使用ElasticSearch的Scroll API。Scroll API允许我们在搜索结果集较大时，通过多次请求来获取所有的结果。它通过维护一个搜索上下文（scroll context）来实现。

使用Scroll API的步骤如下：

创建一个初始的搜索请求，并设置scroll参数来指定每次请求返回的文档数量和scroll上下文的有效时间。
执行搜索请求，并获取第一次的结果集和scroll上下文。
处理第一次的结果集。
使用scroll上下文来获取下一次的结果集，直到没有更多的结果为止。

以下是一个使用RestHighLevelClient和Scroll API的示例代码：

import org.elasticsearch.action.search.*;
import org.elasticsearch.client.*;
import org.elasticsearch.common.unit.*;
import org.elasticsearch.index.query.*;
import org.elasticsearch.search.*;
import org.elasticsearch.search.builder.*;
import org.elasticsearch.search.sort.*;

RestHighLevelClient client = new RestHighLevelClient(
        RestClient.builder(new HttpHost("localhost", 9200, "http")));

SearchRequest searchRequest = new SearchRequest("index_name");
SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder();
searchSourceBuilder.query(QueryBuilders.matchAllQuery());
searchSourceBuilder.sort(new FieldSortBuilder("_doc"));
searchSourceBuilder.size(100); // 设置每次请求返回的文档数量
searchRequest.source(searchSourceBuilder);

SearchResponse searchResponse = client.search(searchRequest, RequestOptions.DEFAULT);
String scrollId = searchResponse.getScrollId();
SearchHit[] searchHits = searchResponse.getHits().getHits();

// 处理第一次的结果集
for (SearchHit hit : searchHits) {
    // 处理每个文档
}

while (searchHits != null && searchHits.length > 0) {
    SearchScrollRequest scrollRequest = new SearchScrollRequest(scrollId);
    scrollRequest.scroll(TimeValue.timeValueMinutes(1)); // 设置scroll上下文的有效时间

    searchResponse = client.scroll(scrollRequest, RequestOptions.DEFAULT);
    scrollId = searchResponse.getScrollId();
    searchHits = searchResponse.getHits().getHits();

    // 处理下一次的结果集
    for (SearchHit hit : searchHits) {
        // 处理每个文档
    }
}

ClearScrollRequest clearScrollRequest = new ClearScrollRequest();
clearScrollRequest.addScrollId(scrollId);
ClearScrollResponse clearScrollResponse = client.clearScroll(clearScrollRequest, RequestOptions.DEFAULT);

client.close();

在上述示例中，我们首先创建了一个RestHighLevelClient实例，并指定了ElasticSearch集群的地址。然后，我们创建了一个SearchRequest，并设置了搜索的索引名称、查询条件、排序规则和每次请求返回的文档数量。接下来，我们执行搜索请求，并获取第一次的结果集和scroll上下文。然后，我们处理第一次的结果集，并使用scroll上下文来获取下一次的结果集，直到没有更多的结果为止。最后，我们清除scroll上下文。

对于ElasticSearch的更多详细信息和使用方法，可以参考腾讯云的ElasticSearch产品介绍。

页面内容是否对你有帮助？

有帮助

没帮助

实体内容太长` ElasticSearch - RestHighLevelClient with scrollAPI抛出`抑制: org.apache.http.ContentTooLongException:实体内容太长`

、、

Suppressed: org.apache.http.ContentTooLongException: entity content is too longD:\Karthikeyan\ElasticSearch\ElasticSearch_Tesing\target>java -jar ElasticSearch at ja

浏览 2提问于2018-07-13得票数 1

回答已采纳

2回答

org.apache.http.ContentTooLongException:实体内容太长[105539255]，无法满足配置的缓冲区限制[104857600]

、、、

我正在尝试从我的索引(ElasticSearch)中获取索引PDF文档。我已经索引我的pdf文件使用吞食-附件处理器插件。它的2500个文档已与PDF附件一起编入索引。现在，通过使用PDF的内容进行搜索来获取那些PDF，并获取以下错误。org.apache.http.ContentTooLongException: entity content is too long [105539255] for the configured bufferlimit [104857600] at org.elasticsearch</em

浏览 0提问于2018-06-25得票数 6

回答已采纳

2回答

向(Python)添加大量数据

、、

我正在做一个项目，要求我将大量数据(几万个实体)导入到中。因此，我的问题是，当代码在一堆数据上迭代时，如何运行需要很长时间才能完成的代码？我读过一些关于任

浏览 1提问于2014-08-01得票数 0

回答已采纳

2回答

C#实体框架日志记录(DbContext)不工作

、、

我正在尝试记录按实体框架发送到数据库的sql，但没有太多的运气。我首先将代码用于新的数据库工作流，但是当我将属性添加到我的DbContext中时，我从数据库标识符中获得了一个Oracle错误。我想查看发送到数据库的sql，以确定它如何尝试创建我的表，并查看哪个标识符名称太长。 } 由于其中一个标识符太长，因此在context.workaffiliations.add行上抛出<em

浏览 1提问于2017-05-01得票数 1

回答已采纳

3回答

实现IFB_LLLLCHAR

、

checkLength(len, 9999); }问题是我不能使用整个9999，因为如果整个消息的大小超过9999，它会在发送时抛出以下异常

浏览 0提问于2013-09-30得票数 0

回答已采纳

1回答

如何快速将数据库中的数据输入对象列表(使用实体框架)

、、、、

我在实体框架对象上使用linq语句将数据从数据库获取到对象列表中。我的问题是，表演是nice说它很好。对于我处理的几百行或上千行，它需要几秒钟。所以，我的问题是，我能做些什么来提高性能(或者我是否需要把我的设计思想完全抛出窗外，然后完全用different...and (如果是这样的话)？代码示例：public class myobject public id更新我做了一些测试，还有一些奇怪的地方:当我使用字符

浏览 3提问于2015-01-08得票数 0

1回答

什么是管理实体框架ObjectContext在ASP.NET MVC控制器中的依赖注入的正确方法？

、、

在我的MVC控制器中，我使用的是一个IoC容器(Ninject)，但是当涉及到实体框架ObjectContext时，我不知道如何最好地使用它。如果我要在每次请求的基础上通过Ninject创建ObjectContext，这显然会使数据库连接打开时间太长。而且上面的代码会变成..。

浏览 1提问于2012-04-26得票数 2

6回答

游戏组件、游戏管理器和对象属性

、、

我正试着把我的头放在基于组件的实体设计上。我的第一步是创建可以添加到对象中的各种组件。对于每种组件类型，我都有一个管理器，它将调用每个组件的更新函数，根据需要传入诸如键盘状态等内容。

浏览 0提问于2011-11-16得票数 15

回答已采纳

1回答

Symfony 2表单bindRequest方法不能正确绑定一对多关系

、、

我有一个名为event的实体，它至少有一个或多个time对象Event.php } }<?

浏览 0提问于2012-04-30得票数 2

回答已采纳

7回答

如何从一个地方控制HTML表单字段的定义、表示、验证和存储？

、、、

我希望能够在一个地方定义有关表单字段的所有内容，而不是在DB中有一些信息，有些在HTML中，有些在JavaScript中，有些在ASP中.

浏览 3提问于2010-07-20得票数 4

28回答

一个或多个实体的验证失败。有关详细信息，请参阅“EntityValidationErrors”属性

、、、

一个或多个实体的验证失败。有关详细信息，请参阅“EntityValidationErrors”属性。对不起，代码太长了，但我得把它全部粘贴起来。异常将在以下代码的最后一行中抛出。

浏览 47提问于2011-10-17得票数 865

回答已采纳

8回答

将业务层与数据层分离时，应在何处对实体进行限制

、、

通常，我的应用程序混合了业务逻辑和数据访问层，并且多个业务实体在单个类中交织在一起(当我试图确定在哪里添加内容时，这让我困惑了几次)。我读到的大部分内容都是将业务层和数据层分开。

浏览 0提问于2010-02-03得票数 4

回答已采纳

7回答

我们在C#中是否有非托管资源？

、、、

我和我的朋友讨论了c#中的托管和非托管资源。1.a)当我们用C#编写代码时，C#中的每个对象都是托管的，没有什么比非托管对象或资源更好的了。非托管资源的概念仅随C++一起提供。据我所说：2.b)垃圾收集器只有关于已分配内存的信息，而没有关于资源状态的信息。因此我们需要使用dispose方法来释放C#中的资源。我需要帮助来理解上面哪些论点是正确的，

浏览 2提问于2011-06-17得票数 8

2回答

PostgreSQL中的批存储过程

、、、、

我需要把很多实体保存到数据库中。保存实体需要向不同的表中添加行，通过在一个表中插入一行来自动生成键，用于将某些行插入到另一个表中。这样的逻辑让我创建和使用了一个存储过程。分别调用每个实体的此存储过程(即通过statement.execute(.))除了要拯救数十亿个实体外，一切都很好。所以我试着分批做这个。但是，在批处理的情况下，批处理执行会导致抛出带有消息的org.postgresql.util.PSQLException，“在没有预期结果时返回结果。”caught: " + e.getNex

浏览 2提问于2016-07-27得票数 1

36回答

MySQL错误#1071 -指定的密钥太长；最大密钥长度为767字节

、、、

当我执行以下命令时：`column1` ,);#1071 - Specified key was too long; max key length is 767 bytescolumn1 varchar(20) utf8_general_ci我认为varchar(20)只需要21个字节，而varchar(500)只需要501个字节。所以总的字节数是522

浏览 16提问于2009-11-29得票数 619

回答已采纳

23回答

如何命名变量

、、

浏览 30提问于2008-10-15得票数 49

396回答

你最有争议的编程观点是什么？

这绝对是主观的，但我想尽量避免争论。我认为如果人们适当地对待它，这可能是一个有趣的问题。那么，你持有什么有争议的意见呢？我宁愿避免这样的事情，因为这类事情的基础相对较少(例如，放置支撑)，但例子可能包括“单元测试实际上并不十分有用”或“公共字段非常好”之类的东西。重要的是(无论如何，对我来说)你有理由支持你的观点。请提出你的观点和理由--我鼓励人们投票赞成那些有充分争论和有趣的意见，

浏览 65提问于2009-01-02得票数 363

73回答

你发现并修复过的最难的bug是什么？

是什么让它很难找到？你是怎么找到它的？

浏览 1提问于2008-10-04得票数 63

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

实体内容太长` ElasticSearch - RestHighLevelClient with scrollAPI抛出`抑制: org.apache.http.ContentTooLongException:实体内容太长`

相关·内容

实体内容太长` ElasticSearch - RestHighLevelClient with scrollAPI抛出`抑制: org.apache.http.ContentTooLongException:实体内容太长`

org.apache.http.ContentTooLongException:实体内容太长[105539255]，无法满足配置的缓冲区限制[104857600]

向(Python)添加大量数据

C#实体框架日志记录(DbContext)不工作

实现IFB_LLLLCHAR

如何快速将数据库中的数据输入对象列表(使用实体框架)

什么是管理实体框架ObjectContext在ASP.NET MVC控制器中的依赖注入的正确方法？

游戏组件、游戏管理器和对象属性

Symfony 2表单bindRequest方法不能正确绑定一对多关系

如何从一个地方控制HTML表单字段的定义、表示、验证和存储？

一个或多个实体的验证失败。有关详细信息，请参阅“EntityValidationErrors”属性

将业务层与数据层分离时，应在何处对实体进行限制

我们在C#中是否有非托管资源？

PostgreSQL中的批存储过程

MySQL错误#1071 -指定的密钥太长；最大密钥长度为767字节

如何命名变量

你最有争议的编程观点是什么？

你发现并修复过的最难的bug是什么？

扫码

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐