Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >ElasticSearch搜索实例含高亮显示及搜索的特殊字符过滤

ElasticSearch搜索实例含高亮显示及搜索的特殊字符过滤

作者头像
星哥玩云
发布于 2022-07-04 06:23:11
发布于 2022-07-04 06:23:11
1.5K0
举报
文章被收录于专栏:开源部署开源部署

ElasticSearch搜索实例含高亮显示及搜索的特殊字符过滤

应用说明见代码注解。

1.简单搜索实例展示:

    public void search() throws IOException {         // 自定义集群结点名称         String clusterName = "elasticsearch_pudongping";

        // 获取客户端         Client client = ESClient.initClient(clusterName);

        // 创建查询索引,参数productindex表示要查询的索引库为productindex         SearchRequestBuilder searchRequestBuilder = client                 .prepareSearch("productindex");

        // 设置查询索引类型,setTypes("productType1", "productType2","productType3");         // 用来设定在多个类型中搜索         searchRequestBuilder.setTypes("productIndex");

        // 设置查询类型 1.SearchType.DFS_QUERY_THEN_FETCH = 精确查询 2.SearchType.SCAN =         // 扫描查询,无序         searchRequestBuilder.setSearchType(SearchType.DFS_QUERY_THEN_FETCH);

        // 设置查询关键词         searchRequestBuilder                 .setQuery(QueryBuilders.fieldQuery("title", "Acer"));

        // 查询过滤器过滤价格在4000-5000内 这里范围为[4000,5000]区间闭包含,搜索结果包含价格为4000和价格为5000的数据         searchRequestBuilder.setFilter(FilterBuilders.rangeFilter("price")                 .from(4000).to(5000));

        // 分页应用         searchRequestBuilder.setFrom(0).setSize(60);

        // 设置是否按查询匹配度排序         searchRequestBuilder.setExplain(true);

        // 执行搜索,返回搜索响应信息         SearchResponse response = searchRequestBuilder.execute().actionGet();

        SearchHits searchHits = response.getHits();         SearchHit[] hits = searchHits.getHits();         for (int i = 0; i < hits.length; i++) {             SearchHit hit = hits[i];             Map<String, Object> result = hit.getSource();             // 打印map集合:{id=26, onSale=true, title=宏基Acer乐3, price=4009.0,             // description=null, createDate=1380530123140, type=2}             System.out.println(result);         }         System.out.println("search success ..");

    }

说明:

client.prepareSearch用来创建一个SearchRequestBuilder,搜索即由SearchRequestBuilder执行。

client.prepareSearch方法有参数为一个或多个index,表现在数据库中,即零个或多个数据库名,你既可以使用(下面两个都可以表示在多个索引库中查找):

client.prepareSearch().setIndices("index1","index2","index3","index4");

或者:

client.prepareSearch("index1","index2","index3","index4");

SearchRequestBuilder常用方法说明:

(1) setIndices(String... indices):上文中描述过,参数可为一个或多个字符串,表示要进行检索的index;

(2) setTypes(String... types):参数可为一个或多个字符串,表示要进行检索的type,当参数为0个或者不调用此方法时,表示查询所有的type;

setSearchType(SearchType searchType):执行检索的类别,值为org.elasticsearch.action.search.SearchType的元素,SearchType是一个枚举类型的类,   其值如下所示:   QUERY_THEN_FETCH:查询是针对所有的块执行的,但返回的是足够的信息,而不是文档内容(Document)。结果会被排序和分级,基于此,只有相关的块的文档对象会被返回。由于被取到的仅仅是这些,故而返回的hit的大小正好等于指定的size。这对于有许多块的index来说是很便利的(返回结果不会有重复的,因为块被分组了)   QUERY_AND_FETCH:最原始(也可能是最快的)实现就是简单的在所有相关的shard上执行检索并返回结果。每个shard返回一定尺寸的结果。由于每个shard已经返回了一定尺寸的hit,这种类型实际上是返回多个shard的一定尺寸的结果给调用者。   DFS_QUERY_THEN_FETCH:与QUERY_THEN_FETCH相同,预期一个初始的散射相伴用来为更准确的score计算分配了的term频率。   DFS_QUERY_AND_FETCH:与QUERY_AND_FETCH相同,预期一个初始的散射相伴用来为更准确的score计算分配了的term频率。   SCAN:在执行了没有进行任何排序的检索时执行浏览。此时将会自动的开始滚动结果集。   COUNT:只计算结果的数量,也会执行facet。

(4) setSearchType(String searchType),与setSearchType(SearchType searchType)类似,区别在于其值为字符串型的SearchType,值可为dfs_query_then_fetch、dfsQueryThenFetch、dfs_query_and_fetch、dfsQueryAndFetch、query_then_fetch、queryThenFetch、query_and_fetch或queryAndFetch;

(5) setScroll(Scroll scroll)、setScroll(TimeValue keepAlive)和setScroll(String keepAlive),设置滚动,参数为Scroll时,直接用new Scroll(TimeValue)构造一个Scroll,为TimeValue或String时需要将TimeValue和String转化为Scroll;

(6) setTimeout(TimeValue timeout)和setTimeout(String timeout),设置搜索的超时时间;

(7) setQuery,设置查询使用的Query;

(8) setFilter,设置过滤器;

(9) setMinScore,设置Score的最小数量;

(10) setFrom,从哪一个Score开始查;

(11) setSize,需要查询出多少条结果;

检索出结果后,通过response.getHits()可以得到所有的SearchHit,得到Hit后,便可迭代Hit取到对应的Document,转化成为需要的实体。

2.搜索高亮显示

SearchRequestBuilder中的addHighlightedField()方法可以定制在哪个域值的检索结果的关键字上增加高亮

    public void search() throws IOException {         // 自定义集群结点名称         String clusterName = "elasticsearch_pudongping";         // 获取客户端         Client client = ESClient.initClient(clusterName);   

        // 创建查询索引,参数productindex表示要查询的索引库为productindex         SearchRequestBuilder searchRequestBuilder = client                 .prepareSearch("productindex");

        // 设置查询索引类型,setTypes("productType1", "productType2","productType3");         // 用来设定在多个类型中搜索         searchRequestBuilder.setTypes("productIndex");

        // 设置查询类型 1.SearchType.DFS_QUERY_THEN_FETCH = 精确查询 2.SearchType.SCAN = 扫描查询,无序         searchRequestBuilder.setSearchType(SearchType.DFS_QUERY_THEN_FETCH);

        // 设置查询关键词         searchRequestBuilder                 .setQuery(QueryBuilders.fieldQuery("title", "Acer"));

        // 查询过滤器过滤价格在4000-5000内 这里范围为[4000,5000]区间闭包含,搜索结果包含价格为4000和价格为5000的数据         searchRequestBuilder.setFilter(FilterBuilders.rangeFilter("price")                 .from(4000).to(5000));

        // 分页应用         searchRequestBuilder.setFrom(0).setSize(60);

        // 设置是否按查询匹配度排序         searchRequestBuilder.setExplain(true);         //设置高亮显示         searchRequestBuilder.addHighlightedField("title");         searchRequestBuilder.setHighlighterPreTags("<span style=\"color:red\">");         searchRequestBuilder.setHighlighterPostTags("</span>");         // 执行搜索,返回搜索响应信息         SearchResponse response = searchRequestBuilder.execute().actionGet();         //获取搜索的文档结果         SearchHits searchHits = response.getHits();         SearchHit[] hits = searchHits.getHits();         ObjectMapper mapper = new ObjectMapper();         for (int i = 0; i < hits.length; i++) {             SearchHit hit = hits[i];             //将文档中的每一个对象转换json串值             String json = hit.getSourceAsString();             //将json串值转换成对应的实体对象             Product product = mapper.readValue(json, Product.class);              //获取对应的高亮域             Map<String, HighlightField> result = hit.highlightFields();                //从设定的高亮域中取得指定域             HighlightField titleField = result.get("title");              //取得定义的高亮标签             Text[] titleTexts =  titleField.fragments();                //为title串值增加自定义的高亮标签             String title = "";              for(Text text : titleTexts){                      title += text;              }             //将追加了高亮标签的串值重新填充到对应的对象             product.setTitle(title);             //打印高亮标签追加完成后的实体对象             System.out.println(product);         }         System.out.println("search success ..");

    }

程序运行结果:

[id=8,title=宏基<span style="color:red">Acer</span>,description=宏基Acer蜂鸟系列,price=5000.0,onSale=true,type=1,createDate=Mon Sep 30 13:46:41 CST 2013] [id=21,title=宏基<span style="color:red">Acer</span>,description=宏基Acer蜂鸟系列,price=5000.0,onSale=true,type=1,createDate=Mon Sep 30 13:48:17 CST 2013] [id=7,title=宏基<span style="color:red">Acer</span>,description=宏基Acer蜂鸟系列,price=5000.0,onSale=true,type=1,createDate=Mon Sep 30 11:38:50 CST 2013] [id=5,title=宏基<span style="color:red">Acer</span>乐0,description=<null>,price=4000.0,onSale=true,type=1,createDate=Mon Sep 30 16:35:23 CST 2013] [id=12,title=宏基<span style="color:red">Acer</span>乐1,description=<null>,price=4003.0,onSale=false,type=2,createDate=Mon Sep 30 16:35:23 CST 2013] [id=19,title=宏基<span style="color:red">Acer</span>乐2,description=<null>,price=4006.0,onSale=false,type=1,createDate=Mon Sep 30 16:35:23 CST 2013] [id=26,title=宏基<span style="color:red">Acer</span>乐3,description=<null>,price=4009.0,onSale=true,type=2,createDate=Mon Sep 30 16:35:23 CST 2013] [id=33,title=宏基<span style="color:red">Acer</span>乐4,description=<null>,price=4012.0,onSale=false,type=1,createDate=Mon Sep 30 16:35:23 CST 2013]

从程序执行结果中我们可以看到,我们定义的高亮标签已经追加到指定的域上了.

当搜索索引的时候,你搜索关键字包含了特殊字符,那么程序就会报错

// fieldQuery 这个必须是你的索引字段哦,不然查不到数据,这里我只设置两个字段 id ,title String title = "title+-&&||!(){}[]^\"~*?:\\"; title = QueryParser.escape(title);// 主要就是这一句把特殊字符都转义,那么lucene就可以识别 searchRequestBuilder.setQuery(QueryBuilders.fieldQuery("title", title));

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
elasticsearch 5.x highlight 高亮
public static Map<String, Object> search(String key,String index,String type,int start,int row){ //创建查询索引,要查询的索引库为index SearchRequestBuilder builder = getClient().prepareSearch(index); builder.setTypes(type); builder.setFrom(start); builder.setSize(row); //设置查询类型:1.SearchType.DFS_QUERY_THEN_FETCH 精确查询; 2.SearchType.SCAN 扫描查询,无序 builder.setSearchType(SearchType.DFS_QUERY_THEN_FETCH); if(StringUtils.isNotBlank(key)){ // 设置查询关键词 builder.setQuery(QueryBuilders.multiMatchQuery(key, "title","describe")); } //设置是否按查询匹配度排序
程裕强
2022/05/06
4110
SpringBoot集成ES
Elasticsearch JAVA操作有三种客户端: 1、TransportClient 2、JestClient 3、RestClient 还有种是2.3中有的NodeClient,在5.5.1中好像没有了。 还有种是spring-data-elasticsearch,这里先以TransportClient为例子。
AlexZhang
2021/11/26
8190
elasticsearch2.2之javaApi
前言:elasticsearch虽然自带rest接口,但是在真正使用过程中可能更多的是通过不同编程语言的客户端进行交互。
王念博客
2019/07/24
6030
ElasticSearch入门之彼行我释(四)
散仙在上篇文章中,介绍了关于ElasticSearch基本的增删改查的基本粒子,本篇呢,我们来学下稍微高级一点的知识: (1)如何在ElasticSearch中批量提交索引 ? (2)如何使用高级查询(包括,检索,排序,过滤,分页) ? (3)如何组合多个查询 ? (4)如何使用翻页深度查询 ? (5)如何使用基本的聚合查询 ? (一)首先,我们思考下,为什么要使用批量添加,这个毫无疑问,因为效率问题,举个在生活中的例子,假如我们有50个人,要去美国旅游,不使用批处理的方式是,给每一个
我是攻城师
2018/05/11
9140
基于springboot+vue2.0+前后端分离式实现在线网络商城前后台项目
在线网络商城项目基于前后端分离开发模式实现,前端主要采用Vuejs,nodejs,Bootstrap,Font-awesome,zTree,ace,elementUI等实现,项目后端采用springboot,maven,redis,mybatis,mysql,mongodb等技术。前端界面风格借鉴锤子商城风格,系统网站前端提供用户在线选购,添加购物车,订单支付等功能。系统后端提供管理员用户操作,支持在线管理商品,订单管理,用户管理,系统管理等功能。
计算机程序优异哥
2022/12/02
4670
Elasticsearch JavaApi
 官网JavaApi地址:https://www.elastic.co/guide/en/elasticsearch/client/java-api/current/java-search.html
用户1518699
2018/09/12
1.7K0
内存吞金兽(Elasticsearch)的那些事儿 -- 常见问题痛点及解决方案
查询的流程:往 ES 里写的数据,实际上都写到磁盘文件里去了,查询的时候,操作系统会将磁盘文件里的数据自动缓存到 Filesystem Cache 里面去
房上的猫
2021/08/31
6500
elasticsearch实践之代码结构设计
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/linzhiqiang0316/article/details/81192994
林老师带你学编程
2019/05/26
1.1K0
SpringBoot连接Elasticsearch实战总结
第一次使用elasticsearch,于是从网上找轮子复制粘贴。早好轮子测试完毕,上线。可是几天下来发现接口响应时间一直都偏高(默认的超时时间是500ms),所以就不停的对代码优化,缩短时间。但是到最后代码已经不能再优化了,响应时间依然没有明显的下降趋势,甚至在高峰期会严重超时。接下来会慢慢讲解elasticsearch使用优化。
小森啦啦啦
2019/07/13
4K0
Elasticsearch Java API 搜索之简介(三)
搜索查询,返回查询匹配的结果,搜索一个index / type 或者多个index / type,可以使用 queryJavaAPI(https://www.elastic.co/guide/en/elasticsearch/client/java-api/current/java-query-dsl.html) 作为查询条件,下面是例子:
全科
2018/08/15
6270
Spring Boot集成ElasticSearch实现简单的增删查改接口
在工程中新建一个config包,在该包中创建一个ESConfig配置类,用于构造es的客户端实例对象。代码如下:
端碗吹水
2020/09/23
1.1K0
Spring Boot集成ElasticSearch实现简单的增删查改接口
ES索引模糊查询
1. 准备环境 docker pull elasticsearch:6.7.0 docker pull kibana:6.7.0 docker run -it --name elasticsearch -d -p 9200:9200 -p 9300:9300 elasticsearch:6.7.0 docker run --link elasticsearch -p 5601:5601 --name kibana -d kibana:6.7.0 2. java代码 2.1 pom引入 <el
平常心
2020/10/14
3K0
ES索引模糊查询
Java 实现 Elasticsearch 查询当前索引全部数据
通常情况下,Elasticsearch 为了提高查询效率,对于不指定分页查询条数的查询语句,默认会返回10条数据。那么这就会有一种情况,当你需要一次性返回 Elasticsearch 索引中的全部数据时,就无法实现了。这个时候你可能会考虑,比如我将每页取值的size 设置的很大,这样或许可以解决问题,但是数据量的上升你是无法控制的,最终会有一天数据量会超过你此时设置的最大 size,那么这就是一个雷点。并且如果一次查询很大量数据的话,即便是 Elasticsearch 查询效率高的索引结构可能也会导致查询时长较长,甚至响应超时。那么是否有一种查询效率高,且相对灵活的方式可以查询 Elasticsearch 的索引中全部数据呢?答案是:有的。
六月的雨在Tencent
2024/12/25
4920
ElasticSearch-查询
Elasticsearch提供了基于JSON的DSL(Domain Specific Language)来定义查询。常见的查询类型包括:
yuanshuai
2023/11/17
2130
ElasticSearch-查询
Elasticsearch深分页以及排序查询问题
在分页处理时,我们要确定两个参数,start & size,如果一个分页查询start值很大,那么这就是一个深度分页查询。
小勇DW3
2020/07/20
5.9K0
Elasticsearch——分页查询From&Size VS scroll
Elasticsearch中数据都存储在分片中,当执行搜索时每个分片独立搜索后,数据再经过整合返回。那么,如果要实现分页查询该怎么办呢? 更多内容参考Elasticsearch资料汇总 按照一般的查询流程来说,如果我想查询前10条数据: 1 客户端请求发给某个节点 2 节点转发给个个分片,查询每个分片上的前10条 3 结果返回给节点,整合数据,提取前10条 4 返回给请求客户端 那么当我想要查询第10条到第20条的数据该怎么办呢?这个时候就用到分页查询了。 from-size"浅"分页 "浅"分页的
用户1154259
2018/01/17
2.9K1
Elasticsearch——分页查询From&Size VS scroll
ElasticSearch学习笔记(5)——SpringBoot整合ElasticSearch
本节主要介绍SpringBoot与ElasticSearch的整合,并实现简单的CRUD。
张申傲
2020/09/03
1.6K0
如何跳过es分页这个坑?
这只是允许你更进一步深度分页,却没有从根本上解决深度分页的问题,而且随着页码的增加,系统资源占用成指数级上升,很容易就会出现OOM。
用户5166556
2019/07/02
5.4K0
ES - 使用ES客户端来操作搜索引新
1 导入需要的pom <dependencies> <dependency> <groupId>org.elasticsearch</groupId> <artifactId>elasticsearch</artifactId> <version>7.3.0</version> </dependency> <dependency> <groupId>org.elasticsearch.client</groupId> <artifactI
用户5927264
2019/08/26
1.6K0
JavaRestClient操作Elasticsearch分页
导包 导包可以根据 文档 里导入依赖 这里就不写依赖了 代码 from:开始位置 size:每页大小 import com.google.gson.Gson; import com.leyou.pojo.Item; import org.apache.http.HttpHost; import org.elasticsearch.action.search.SearchRequest; import org.elasticsearch.action.search.SearchResponse; impo
用户9006224
2022/12/21
3300
相关推荐
elasticsearch 5.x highlight 高亮
更多 >
领券
💥开发者 MCP广场重磅上线!
精选全网热门MCP server,让你的AI更好用 🚀
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档