前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >ElasticSearch入门之彼行我释(四)

ElasticSearch入门之彼行我释(四)

作者头像
我是攻城师
发布2018-05-11 17:30:00
8650
发布2018-05-11 17:30:00
举报
文章被收录于专栏:我是攻城师我是攻城师

散仙在上篇文章中,介绍了关于ElasticSearch基本的增删改查的基本粒子,本篇呢,我们来学下稍微高级一点的知识: (1)如何在ElasticSearch中批量提交索引 ? (2)如何使用高级查询(包括,检索,排序,过滤,分页) ? (3)如何组合多个查询 ? (4)如何使用翻页深度查询 ? (5)如何使用基本的聚合查询 ? (一)首先,我们思考下,为什么要使用批量添加,这个毫无疑问,因为效率问题,举个在生活中的例子,假如我们有50个人,要去美国旅游,不使用批处理的方式是,给每一个人派一架飞机送到美国,那么这就需要50次飞机的来回往来,假如使用了批处理,现在的情况就是一个飞机坐50个人,只需一次即可把所有人都送到美国,效率可想而知,生活也有很多实际的例子,大家可以自己想想。 在原生的lucene中,以及solr中,这个批处理方式,实质是控制commit的时机,比如多少个提交一次,或者超过ranbuffersize的大小后自动提交,es封装了lucene的api提供bulk的方式来批量添加,原理也是,聚集一定的数量doc,然后发送一次添加请求。 (二)只要我们使用了全文检索,我们的业务就会有各种各样的api操作,包括,任意维度的字段查询,过滤掉某些无效的信息,然后根据某个字段排序,再取topN的结果集返回,使用数据库的小伙伴们,相信大家都不陌生,在es中,这些操作都是支持的,而且还非常高效,它能满足我们大部分的需求 (三)在es中,我们可以查询多个index,以及多个type,这一点是非常灵活地,我们,我们可以一次组装两个毫无关系的查询,发送到es服务端进行检索,然后获取结果。 (四)es中,通过了scorll的方式,支持深度分页查询,在数据库里,我们使用的是一个cursor游标来记录读取的偏移量,同样的在es中也支持,这样的查询方式,它通过一个scrollid记录了上一次查询的状态,能轻而易举的实现深度翻页,本质上是对了Lucene的SearchAfter的封装。 (五)es中,也提供了对聚合函数的支持,比如一些max,min,avg,count,sum等支持,除此之外还支持group,facet等操作,这些功能,在电商中应用非常广泛,基于lucene的solr和es都有很好的支持。 下面截图看下散仙的测试数据值:

源码demo如下:

Java代码

代码语言:javascript
复制
package com.dongliang.es;  
 
import java.util.Date;  
import java.util.Map;  
import java.util.Map.Entry;  
 
import org.apache.lucene.index.Terms;  
import org.elasticsearch.action.bulk.BulkRequestBuilder;  
import org.elasticsearch.action.bulk.BulkResponse;  
import org.elasticsearch.action.search.MultiSearchResponse;  
import org.elasticsearch.action.search.SearchRequestBuilder;  
import org.elasticsearch.action.search.SearchResponse;  
import org.elasticsearch.action.search.SearchType;  
import org.elasticsearch.client.Client;  
import org.elasticsearch.client.transport.TransportClient;  
import org.elasticsearch.common.transport.InetSocketTransportAddress;  
import org.elasticsearch.common.unit.TimeValue;  
import org.elasticsearch.common.xcontent.XContentBuilder;  
import org.elasticsearch.common.xcontent.XContentFactory;  
import org.elasticsearch.index.query.FilterBuilders;  
import org.elasticsearch.index.query.QueryBuilders;  
import org.elasticsearch.index.query.QueryStringQueryBuilder;  
import org.elasticsearch.search.SearchHit;  
import org.elasticsearch.search.aggregations.AggregationBuilders;  
import org.elasticsearch.search.aggregations.bucket.filters.InternalFilters.Bucket;  
import org.elasticsearch.search.sort.SortOrder;  
 
/** 
 * @author 三劫散仙 
 * 搜索技术交流群:324714439  
 * 一个关于elasticsearch批量提交 
 * 和search query的的例子 
 * **/ 
public class ElasticSearchDao {  
 
 
 //es的客户端实例 
    Client client=null;  
    {  
 //连接单台机器,注意ip和端口号,不能写错 
        client=new TransportClient().  
                addTransportAddress(new InetSocketTransportAddress("192.168.46.16", 9300));  
 
    }  
 
 
 public static void main(String[] args)throws Exception {  
        ElasticSearchDao es=new ElasticSearchDao();  
 //es.indexdata();//索引数据 
 //es.queryComplex(); 
        es.querySimple();  
 //es.scorllQuery(); 
 //es.mutilCombineQuery(); 
 //es.aggregationQuery(); 
    }  
 
 
 /**组合分组查询*/ 
 public void aggregationQuery()throws Exception{  
        SearchResponse sr = client.prepareSearch()  
                .setQuery(QueryBuilders.matchAllQuery())  
                .addAggregation(  
                        AggregationBuilders.terms("1").field("type")  
                )  
//              .addAggregation( 
//                      AggregationBuilders.dateHistogram("agg2") 
//                              .field("birth") 
//                              .interval(DateHistogram.Interval.YEAR) 
//              ) 
                .execute().actionGet();  
 
 // Get your facet results 
            org.elasticsearch.search.aggregations.bucket.terms.Terms a = sr.getAggregations().get("1");  
 
 for(org.elasticsearch.search.aggregations.bucket.terms.Terms.Bucket bk:a.getBuckets()){  
                System.out.println("类型: "+bk.getKey()+"  分组统计数量 "+bk.getDocCount()+"  ");  
            }  
 
            System.out.println("聚合数量:"+a.getBuckets().size());  
 //DateHistogram agg2 = sr.getAggregations().get("agg2"); 
 //结果: 
//          类型: 1  分组数量 2   
//          类型: 2  分组数量 1   
//          类型: 3  分组数量 1   
//          聚合数量:3 
    }  
 
 
 
 
 /**多个不一样的请求组装*/ 
 public void mutilCombineQuery(){  
 
 //查询请求1 
        SearchRequestBuilder srb1 =client.prepareSearch().setQuery(QueryBuilders.queryString("eng").field("address")).setSize(1);  
 //查询请求2//matchQuery 
        SearchRequestBuilder srb2 = client.prepareSearch().setQuery(QueryBuilders.matchQuery("title", "标题")).setSize(1);  
 //组装查询 
        MultiSearchResponse sr = client.prepareMultiSearch().add(srb1).add(srb2).execute().actionGet();  
 
 // You will get all individual responses from MultiSearchResponse#getResponses() 
 long nbHits = 0;  
 for (MultiSearchResponse.Item item : sr.getResponses()) {  
                SearchResponse response = item.getResponse();  
 for(SearchHit hits:response.getHits().getHits()){  
                    String sourceAsString = hits.sourceAsString();//以字符串方式打印 
                    System.out.println(sourceAsString);  
                }  
                nbHits += response.getHits().getTotalHits();  
            }  
        System.out.println("命中数据量:"+nbHits);  
 //输出: 
//      {"title":"我是标题","price":25.65,"type":1,"status":true,"address":"血落星域风阳星","createDate":"2015-03-16T09:56:20.440Z"} 
//      命中数据量:2 
 
        client.close();  
    }  
 
 
 /** 
     * 翻页查询 
     * */ 
 public void scorllQuery()throws Exception{  
        QueryStringQueryBuilder queryString = QueryBuilders.queryString("标题").field("title");  
 //TermQueryBuilder qb=QueryBuilders.termQuery("title", "我是标题"); 
        SearchResponse scrollResp = client.prepareSearch("collection1")  
                 .setSearchType(SearchType.SCAN)  
                 .setScroll(new TimeValue(60000))  
                 .setQuery(queryString)  
                 .setSize(100).execute().actionGet(); //100 hits per shard will be returned for each scroll 
 
 
 while (true) {  
 for (SearchHit hit : scrollResp.getHits().getHits()) {  
 //Handle the hit... 
                String sourceAsString = hit.sourceAsString();//以字符串方式打印 
                System.out.println(sourceAsString);  
            }  
 //通过scrollid来实现深度翻页 
            scrollResp = client.prepareSearchScroll(scrollResp.getScrollId()).setScroll(new TimeValue(600000)).execute().actionGet();  
 //Break condition: No hits are returned 
 if (scrollResp.getHits().getHits().length == 0) {  
 break;  
            }  
        }  
 //输出 
//      {"title":"我是标题","price":25.65,"type":1,"status":true,"address":"血落星域风阳星","createDate":"2015-03-16T09:56:20.440Z"} 
//      {"title":"标题","price":251.65,"type":1,"status":true,"address":"美国东部","createDate":"2015-03-16T10:33:58.743Z"} 
        client.close();  
 
    }  
 
 /**简单查询*/ 
 public void querySimple()throws Exception{  
 
        SearchResponse sp = client.prepareSearch("collection1").execute().actionGet();  
 for(SearchHit hits:sp.getHits().getHits()){  
            String sourceAsString = hits.sourceAsString();//以字符串方式打印 
            System.out.println(sourceAsString);  
        }  
 
 
 //结果 
//              {"title":"我是标题","price":25.65,"type":1,"status":true,"address":"血落星域风阳星","createDate":"2015-03-16T09:56:20.440Z"} 
//              {"title":"中国","price":205.65,"type":2,"status":true,"address":"河南洛阳","createDate":"2015-03-16T10:33:58.740Z"} 
//              {"title":"标题","price":251.65,"type":1,"status":true,"address":"美国东部","createDate":"2015-03-16T10:33:58.743Z"} 
//              {"title":"elasticsearch是一个搜索引擎","price":25.65,"type":3,"status":true,"address":"china","createDate":"2015-03-16T10:33:58.743Z"} 
 
 
    }  
 /**组合查询**/ 
 public void queryComplex()throws Exception{  
        SearchResponse sp=client.prepareSearch("collection1")//检索的目录 
                .setTypes("core1")//检索的索引 
                .setSearchType(SearchType.DFS_QUERY_THEN_FETCH)//Query type 
                .setQuery(QueryBuilders.termQuery("type", "1"))//查询--Query  
                .setPostFilter(FilterBuilders.rangeFilter("price").from(10).to(550.23))//过滤 --Filter 
                .addSort("price",SortOrder.DESC) //排序 -- sort 
                .setFrom(0).setSize(20).setExplain(true)//topN方式 
                .execute().actionGet();//执行 
                System.out.println("本次查询命中条数: "+sp.getHits().getTotalHits());  
 for(SearchHit hits:sp.getHits().getHits()){  
 //String sourceAsString = hits.sourceAsString();//以字符串方式打印 
 //System.out.println(sourceAsString); 
                    Map<String, Object> sourceAsMap = hits.sourceAsMap();  
 for(Entry<String, Object> k:sourceAsMap.entrySet()){  
                        System.out.println("name: "+k.getKey()+"     value: "+k.getValue());  
                    }  
 
                    System.out.println("=============================================");  
 
                }  
 
 //结果 
//              本次查询命中条数: 2 
//              name: title     value: 标题 
//              name: price     value: 251.65 
//              name: address     value: 美国东部 
//              name: status     value: true 
//              name: createDate     value: 2015-03-16T10:33:58.743Z 
//              name: type     value: 1 
//              ============================================= 
//              name: title     value: 我是标题 
//              name: price     value: 25.65 
//              name: address     value: 血落星域风阳星 
//              name: status     value: true 
//              name: createDate     value: 2015-03-16T09:56:20.440Z 
//              name: type     value: 1 
//              ============================================= 
 
        client.close();  
    }  
 
 
 
 /**索引数据*/ 
 public void indexdata()throws Exception{  
 
        BulkRequestBuilder bulk=client.prepareBulk();  
 
        XContentBuilder doc=XContentFactory.jsonBuilder()  
                .startObject()  
                .field("title","中国")  
                .field("price",205.65)  
                .field("type",2)  
                .field("status",true)  
                .field("address", "河南洛阳")  
                .field("createDate", new Date()).endObject();  
 //collection为索引库名,类似一个数据库,索引名为core,类似一个表 
//       client.prepareIndex("collection1", "core1").setSource(doc).execute().actionGet(); 
 
 //批处理添加 
        bulk.add(client.prepareIndex("collection1", "core1").setSource(doc));  
 
        doc=XContentFactory.jsonBuilder()  
                .startObject()  
                .field("title","标题")  
                .field("price",251.65)  
                .field("type",1)  
                .field("status",true)  
                .field("address", "美国东部")  
                .field("createDate", new Date()).endObject();  
 //collection为索引库名,类似一个数据库,索引名为core,类似一个表 
//      client.prepareIndex("collection1", "core1").setSource(doc).execute().actionGet(); 
 //批处理添加 
        bulk.add(client.prepareIndex("collection1", "core1").setSource(doc));  
 
        doc=XContentFactory.jsonBuilder()  
                .startObject()  
                .field("title","elasticsearch是一个搜索引擎")  
                .field("price",25.65)  
                .field("type",3)  
                .field("status",true)  
                .field("address", "china")  
                .field("createDate", new Date()).endObject();  
 //collection为索引库名,类似一个数据库,索引名为core,类似一个表 
 //client.prepareIndex("collection1", "core1").setSource(doc).execute().actionGet(); 
 //批处理添加 
        bulk.add(client.prepareIndex("collection1", "core1").setSource(doc));         
 
 
 //发一次请求,提交所有数据 
          BulkResponse bulkResponse = bulk.execute().actionGet();  
 if (!bulkResponse.hasFailures()) {  
              System.out.println("创建索引success!");  
          } else {  
              System.out.println("创建索引异常:"+bulkResponse.buildFailureMessage());  
          }  
 
 
 
        client.close();//释放资源 
//      System.out.println("索引成功!"); 
 
 
 
    }  
 
}  
本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2015-03-17,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 我是攻城师 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档