首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

HBASE+Solr实现详单查询

针对HBase的多条件查询也有多种方案,但是这些方案要么太复杂,要么效率太低,本文只对基于SolrHBase多条件查询方案进行测试和验证。...原理 基于SolrHBase多条件查询原理很简单,将HBase表中涉及条件过滤的字段和rowkey在Solr中建立索引,通过Solr的多条件查询快速获得符合过滤条件的rowkey值,拿到这些rowkey...HBaseSolr系统架构设计 使用HBase搭建结构数据存储云,用来存储海量数据;使用SolrCloud集群用来搭建搜索引擎,将要查找的结构化数据的ID查找出来,只配置它存储ID。 ?...rd代表用户read data读数据,从用户提交读数据请求rd1开始,经历rd2,直接读取MySQL中数据,或向Solr集群请求搜索服务,rd3,向Solr集群请求得到的搜索结果为ID,再向结构数据存储云中通过...实现方法有两种 手工编码,直接用HBASE的API,可以参考下文 http://www.cnblogs.com/chenz/articles/3229997.html 可以使用HBASE/Solr的LUNA

2K50

如何使用Lily HBase Indexer对HBase中的数据在Solr中建立索引

这时我们就需要借助Lily HBase Indexer在Solr中建立全文索引来实现。...Lily HBase Indexer提供了快速、简单的HBase的内容检索方案,它可以帮助你在Solr中建立HBase的数据索引,从而通过Solr进行数据检索。...2.首先你必须按照上篇文章《如何使用HBase存储文本文件》的方式将文本文件保存到HBase中。 3.在Solr中建立collection,这里需要定义一个schema文件对应到HBase的表结构。...4.运行脚本开始建立索引 [root@ip-172-31-8-230 solr-hbase]# [root@ip-172-31-8-230 solr-hbase]# sh batch.sh Delete...7.总结 ---- 1.使用Lily Indexer可以很方便的对HBase中的数据在Solr中进行索引,包含HBase的二级索引,以及非结构化文本数据的全文索引。

4.7K30
您找到你想要的搜索结果了吗?
是的
没有找到

基于solr实现hbase的二级索引 顶

基于solr实现hbase的二级索引 [X] 目的: 由于hbase基于行健有序存储,在查询时使用行健十分高效,然后想要实现关系型数据库那样可以随意组合的多条件查询、查询总记录数、分页等就比较麻烦了。...[X] 实现思路: 其实hbase结合solr实现方法还是比较简单的,重点在于一些实现细节上....默认情况下hbase每写一条数据就会向出发一次postPut, 如果直接提交个solr,速度会非常慢,而且如果有异常处理起来也会非常的麻烦.因此要自己实现一个本地可持久化的队列,通过后台线程异步向向solr...-- Solr Coprocessor --> hbase.coprocessor.region.classes wjw.hbase.solr.SolrRegionObserver...-- Solr的URL,多个以逗号分隔 --> hbase.solr.solrUrl http://${solrHost1

73130

Hbase+Solr实现二级索引提供高效查询

技术实现 (1)搭建一套solr或者es集群,并且提前定制好schemal,本例中用的是solr单节点存储索引, 如果不知道怎么搭建solrcloud集群或者elasticsearch集群,请参考博客...disable 'c' (8)添加协处理器的jar: Java代码 alter 'c', METHOD => 'table_att', 'coprocessor'=>'hdfs:///user/hbase_solr...(9)启动solr或者es集群 (9)在hbase shell或者 hbase java client进行put数据,然后等待查看索引里面是否正确添加数据,如果添加失败,查看hbase的regionserver...的http-client组件与本例中用的最新的solr的http-client组件版本不一致导致,添加索引报错。...解决办法: 使用solr的 httpclient-4.3.1.jar httpcore-4.3.jar 替换所有节点hbase/lib下的 低版本的httpclient组件包,即可!

2.9K60

Solr使用——什么是solr

Solr 具有高度可扩展性,提供容错分布式搜索和索引,并为世界上许多最大的互联网站点的搜索和导航功能提供支持。 Solr 是具有类似 REST 的 API 的独立企业搜索服务器。...针对大流量进行了优化:Solr 已在全球范围内以极大规模的方式得到验证 综合管理界面:Solr 附带一个内置的响应式管理用户界面,可以轻松控制您的 Solr 实例 基于标准的开放接口 - XML、JSON...Solr 通过 JMX 发布大量指标数据 高度可扩展和容错:Solr 建立在经过实战考验的 Apache Zookeeper 之上,可以轻松扩展和缩减。...Solr 在复制、分发、重新平衡和容错方面开箱即用。 灵活、适应性强,配置简单:Solr 旨在适应您的需求,同时简化配置 近实时索引:想立即查看您的更新吗?...Solr 利用 Lucene 的近实时索引功能来确保您在需要时看到内容 可扩展插件架构:Solr 发布了许多定义良好的扩展点,可以轻松插入索引和查询时间插件。

1.1K30

solr

Solr vs Lucene Solr与Lucene 并不是竞争对立关系,恰恰相反Solr 依存于Lucene,因为Solr底层的核心技术是使用Lucene 来实现的,Solr和Lucene的本质区别有以下三点...所以说,一句话概括 Solr: Solr是Lucene面向企业搜索应用的扩展。 Solr与Lucene架构图: ? Solr使用Lucene并且扩展了它!...4.2下载Solr 本文针对Solr4.2版本进行调研的,下文介绍内容均针对Solr4.2版本,如与Solr 最新版本有出入请以官方网站内容为准。...4.4配置并运行Solr代码 不管用什么IDE首选都要设置Solr Home在IDE的JVM参数设置VM arguments写入 -Dsolr.solr.home=solr/example/solr一般就行了...System.setProperty(“solr.solr.home”, “E:\\Work\\solr-4.2.0-src-idea\\solr\\example\\solr”); 目前是使用自带的一个

11K20

solr字段说明】Solr查询详解

这节重点是讲Solr的查询相关的知识点 一、 查询参数说明 在做solr查询的时候,solr提供了很多参数来扩展它自身的强大功能!以下是使用频率最高的一些参数! ...hl.simple.pre 高亮前面的格式  hl.simple.post 高亮后面的格式  facet 是否启动统计  facet.field 统计field  【注:以上是比较常用的参数,当然具体的参数使用还是多看Solr...官方的技术文档以及一些大神的博文日志,这里只是抛砖引玉】 二、 Solr运算符 1. “:” 指定字段查指定值,如返回所有值*:* 2. “?”...china AND +AB:america或+AB:china +AB:america   总而言之,查询语法:  修饰符 字段名:查询关键词 AND/OR/NOT 修饰符 字段名:查询关键词 三、 Solr

2K30

Solr示例

Solr是在lucene基础上封装得更易于使用的全文检索服务器并提供了相关api。 本文使用solr3.4,做一个使用示例,已调试通过。更高版本可能需要更改代码。 1.启动solr。...解开solr压缩包后,在solr_home\dist下有个war包。一种方式是把这个war包部署到web容器里。我这里图省事,就直接用自带的jetty。...此时,访问http://localhost:8983/solr应该是有响应了。 2.向solr里输入数据。一种方式就是使用api(见后面代码),还有一种方式是用命令行对一些磁盘文件进行索引。...org.apache.solr.client.solrj.impl.*; import org.apache.solr.client.solrj.response.*; import org.apache.solr.common...下安装使用Solr http://www.linuxidc.com/Linux/2012-10/72029.htm 在 Ubuntu 12.04 LTS 上通过 Tomcat 部署 Solr 4 http

84610

Solr使用——使用Docker进行快速安装Solr

Solr使用——使用Docker进行快速安装Solr 背景 日常我们开发时,我们会遇到各种各样的奇奇怪怪的问题(踩坑o(╯□╰)o),这个常见问题系列就是我日常遇到的一些问题的记录文章系列,这里整理汇总后分享给大家...开发环境 系统:Ubuntu20.04 虚拟机 环境:Docker 内容 最近正在研究Solr,特此进行整理出来学习过程,便于大家一起来学习使用。话不多说,下面我们开始进行安装Solr。...1、从Solr官网找到了容器安装的方式,点击一下进入Docker Hub中进行查看一下基本信息。...2、拉取一下镜像 docker pull solr 3、进行运行一下容器并映射出来端口号,访问试试。...docker run -p 8983:8983 -t solr 注:直接运行Docker也会从配置好的镜像仓库中查找需要的镜像,我还是更习惯于先拉取镜像下来~~~ 到这里我们进行访问一下,发现已经可以正常访问管理页面了

1.6K10

solr install

一、solr简介:      Solr是一个独立的企业及搜索应用服务器,它对外提供类似于Web-service的API接口。...Tomcat:apache-tomcat-7.0.73             solrsolr-4.10.3     2、solr目录介绍:下载solr加压后的目录结构如图所示 image.png...doc:solr的文档       example:solr官方提供的一些示例程序,简要介绍几个示例                 solr:该目录是一个包含了默认配置信息的Solr的Core目录                ...       licenses:solr相关的一些许可信息 3、创建solr工程        ① 创建solr文件夹,在solr文件夹下创建solrHome文件夹,solrHome是solr运行的主目录...4)solr工程部署到Tomcat上       ①将solr-4.10.3\dist下的solr-4.10.3.war复制到Tomcat的webapp目录下,并改名为solr.war       ②启动

89020

Nutch2.1+Hbase+Solr快速搭建一个爬虫和搜索引擎(快速,基本2小时内搞定)

说明:这种方式是为了快速体验或者数据量较小的情况,不适合数据量大的生产环境 环境准备: Centos7 Nutch2.2.1 JAVA1.8 ant1.9.14 hbase0.90.4 (单机版) solr7.7...单机版 下载解压 wget http://archive.apache.org/dist/hbase/hbase-0.90.4/hbase-0.90.4.tar.gz tar zxf hbase...,默认值是/tmp/hbase-${user.name}/hbasehbase.zookeeper.property.dataDir目录是用来存放zookeeper(HBase内置了zookeeper.../bin/start-hbase.sh solr安装配置 下载安装 wget https://mirrors.cnnic.cn/apache/lucene/solr/7.7.2/solr-.../bin/crawl ~/urls/ jkj http://192.168.1.61:8983/solr/jkj_core 2 ~/urls/ 是我存储抓取文件的目录 jkj 是我指定的存储在在hbase

1.2K20
领券