前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >solr系列--索引库存储在hdfs中

solr系列--索引库存储在hdfs中

作者头像
Dlimeng
发布2023-06-29 14:07:13
1370
发布2023-06-29 14:07:13
举报
文章被收录于专栏:开源心路开源心路

软件准备:

1.Tomcat

2.solr-5.2.1.tgz

3.hadoop-2.7.2

运行环境

centos7

看以前文档hadoop安装好

在hadoop-2.7.2/etc/hadoop下的hdfs-site.xml增加了以下内容

<property>

<name>dfs.webhdfs.enabled</name>

<value>true</value>

</property>

<property>

<name>dfs.permissions.enabled</name>

<value>false</value>

</property>

WebHDFS观念是基于HTTP操作,比如GET、PUT、POST和DELETE,引入Rest接口

REST http的格式为:

http://<HOST>:<HTTP_PORT>/webhdfs/v1/<PATH>? [user.name=<USER>&]op=..

安装solr(看以前文档)

修改solrhome文件夹中tika/conf 下的solrconfig.xml

替换原有directoryFactory配置为如下

<directoryFactory name="DirectoryFactory" class="solr.HdfsDirectoryFactory">

<str name="solr.hdfs.home">hdfs://172.xx.xx.xx:9000/solr/tika</str>

<bool name="solr.hdfs.blockcache.enabled">true</bool>

<int name="solr.hdfs.blockcache.slab.count">1</int>

<bool name="solr.hdfs.blockcache.direct.memory.allocation">true</bool>

<int name="solr.hdfs.blockcache.blocksperbank">16384</int>

<bool name="solr.hdfs.blockcache.read.enabled">true</bool>

<bool name="solr.hdfs.blockcache.write.enabled">true</bool>

<bool name="solr.hdfs.nrtcachingdirectory.enable">true</bool>

<int name="solr.hdfs.nrtcachingdirectory.maxmergesizemb">16</int>

<int name="solr.hdfs.nrtcachingdirectory.maxcachedmb">192</int>

</directoryFactory>

注:solr.hdfs.home 为你所安装的Hadoop的HDFS的访问路劲

替换原有lockType为如下:

<lockType>${solr.lock.type:hdfs}</lockType>

替换dataDir

<dataDir>${solr.data.dir:hdfs://172.xx.xx.xxx:9000/solr/tika/data}</dataDir>

在/apache-tomcat7-solr/webapps/solr/WEB-INF/lib替换jar包:

rm hadoop-*.jar

rm protobuf-java-*.jar

rm -rf htrace-core-3.0.4.jar

在hadoop中share文件夹下分别得到

commons-collections-3.2.2.jar,hadoop-annotations-2.7.2.jar,hadoop-auth-2.7.2.jar,

hadoop-common-2.7.2.jar,hadoop-hdfs-2.7.2.jar,htrace-core-3.1.0-incubating.jar,

protobuf-java-2.5.0.jar

复制到/apache-tomcat7-solr/webapps/solr/WEB-INF/lib中

启动tomcat,即可访问solr

http://172.xxx.xx.xxx:28080/solr/

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2017-06-06,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
对象存储
对象存储(Cloud Object Storage,COS)是由腾讯云推出的无目录层次结构、无数据格式限制,可容纳海量数据且支持 HTTP/HTTPS 协议访问的分布式存储服务。腾讯云 COS 的存储桶空间无容量上限,无需分区管理,适用于 CDN 数据分发、数据万象处理或大数据计算与分析的数据湖等多种场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档