前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >solr初探-安装使用

solr初探-安装使用

原创
作者头像
kl博主
发布2018-04-13 18:36:16
1.1K0
发布2018-04-13 18:36:16
举报
文章被收录于专栏:kl的专栏kl的专栏
solr初探-安装使用
solr初探-安装使用

前言碎语

Solr是一个高性能,基于Lucene的全文搜索服务器。同时对其进行了扩展,提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展并对查询性能进行了优化,并且提供了一个完善的功能管理界面,和Elasticseach一样是一款非常优秀的全文搜索引擎

写此文的目的也是看网上诸多的安装使用教程都比较老了,步骤也比较繁琐,下面介绍的方法简单高效,适合新手摸索入门

solr安装

前提是已经有了java开发环境了,也就是安装jdk了

最新版下载地址:http://apache.fayea.com/lucene/solr/6.4.1/

如上图有两种方式可供选择:

1.下载src的源文件,solr是使用ant构建的,所以需要安装ant,自己构建,使用ant server启动项目

2.下载打包好的,文件比较大,解压缩好后,进入bin目录,使用./solr start启动项目,solr restart -p xxx重启,其他的自己solr -help查看

solr默认的配置在server\solr\下,默认端口8983,故而访问地址为:http://localhost:8983/solr/,如看到如下界面,恭喜你安装成功了

solr的基础使用-导入mysql数据测试

1.新增Core

solr的管理已Core为单元,配置文件以及索引文件都存放在Core里面,如下图,创建test的Core

注意的点:

  • 如图箭头所指的目录需要自己在solr-6.4.1\server\solr目录下创建,如solr-6.4.1\server\solr\new_coro
  • 拷贝solr-6.4.1\server\solr\configsets\basic_configs\conf目录下的配置文件到自己的Core目录,也就是新建的new_core
  • 在new_core目录新增一个文件夹conf,拷贝\solr-6.4.1\server\solr\configsets\basic_configs\conf\elevate.xml这个文件到此目录
  • 修改solrconfig.xml的${solr.data.dir:./kldata},为自己新建的索引目录

2.导入mysql的数据

(1)在solrconfig.xml文件中新增如下请求节点。

(2).在solrconfig.xml同层目录新增如上箭头所指文件,然后配置数据库链接相关,如下

箭头所指为你要同步过来的查询结果

更加详细的配置可参考如下地址:

官方wiki:https://cwiki.apache.org/confluence/display/solr/

csdn博客:http://blog.csdn.net/boolbo/article/details/50352331

注意的点:

  • 如果配置更新了,可以使用接口/command=reload-config来重新加载配置文件,如http://localhost:8983/solr/#/new_core/dataimport/command=reload-config

(3).配置 schema

数据库的列对应索引里的文档域field,所以要把你想同步的数据列结果的文档域创建好,以及文档域对应的类型fieldType

在第二步的第二点拷贝的配置文件中,找到managed-schema,这个文件没有后缀名,但是是文本文件,使用文本编辑器打开它,

清除里面的配置,配置自己的field,如下图

需要注意的点:

  • 需要分词的字段需要使用solr.TextField类型,并指明你的建立索引和查询时的分词器,如上定义的text_cn便使用了林良益大神的ik分词
  • ik的solr分词器项目地址:https://github.com/EugenePig/ik-analyzer-solr5

(4)移动需要的jar

  • 数据库驱动,已mysql为例,需要将mysql-connector-java-xxx.jar移动到\solr-6.4.1\server\solr-webapp\webapp\WEB-INF\lib目录
  • 数据处理的j,将solr-6.4.1\dist下的solr-dataimporthandler-6.4.1.jar和solr-dataimporthandler-extras-6.4.1.jar移动到同上移动目录
  • 分词器 ,将你使用的中文分词器的jar拷贝到如上移动目录

(5)导入数据测试

  • 箭头一:选中你的test的Core
  • 箭头二:数据导入的菜单
  • 箭头四:数据导入的结果
  • 箭头五:数据查询测试菜单

我的测试结果

ps:最后,如果你想测试你的分词器的分词效果,可参考如下

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
Elasticsearch Service
腾讯云 Elasticsearch Service(ES)是云端全托管海量数据检索分析服务,拥有高性能自研内核,集成X-Pack。ES 支持通过自治索引、存算分离、集群巡检等特性轻松管理集群,也支持免运维、自动弹性、按需使用的 Serverless 模式。使用 ES 您可以高效构建信息检索、日志分析、运维监控等服务,它独特的向量检索还可助您构建基于语义、图像的AI深度应用。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档