首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Solr实现全文搜索

1.1 Solr是什么? Solr 是Apache下的一个顶级开源项目,采用Java开发,它是基于Lucene的全文搜索服务器。...Solr提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展,并对索引、搜索性能进行了优化。 Solr是一个全文检索服务器,只需要进行配置就可以实现全文检索服务。...1.2 Solr的安装及配置 Solr的版本:4.10.3 1.2.1 安装步骤 需要把solr服务器安装到linux环境: 第一步:安装linux、jdk、tomcat。...并改名为solr.war [root@bogon dist]# cp solr-4.10.3.war /usr/local/solr/tomcat/webapps/solr.war 第四步:解压war包...跳转到文档末尾:G   1.2.2.2 业务字段配置 业务字段判断标准: 1、在搜索时是否需要在此字段上进行搜索

87610

Solr搜索问题笔记(一)

因为基本类型,在类实例化时候,是会初始化赋值的,这样一来,无论你添加的某条数据(Document)里,有没有这个field,那么它都会生成一个值为初始化的field,这样以来,在排序时候就可能会出现问题...,比如按照某个成立日期升序,有些记录里的没有这个字的,而你又用了基本类型,那么添加到索引里面,就会出现一个成立日期为0的数据,这样以来,排序自然就排到了第一位,所以需要根据业务,进行适当调整。...对应到solr里面,支持String,Boolean,int,double,float,long类型缺失字段,排序方式,配置示例如下: Java代码 <!...):如何在linux终端,执行curl命令清空某个core索引: Java代码 curl http://localhost:8983/solr/corename/update?

85840
您找到你想要的搜索结果了吗?
是的
没有找到

Solr搜索服务的搭建(Liunx)

Solr 搜索服务的搭建 总结一下solr 搜索服务的搭建 环境准备 需要JDK1.5以上版本,最新版的solr已经内置了tomcat ,无需准备可直接运行 Liunx 环境(这里我选用的是Centos6.5...) Solr搭建 第一步 下载solr solr下载地址 第二步 解压 tar -zxvf solr-6.4.1.tgz 第三步 在/usr/local/下创建 solr 目录 mkdir...solr 第四步 复制solr-6.4.1 目录下的内容到/usr/local/solr 下 cp -r solr-6.4.1/* /usr/local/solr 配置好的目录结构如下 ?...第五步、启动 solr (新版本的solr 可以直接启动,不用在单独准备tomcat) 首先进入 solr的bin目录 -p 为指定端口 默认为8983 start 为启动命令 restart...,如solr\server\solr\one_core 拷贝\server\solr\configsets\basic_configs\conf目录下的配置文件到自己的one_core目录 也就是在新建

81610

Solr搜索引擎 — 通过mysql配置数据

上一节我们已经通过两种方式运行了solr,本节演示怎么配置solr的mysql数据源 附上: 喵了个咪的博客:http://w-blog.cn Solr官网:http://lucene.apache.org.../solr/ > PS:8.0.0版本已经发布,本文使用此时较为稳定的7.7.1版本 一,准备数据数据表结构 CREATE TABLE `app` ( `id` int(11) NOT NULL...因为我们需要使用mysql作为数据源,我们需要增加对mysql使用的jar包 > cd server/solr-webapp/webapp/WEB-INF/lib/ > wget http:...query:查询数据库表符合记录数据 deltaQuery:增量索引查询主键ID 注意这个只能返回ID字段 deltaImportQuery:增量索引查询导入的数据 > vim server/solr...当然也可以通过请求URL的方式进行数据更新,这里也方便索引的更新和程序相结合 http://172.16.3.148:8983/solr/new_core/dataimport?

1.5K10

Solr学习笔记 - 关于近实时搜索

solr官方文档上看,有关solr搜索实时性的文章大概有: 关于updateHandler:UpdateHandlers in SolrConfig 关于近实时搜索:Near Real Time Searching... Commits 发送到Solr数据在提交到索引之前是不能搜索的。这样做的原因是,在一些情况下,提交比较慢,并且多个更新请求应该进行隔离,以避免覆盖数据。...因此,最好对何时提交数据进行控制。有几个选项可用于控制提交的时间。 commit and softCommit 在Solr中,提交是要求Solr“提交”那些更改到Lucene索引文件的操作。...完整的提交意味着,如果服务器崩溃,Solr将准确地知道数据存储的位置; soft commit 意味着存储了数据,但还没有存储位置信息。...当Solr被优雅地关闭时(使用bin/Solr stop命令),Solr将关闭tlog文件和索引段,因此在启动时不需要重播。 令人困惑的一点是事务日志中包含多少数据

4.5K10

利用Solr服务建立的站内搜索雏形---solr1

最近看完nutch后总感觉像好好捯饬下solr,上次看到老大给我展现了下站内搜索我便久久不能忘怀。...总觉着之前搭建的nutch配上solr还是有点呆板,在nutch爬取的时候就建立索引到solr服务下,然后在solr的管理界面中选择query,比如在q选项框中将“*:*”改写为“title:安徽”,则在管理界面中就能看到搜索结果...,可是这个与搜索引擎的感觉差远了,总感觉这些结果是被solr给套在他的管理界面中了,于是自己在网上搜索,也想整个站内搜索一样的东西,就算整不到那么炫,只要整到在solr的管理界面以外的地方出现搜索结果我就心满意足了...,多看看结合一下,于是自己开始动手拼接组装程序了: 1.在程序中(我的环境是在Myeclipse中)要能够与solr服务器通信,毕竟你的索引是存在solr中的,然后就是加入搜索条件和要搜索的字段,再者就是一个查询类以及最后的结果的呈现...虽然以上算不得什么搜索引擎,也没有任何界面的显示,但是我已很欣慰,因为都已经能搜索了,离我的小百度还远么(开玩笑的^_^)下一步准备先看看solrj具体是怎么应用的,每个部分都如何使用的摸索弄个搜索引擎的模样出来过过瘾

84680

搜索引擎solr和elasticsearch

它们都是通过从互联网上提取的各个网站的信息(以网页文字为主)而建立的数据库中,检索与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果返回给用户,因此他们是真正的搜索引擎。...从搜索结果来源的角度,全文搜索引擎又可细分为两种,一种是拥有自己的检索程序(Indexer),俗称“蜘蛛”(Spider)程序或“机器人”(Robot)程序,并自建网页数据库,搜索结果直接从自身的数据库中调用...,如上面提到的7家引擎;另一种则是租用其他引擎的数据库,并按自定的格式排列搜索结果,如Lycos引擎。...三、solr Solr是一个基于Lucene的Java搜索引擎服务器。Solr 提供了层面搜索、命中醒目显示并且支持多种输出格式(包括 XML/XSLT 和 JSON 格式)。...; Solr 支持更多格式的数据,而 Elasticsearch 仅支持json文件格式; Solr 官方提供的功能更多,而 Elasticsearch 本身更注重于核心功能,高级功能多有第三方插件提供

71630

搜索引擎】提高 Solr 性能

EBS 卷上的 IOPS 达到 100% 处理问题 分析 作为分析的一部分,我们提出了以下主题 Lucene 设置 Apache Solr 是一个广泛使用的搜索和排名引擎,经过深思熟虑并在后台使用...Solr 使用直接内存来缓存从磁盘读取的数据,主要是索引,以提高性能。 当它被暴露时,大部分堆内存被多个缓存使用。 JVM 堆大小需要与 Solr 堆需求估计相匹配,以及更多用于缓冲目的。...磁盘活动 — AWS IOPS 开始解决问题 搜索结果容错 为前端客户端提供搜索结果的第一个想法是始终让 Solr 副本仍然存在以响应查询,以防集群由于副本处于恢复甚至消失状态而变得不稳定。...Solr 7 引入了在领导者及其副本之间同步数据的新方法: NRT 副本:在 SolrCloud 中处理复制的旧方法。 TLOG replicas:它使用事务日志和二进制复制。...长话短说,NRT 副本可以执行三个最重要的任务,索引、搜索和引导。另一方面,TLOG 副本将以稍微不同的方式处理索引,搜索和引导。差异因素在于 PULL 副本,它只为带有搜索的查询提供服务。

65710

Solr搜索人名的小建议

搜索人名是我们在许多应用程序中经常用到的功能。比如对书店来说,按作者名检索的功能就相当重要。虽然很难起一个完美的名字,但是我们可以使用Solr的一些功能,使绝大多数英文名搜索达到绝佳的效果。...缩写形式 当用户搜索Doug Turnbull时,所有Solr已编索引得出的结果都是Douglas Turnbull怎么办?...另一方面,我们的相似搜索Solr提供了一些自由度,可以重新排列标记以满足匹配需要,从而给了自由组合的可能 - 所以会搜到许多重排和缩写的人名。...路还很长 这是一个很好的开始,但搜索是一条改进空间巨大的探索之路。要让这个搜索系统无懈可击,还有很多工作要做。除了我所违反的文化习惯之外,还有很多问题留给读者: 来Solr培训解决这些问题!...所以,在你的Solr之旅中还有一些有趣的谜题!如果你想要解决这些问题,一定要查看我们的Solr培训! 来分享您的意见吧!希望这篇文章能帮助你开始建立一个合理的人名搜索系统。您过去是否遇到过此类问题?

2.6K120

全文搜索,ElasticSearch和Solr哪个更好用?

原文链接www.cnblogs.com/jajian/p/9801154.html 前言 最近项目组安排了一个任务,项目中用到了基于 Solr 的全文搜索,但是该 Solr 搜索云项目不稳定,经常查询不出来数据...所以考虑开发一个适配层,如果 Solr 搜索出问题,自动切换到新的搜索 ES。其实可以通过 Solr 集群或者服务容错等设计来解决该问题。...根据两种数据分类,搜索也相应的分为两种:结构化数据搜索和非结构化数据搜索。...我们主要从以下几个原因分析: 数据类型 全文索引搜索支持非结构化数据搜索,可以更好地快速搜索大量存在的任何单词或单词组的非结构化文本。...对高度相关的搜索结果有特殊需求,但是没有可用的关系数据库可以满足。 对不同记录类型、非文本数据操作或安全事务处理的需求相对较少的情况。 Lucene,Solr,ElasticSearch ?

1.7K20

全文搜索引擎 Elasticsearch 还是 Solr

最近项目组安排了一个任务,项目中用到了基于 Solr 的全文搜索,但是该 Solr 搜索云项目不稳定,经常查询不出来数据,需要手动全量同步。...所以考虑开发一个适配层,如果 Solr 搜索出问题,自动切换到新的搜索 ES。其实可以通过 Solr 集群或者服务容错等设计来解决该问题。...根据两种数据分类,搜索也相应的分为两种:结构化数据搜索和非结构化数据搜索。...我们主要从以下几个原因分析: 数据类型 全文索引搜索支持非结构化数据搜索,可以更好地快速搜索大量存在的任何单词或单词组的非结构化文本。...对高度相关的搜索结果有特殊需求,但是没有可用的关系数据库可以满足。 对不同记录类型、非文本数据操作或安全事务处理的需求相对较少的情况。 Lucene,Solr,ElasticSearch ?

1.2K20

分布式--solr搜索引擎

一、简介 搜索是项目中常用的功能,对于大数据量的搜索,查询关系型数据库是非常低效的,好在有三方专门用于搜索的工具,常用的搜索解决方案为: 基于Apache Lucene实现 基于百度API实现 基于谷歌...处理完后返回数据 反向索引 搜索使用反向索引将大大提高搜索效率,正向索引与反向索引的区别如下: 正向索引:将查找内容分词,后根据分词完的词组,挨个进行搜索: 反向索引:内容存入数据源的同时进行分词,搜索时直接根据词组搜索...: solr搜索原理 solr就是利用了反向索引,将搜索内容分词后,直接和存储内容的索引进行匹配: solr拥有自己的数据库,以Document作存储 二、solr安装 前面提到过solr是Java...solr中,使用的是solr的dataimport,将dept部门表数据导入,SQL的创建在MyBatis--初入MyBatis中可以找到 1....重启solr并导入数据 cd /usr/local/solr-8.11.2/ ./solr stop -all .

70720

搜索引擎选择 Elasticsearch与Solr

一、Elasticsearch简介 Elasticsearch是一个实时的分布式搜索和分析引擎。它可以帮助你用前所未有的速度去处理大规模数据。...其主要功能包括全文检索、命中标示、分面搜索、动态聚类、数据库集成,以及富文本(如Word、PDF)的处理。Solr是高度可扩展的,并提供了分布式搜索和索引复制。...三、Elasticsearch与Solr的比较 当单纯的对已有数据进行搜索时,Solr更快。...随着数据量的增加,Solr搜索效率会变得更低,而Elasticsearch却没有明显的变化。...支持更多格式的数据,而 Elasticsearch 仅支持json文件格式; Solr 官方提供的功能更多,而 Elasticsearch 本身更注重于核心功能,高级功能多有第三方插件提供; Solr

86210

搜索引擎选 ElasticSearch 还是 Solr

最近项目组安排了一个任务,项目中用到了基于 Solr 的全文搜索,但是Solr 搜索云项目不稳定,经常查询不出来数据,需要手动全量同步。...所以考虑开发一个适配层,如果 Solr 搜索出问题,自动切换到新的搜索 ES。其实可以通过 Solr 集群或者服务容错等设计来解决该问题。...根据两种数据分类,搜索也相应的分为两种:结构化数据搜索和非结构化数据搜索。...我们主要从以下几个原因分析: 数据类型 全文索引搜索支持非结构化数据搜索,可以更好地快速搜索大量存在的任何单词或单词组的非结构化文本。...5、对高度相关的搜索结果有特殊需求,但是没有可用的关系数据库可以满足。 6、对不同记录类型、非文本数据操作或安全事务处理的需求相对较少的情况。 Lucene,Solr,ElasticSearch ?

1.1K40

使用Solr涡轮增压您的WordPress搜索

Solr Path:将此值设置/solr/collection1为默认的Solr核心。Solr服务器可以运行多个Solr核心,每个核心服务于一组不同的搜索数据。...它应该在这些附件中显示匹配项: 搜索数据的位置 搜索引擎数据存储在/opt/solr-4.10.4/example/solr/collection1/data目录中。...备份或还原搜索数据 如果您的服务器有数据备份过程,则可以通过/opt/solr-4.10.4/example/solr/collection1/data在备份中包含该目录来备份搜索数据。...搜索数据的备份并不重要,因为它总是可以从WordPress数据库重新创建。但是,对于包含数千个帖子和附件的大型博客,备份和恢复搜索数据将比重新创建它快得多。...迁移或合并后,转到位于管理面板的WPSOLR插件部分的Solr操作选项,然后按下使用我的Solr索引同步Wordpress以重新创建搜索数据

4.9K60

全文搜索引擎选 ElasticSearch 还是 Solr

Elasticsearch vs Solr 的选择 总结 ---- 最近项目组安排了一个任务,项目中用到了基于 Solr 的全文搜索,但是该 Solr 搜索云项目不稳定,经常查询不出来数据,需要手动全量同步...所以考虑开发一个适配层,如果 Solr 搜索出问题,自动切换到新的搜索 ES。其实可以通过 Solr 集群或者服务容错等设计来解决该问题。...根据两种数据分类,搜索也相应的分为两种:结构化数据搜索和非结构化数据搜索。...我们主要从以下几个原因分析: 数据类型 全文索引搜索支持非结构化数据搜索,可以更好地快速搜索大量存在的任何单词或单词组的非结构化文本。...对高度相关的搜索结果有特殊需求,但是没有可用的关系数据库可以满足。 对不同记录类型、非文本数据操作或安全事务处理的需求相对较少的情况。 Lucene,Solr,ElasticSearch ?

1.1K10
领券