首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Solr搜索问题笔记(一)

笔记三个小问题: (1):使用solrj添加索引时,主要有两种方法, 第一种是直接使用solrinputDoucument的方法添加。...当使用第二种时,需要注意一个问题,如果一个对象里,有基本类型int,float,long,double等,那么建议使用其包装类型,why?...因为基本类型,在类实例化时候,是会初始化赋值的,这样一来,无论你添加的某条数据(Document)里,有没有这个field,那么它都会生成一个值为初始化的field,这样以来,在排序时候就可能会出现问题...对应到solr里面,支持String,Boolean,int,double,float,long类型缺失字段,排序方式,配置示例如下: Java代码 <!...):如何在linux终端,执行curl命令清空某个core索引: Java代码 curl http://localhost:8983/solr/corename/update?

84040
您找到你想要的搜索结果了吗?
是的
没有找到

Solr实现全文搜索

1.1 Solr是什么? Solr 是Apache下的一个顶级开源项目,采用Java开发,它是基于Lucene的全文搜索服务器。...Solr提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展,并对索引、搜索性能进行了优化。 Solr是一个全文检索服务器,只需要进行配置就可以实现全文检索服务。...1.2 Solr的安装及配置 Solr的版本:4.10.3 1.2.1 安装步骤 需要把solr服务器安装到linux环境: 第一步:安装linux、jdk、tomcat。...并改名为solr.war [root@bogon dist]# cp solr-4.10.3.war /usr/local/solr/tomcat/webapps/solr.war 第四步:解压war包...跳转到文档末尾:G   1.2.2.2 业务字段配置 业务字段判断标准: 1、在搜索时是否需要在此字段上进行搜索

85710

搜索引擎】Apache Solr 神经搜索

Apache Solr 中神经搜索的第一个里程碑。...近似最近邻搜索算法返回结果,其与查询向量的距离最多为从查询向量到其最近向量的距离的 c 倍。 这种方法的好处是,在大多数情况下,近似最近邻几乎与精确最近邻一样好。...Apache Solr 实现 可从 Apache Solr 9.0 获得 预计 2022 年第一季度 这第一个贡献允许索引单值密集向量场并使用近似距离函数搜索 K-最近邻。...对非单位长度的向量使用点积可能会导致错误或搜索结果不佳。 余弦:余弦相似度。注意:执行余弦相似度的首选方法是将所有向量归一化为单位长度,而不是使用 DOT_PRODUCT。...最终排序的结果列表将第一次通过分数(主查询 q)加上第二次通过分数(到要搜索的目标向量的近似相似度函数距离)乘以乘法因子(reRankWeight)。

96910

Solr搜索服务的搭建(Liunx)

Solr 搜索服务的搭建 总结一下solr 搜索服务的搭建 环境准备 需要JDK1.5以上版本,最新版的solr已经内置了tomcat ,无需准备可直接运行 Liunx 环境(这里我选用的是Centos6.5...) Solr搭建 第一步 下载solr solr下载地址 第二步 解压 tar -zxvf solr-6.4.1.tgz 第三步 在/usr/local/下创建 solr 目录 mkdir...solr 第四步 复制solr-6.4.1 目录下的内容到/usr/local/solr 下 cp -r solr-6.4.1/* /usr/local/solr 配置好的目录结构如下 ?...第五步、启动 solr (新版本的solr 可以直接启动,不用在单独准备tomcat) 首先进入 solr的bin目录 -p 为指定端口 默认为8983 start 为启动命令 restart.../server/solr/one_core1’ 问题分析 此错误为创建core 时没有提前创建号目录 解决方案 在提示目录下创建 目录即可 mkdir -p /usr/local/solr/server

80610

Solr学习笔记 - 关于近实时搜索

solr官方文档上看,有关solr搜索实时性的文章大概有: 关于updateHandler:UpdateHandlers in SolrConfig 关于近实时搜索:Near Real Time Searching... Commits 发送到Solr的数据在提交到索引之前是不能搜索的。这样做的原因是,在一些情况下,提交比较慢,并且多个更新请求应该进行隔离,以避免覆盖数据。...hard commit还可以选择性地使文档在搜索中可见,但是不建议在NRT搜索中这样做,因为它比soft commit的开销更大。...autoCommit (openSearcher=false)和autoSoftCommit的选择有不同的结果。...autoSoftCommit所选择的时间决定了文档发送到Solr之后,在它变为可搜索且不影响事务日志之前的最长时间。

4.5K10

利用Solr服务建立的站内搜索雏形---solr1

最近看完nutch后总感觉像好好捯饬下solr,上次看到老大给我展现了下站内搜索我便久久不能忘怀。...总觉着之前搭建的nutch配上solr还是有点呆板,在nutch爬取的时候就建立索引到solr服务下,然后在solr的管理界面中选择query,比如在q选项框中将“*:*”改写为“title:安徽”,则在管理界面中就能看到搜索结果...,可是这个与搜索引擎的感觉差远了,总感觉这些结果是被solr给套在他的管理界面中了,于是自己在网上搜索,也想整个站内搜索一样的东西,就算整不到那么炫,只要整到在solr的管理界面以外的地方出现搜索结果我就心满意足了...,多看看结合一下,于是自己开始动手拼接组装程序了: 1.在程序中(我的环境是在Myeclipse中)要能够与solr服务器通信,毕竟你的索引是存在solr中的,然后就是加入搜索条件和要搜索的字段,再者就是一个查询类以及最后的结果的呈现...Iterator it = docs.iterator();  while (it.hasNext()) {  System.out.println(it.next());  } 这段代码是接收相应的搜索结果以及遍历显示打印搜索结果

83580

搜索引擎】提高 Solr 性能

这是一个关于我们如何设法克服搜索和相关性堆栈的稳定性和性能问题的简短故事。 语境 在过去的 10 个月里,我很高兴与个性化和相关性团队合作。...EBS 卷上的 IOPS 达到 100% 处理问题 分析 作为分析的一部分,我们提出了以下主题 Lucene 设置 Apache Solr 是一个广泛使用的搜索和排名引擎,经过深思熟虑并在后台使用...磁盘活动 — AWS IOPS 开始解决问题 搜索结果容错 为前端客户端提供搜索结果的第一个想法是始终让 Solr 副本仍然存在以响应查询,以防集群由于副本处于恢复甚至消失状态而变得不稳定。...磁盘活动结果 我们在磁盘活动方面也取得了惊人的成果,索引也大幅下降。 外部服务结果 其中一项访问 Solr 的服务在 New Relic 中的响应时间和错误率显着下降。...为了缓解上述问题并考虑到前面描述的结果,我们决定开始逐渐减少节点和分片的数量,这对降低内部复制因子有影响。

63910

搜索引擎solr和elasticsearch

用户接口的作用是输入用户查询、显示查询结果、提供用户相关性反馈机制。...它们都是通过从互联网上提取的各个网站的信息(以网页文字为主)而建立的数据库中,检索与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果返回给用户,因此他们是真正的搜索引擎。...从搜索结果来源的角度,全文搜索引擎又可细分为两种,一种是拥有自己的检索程序(Indexer),俗称“蜘蛛”(Spider)程序或“机器人”(Robot)程序,并自建网页数据库,搜索结果直接从自身的数据库中调用...,如上面提到的7家引擎;另一种则是租用其他引擎的数据库,并按自定的格式排列搜索结果,如Lycos引擎。...三、solr Solr是一个基于Lucene的Java搜索引擎服务器。Solr 提供了层面搜索、命中醒目显示并且支持多种输出格式(包括 XML/XSLT 和 JSON 格式)。

70330

全文搜索,ElasticSearch和Solr哪个更好用?

而且它还是其他团队在维护,依赖性太强,导致 Solr 服务一出问题,我们的项目也基本瘫痪,因为所有的依赖查询都无结果数据了。...所以考虑开发一个适配层,如果 Solr 搜索问题,自动切换到新的搜索 ES。其实可以通过 Solr 集群或者服务容错等设计来解决该问题。...对高度相关的搜索结果有特殊需求,但是没有可用的关系数据库可以满足。 对不同记录类型、非文本数据操作或安全事务处理的需求相对较少的情况。 Lucene,Solr,ElasticSearch ?...强大,准确,高效的搜索算法: 排名搜索:首先返回最佳结果。 许多强大的查询类型:短语查询,通配符查询,邻近查询,范围查询等。 现场搜索(例如标题,作者,内容)。 按任何字段排序。...使用合并结果进行多索引搜索。 允许同时更新和搜索。 灵活的分面,突出显示,连接和结果分组。 快速,内存效率和错误容忍的建议。 可插拔排名模型,包括矢量空间模型和 Okapi BM25。

1.7K20

Solr搜索人名的小建议

如果我们能够解决两个主要问题,人名搜索问题就解决一大半了。 作者姓名重排,无论是在文档还是查询中,有些部分都被省略了:(Doug Turnbull, D. Turnbull, D. G....缩写形式 当用户搜索Doug Turnbull时,所有Solr已编索引得出的结果都是Douglas Turnbull怎么办?...路还很长 这是一个很好的开始,但搜索是一条改进空间巨大的探索之路。要让这个搜索系统无懈可击,还有很多工作要做。除了我所违反的文化习惯之外,还有很多问题留给读者: 来Solr培训解决这些问题!...所以,在你的Solr之旅中还有一些有趣的谜题!如果你想要解决这些问题,一定要查看我们的Solr培训! 来分享您的意见吧!希望这篇文章能帮助你开始建立一个合理的人名搜索系统。您过去是否遇到过此类问题?...您如何用Solr解决这些问题?请联系我们以获取问题帮助!

2.6K120

全文搜索引擎 Elasticsearch 还是 Solr

而且它还是其他团队在维护,依赖性太强,导致 Solr 服务一出问题,我们的项目也基本瘫痪,因为所有的依赖查询都无结果数据了。...所以考虑开发一个适配层,如果 Solr 搜索问题,自动切换到新的搜索 ES。其实可以通过 Solr 集群或者服务容错等设计来解决该问题。...对高度相关的搜索结果有特殊需求,但是没有可用的关系数据库可以满足。 对不同记录类型、非文本数据操作或安全事务处理的需求相对较少的情况。 Lucene,Solr,ElasticSearch ?...强大,准确,高效的搜索算法: 排名搜索:首先返回最佳结果。 许多强大的查询类型:短语查询,通配符查询,邻近查询,范围查询等。 现场搜索(例如标题,作者,内容)。 按任何字段排序。...使用合并结果进行多索引搜索。 允许同时更新和搜索。 灵活的分面,突出显示,连接和结果分组。 快速,内存效率和错误容忍的建议。 可插拔排名模型,包括矢量空间模型和 Okapi BM25。

1.2K20

分布式--solr搜索引擎

一、简介 搜索是项目中常用的功能,对于大数据量的搜索,查询关系型数据库是非常低效的,好在有三方专门用于搜索的工具,常用的搜索解决方案为: 基于Apache Lucene实现 基于百度API实现 基于谷歌...处理完后返回数据 反向索引 搜索使用反向索引将大大提高搜索效率,正向索引与反向索引的区别如下: 正向索引:将查找内容分词,后根据分词完的词组,挨个进行搜索: 反向索引:内容存入数据源的同时进行分词,搜索时直接根据词组搜索...: solr搜索原理 solr就是利用了反向索引,将搜索内容分词后,直接和存储内容的索引进行匹配: solr拥有自己的数据库,以Document作存储 二、solr安装 前面提到过solr是Java...重启solr cd /usr/local/solr-8.11.2/bin ./solr stop -all ....定义属性 name 属性名称 type 属性的类型 indexed 该属性是否建立索引,即可以通过分词的词组被查找 stored 该属性是否需要返回给搜索用户,并不是所有属性都要展示 required

69020

搜索引擎选 ElasticSearch 还是 Solr

而且它还是其他团队在维护,依赖性太强,导致 Solr 服务一出问题,我们的项目也基本瘫痪,因为所有的依赖查询都无结果数据了。...所以考虑开发一个适配层,如果 Solr 搜索问题,自动切换到新的搜索 ES。其实可以通过 Solr 集群或者服务容错等设计来解决该问题。...5、对高度相关的搜索结果有特殊需求,但是没有可用的关系数据库可以满足。 6、对不同记录类型、非文本数据操作或安全事务处理的需求相对较少的情况。 Lucene,Solr,ElasticSearch ?...强大,准确,高效的搜索算法: 1、排名搜索:首先返回最佳结果。 2、许多强大的查询类型:短语查询,通配符查询,邻近查询,范围查询等。 3、现场搜索(例如标题,作者,内容)。 4、按任何字段排序。...5、使用合并结果进行多索引搜索。 6、允许同时更新和搜索。 7、灵活的分面,突出显示,连接和结果分组。 8、快速,内存效率和错误容忍的建议。

1.1K40

使用Solr涡轮增压您的WordPress搜索

由于无法建议搜索短语,捕捉拼写错误,理解单词变体,组织和过滤结果以及索引搜索结果文档,因此WordPress内置的标准搜索无法为访问者提供最佳搜索体验。...索引注释:如果希望搜索结果包含注释,请选择此选项。这仅适用于评论为帖子增加一些价值且严格审核的博客。 排除项目:如果您希望从搜索结果中排除某些帖子或页面,请在此处输入其ID。 按“ 保存选项”按钮。...打开Solr选项>结果选项页面: 显示建议(您的意思是?):推荐。如果选中,Solr将建议备用搜索短语,如果找不到输入的搜索短语的任何匹配项: 显示结果数量和当前页面:推荐。...这对于分页搜索结果很有用。 替换默认的WordPress搜索:推荐。这将使用Solr替换默认WordPress搜索框以显示自动完成建议。 每页结果数:配置每页应显示的搜索结果数。...由构面显示的值的数量:构面是指Solr显示的过滤器,以使访问者能够从搜索结果中列出候选名单。此值是每个构面显示的最大值数。

4.9K60

搜索结果质量评估(上)

【废话少说—文章思路】 1.引言 如果说以前的传统报刊、搜索引擎、门户网站等媒介解决的是信息不对称的矛盾,那么现在我们面临的矛盾是信息过载的问题。...无疑,解决信息不对称这项工作意义非常巨大,通过传统纸质媒介走向互联网PC端的搜索途径,是用户对于获取大量数据的需求驱动的结果。...因此本文写作的目的是解析搜索结果质量评价中的算法逻辑并尝试提出指标的改进建议,希望能对搜索结果的质量评估工作有基本的认识,日后在实际工作中完善本研究,真正对算法优化有所贡献。 2....综合可穿越到各个分栏目搜索质量包含两方面,包括搜索结果的排序、搜索内容的质量问题。 4.搜索排序 用户在使用头条搜索功能时候,有较大的目的性。...因此选择排序时候要考虑用户搜索质量、搜索问题分类、时效性三个大类,每个类别有分类的指标,并做了解释,如下: 4.1搜索质量 (1)查全率:

3.7K52

处理solr时遇到的问题

前面的博客说了,我在解决solr索引的问题,但是后面我遇到的问题一次比一次严重,上次还能访问solr和系统,上次博客中看到我的solr上面有报错,那是我new_core出现的问题,我作死的在linux中删除了...new_core文件 GAME OVER solr崩了,因为我技术不深所以没找到正确的错误原因 当时我立即对solr和tomcat进行操作但是linux不允许任何操作,df -h查看发现solr...开始排查,最后发现现有版本的solr可能有些问题,于是我重装了solr并且重新配置了solr-tomcat,以下为教程:https://www.cnblogs.com/guxiong/p/6284938...在启动项目后我们访问solr遇到了404的问题,而上传方案却没有问题,检查后发现用的查询是query.setRequestHandler("/selectbyorder");而solr默认是/select...,如果要修改的话找一个solr自定义RequestHandler的教程,我这是修改为/select,然后测试查询没有问题,终于告一段落 因为各种原因,我只能在solr里加入这个查询,我搜索solr

58330
领券