专栏首页小鹏的专栏[solr] solr Similarity:切换不同相似度计算方法

[solr] solr Similarity:切换不同相似度计算方法

Similarity改变solr的打分机制;

solr本身已经提供了几种算法

org.apache.solr.search.similarities.BM25SimilarityFactory
org.apache.solr.search.similarities.DefaultSimilarityFactory
org.apache.solr.search.similarities.DFRSimilarityFactory
org.apache.solr.search.similarities.IBSimilarityFactory
org.apache.solr.search.similarities.LMDirichletSimilarityFactory
org.apache.solr.search.similarities.LMJelinekMercerSimilarityFactory
org.apache.solr.search.similarities.SchemaSimilarityFactory

可以在managed-schema下面添加:

<similarity class="org.apache.solr.search.similarities.SchemaSimilarityFactory"/>

<similarity class="org.apache.solr.search.similarities.BM25SimilarityFactory"/>

<similarity class="org.apache.solr.search.similarities.DefaultSimilarityFactory"/>

.....

测试会发现不同相似度计算方法检索上的差异:

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • Solr理论基础

    传统数据库是为了解决结构化存储而产生的,如关系型数据库、键值存储、操作磁盘文件的map-reduce(映射-规约)引擎,图引擎等。 传统型数据库的缺点:

    栋先生
  • Solr的schema.xml

    schema.xml是Solr一个配置文件,它包含了你的文档所有的字段,以及当文档被加入索引或查询字段时,这些字段是如何被处理的。这个文件被存储在Solr主文件...

    九州暮云
  • Solr:不止于文字

    Solr于2004年首次创建时,打算成为OpenSource文本搜索引擎,为企业网站和内部文档搜索等用途提供类似Google的搜索功能。 基于Lucene搜索库...

    人工智能资讯小编
  • SolrLucene优劣势分析

    摘要: 最早lucene2.4以及以前,追溯到2008年前后,lucene刚刚引起大家的关注,到后来Nutch、solr的出现,lucene变得更加热。Nutc...

    Java架构师历程
  • Java Web技术架构方案概述

    大型网站系统架构的演进都是随着业务增长不断演进,所有的出发点都是为了满足业务需求。最初访问量下,功能简单时,单体软件可以解决所有问题;后来访问量逐渐增大,功能愈...

    JunyouYH
  • solr

    Solr它是一种开放源码的、基于 Lucene Java 的搜索服务器,易于加入到 Web 应用程序中。Solr 提供了层面搜索(就是统计)、命中醒目显示并且支...

    Java架构师历程
  • Milvus x Lucidworks 快速构建语义检索

    语义检索 [1](Semantic Search) 是能帮助你的客户或员工找到正确的产品或信息的绝佳工具,它甚至可以检索到一些难以被索引的信息,从而获得更好的结...

    Zilliz RDS
  • 全文搜索引擎选ElasticSearch还是Solr?

    最近项目组安排了一个任务,项目中用到了全文搜索,基于全文搜索 Solr,但是该 Solr 搜索云项目不稳定,经常查询不出来数据,需要手动全量同步,而且是其他团队...

    Fayson
  • 全文搜索引擎选 ElasticSearch 还是 Solr?

    最近项目组安排了一个任务,项目中用到了基于 Solr 的全文搜索,但是该 Solr 搜索云项目不稳定,经常查询不出来数据,需要手动全量同步。

    芋道源码

扫码关注云+社区

领取腾讯云代金券