前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >如何实现Solr自定义评分查询

如何实现Solr自定义评分查询

作者头像
我是攻城师
发布2018-05-14 16:35:24
1.7K0
发布2018-05-14 16:35:24
举报
文章被收录于专栏:我是攻城师

(一)背景介绍 大多数时候我们使用lucene/solr/elasticsearch自带的评分查询都是没问题的,当然这也仅仅限于简单的业务或者对搜索排名 不敏感的场景中,假设业务方要求有若干业务因子要干扰到排名,同时还不能放弃框架本身的文本相似度评分,那么应该怎么做呢? 这种场景尤其是在电商类的一些垂直搜索中体现比较明显,比如,新商品加分,口碑好的加分,图片清晰的加分,商品介绍详细的加分,大促的商品加分等等等等,那么如何把众多的业务因素加到的总的评分里面? (二)实现策略 (1)在索引的时候把众多的业务评分计算提前计算好,存储成一个字段,然后查询的时候根据这个字段排名。 评价:比较简单暴力,适合加权固定,不经常改变评分因素的业务使用,查询性能最高 ,更新,改变,调试评分比较麻烦 (2)在索引的时候把众多的业务评分因子都索引成一个字段,在查询的时候动态获取各个字段评分计算后,加入总的评分从而影响最终的排名。 评价:对动态更改评分支持比较好,查询性能稍差 (3)对于业务的评分因素,动静分离,静态评分因子长期不变的,就全部计算完存储成一个字段,动态的也存储若干字段,最终的评分由静态业务评分+动态业务评分+相似度评分综合得出,从而影响最终的排名。 评价:合理规划评分因素,动静分离,算是业务与技术的一个折中 有关lucene的自定义评分组件,可以参考以前的文章: http://qindongliang.iteye.com/blog/2008672 下面来简述下如何在solr中,实现开发自定义评分组件,solr基于lucene,总体来说 与lucene大同小异,需要自己开发几个包装的类即可,在elasticsearch中也是如此,后面有机会,再探讨在elasticsearch中自定义评分的实现 (三)实现方式 (A)通过重写QueryParser实现 1,继承CustomScoreProvider类,重写customScore方法,从DocValues中动态读取评分有关因子,计算后,影响总评分 2,继承CustomScoreQuery类,重写getCustomScoreProvider方法,需要用到1,返回自定义的CustomScoreProvider类 到此,在lucene中就完事了,但是在solr中我们还需要继续 3,继承QParser类,重写parse方法,需要用到2,并在构造方法中,完成一些必须的初始化操作 4,继承QParserPlugin类,重写createParser方法,需要用到3,至此,代码完成 打包项目成一个jar,拷贝至server\solr-webapp\webapp\WEB-INF\lib中 5,在solrconfig.xml中,注册我们写的插件: Java代码

  1. <queryParser name="myqp" class="com.easy.custom.queryparser.MyQueryParserPlugin">
  2. <lst name="words">
  3. <str name="word">easy_money</str>
  4. <str name="word">easy_count</str>
  5. <str name="word">easy_test</str>
  6. </lst>
  7. </queryParser>

6, 重启solr,或者reload指定的core 7,打开solr的ui页面,指定defType,测试搜索,如果log不报错,就证明使用成功了

(B)通过Function Query实现 函数查询一项强大的功能,solr已经自带了 许多的函数,比如数学函数,聚合函数等,详细资料可看官网的wiki资料 https://cwiki.apache.org/confluence/display/solr/Function+Queries 1,继承ValueSource类,重写getValues方法,并在返回的方法中,完成评分计算逻辑 2,继承ValueSourceParser类,并重写parser方法,返回1定义的类, 建议在parser方法里面,获取ValueSource然后传入自定义的ValueSource类里面复用, 不建议直接从DocValues里面读取,因为基于这个IndexSearch的打开的ValueSource耗费资源更少。至此,代码完成打包项目成一个jar,拷贝至server\solr-webapp\webapp\WEB-INF\lib中 3,在solrconfig.xml中,注册我们的组件:

Java代码

  1. //此处,也可也定义需要传入的参数
  2. <valueSourceParser name="myfunc" class="com.easy.custom.function.MyValueParser" />

4,打开solr的ui页面进行查询,不报错的话,即查询成功,可以看到和我们第一种方式的结果是一致的

(四)总结 其实核心功能还是使用lucene实现的,solr/es则是在lucene的基础上提供了强大灵活的插件机制,这样以来,我们就能更容易实现一些我们特殊需求的定制化。 全部代码,已经放在github上: https://github.com/qindongliang/solr-custom-score

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2016-05-12,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 我是攻城师 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
对象存储
对象存储(Cloud Object Storage,COS)是由腾讯云推出的无目录层次结构、无数据格式限制,可容纳海量数据且支持 HTTP/HTTPS 协议访问的分布式存储服务。腾讯云 COS 的存储桶空间无容量上限,无需分区管理,适用于 CDN 数据分发、数据万象处理或大数据计算与分析的数据湖等多种场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档