专栏首页YG小书屋Query Auto Completion自动完成查询(一)

Query Auto Completion自动完成查询(一)

当我们用搜索引擎或其他工具搜索内容时,输入框下方的提示内容会根据你的输入进行调整展示。这个过程我们称之为Query Auto Completion(QAC)。用户不完整的输入我们称之为Query Prefix,提示的那些内容我们称之为Query Completions。

图1 检索系统

为什么要做QAC?

1、用户很多时候有一个想法,不清楚如何表达。QAC可以帮助用户确切地具体化查询。 2、减少用户的键盘输入。据统计显示,QAC帮助用户平均减少50%的输入。 3、在找到查询目标之前,如果没有QAC,用户可能需要多次查询。QAC可以减少用户搜索的次数,相应地减轻了服务器的压力。

QAC架构

图2 QAC架构

图二展示了QAC的基本架构。用户输入一个查询前缀,系统根据查询前缀从查询日志中找出满足条件的query completions,然后根据一些特征进行排序,并将结果返回给用户。

图3 QAC处理流程

具体化服务器处理的QAC流程如图3表示。服务器首先根据前缀和基本的排序器粗略排序取出Query list 1,然后再根据一些特征和算法排序器取出满足需求的Query list 2返回给用户。

QAC 分类

根据算法使用的特征多少,我们将QAC分为启发式模型和基于学习的模型。 启发式模型:通过直接利用满足匹配的query内容计算得分。因为直接利用query进行计算,所以特征会很少。 基于学习的模型:通过学习算法提取出大量的特征计算得分。学习算法通过训练提取出大量合理的特征。

两类模型主要在re-ranker阶段起作用。因此我们的QAC模型可看作为一个re-ranker。而re-ranker所需的特征可分为时间相关的特征和以用户为中心的特征。时间相关的特征是说一些查询会随着时间的变化变化。比如说”新年“会在每年过年时又很多查询,而其他时间段查询较少。以用户为中心的特征就是用户相关的特征,比如说用户历史查询,用户的个人信息(年龄、性别等)。

后面将会分别讲述两种模型基于不同维度的算法信息。上述信息主要来自与论文[1]。

[1] Cai F, De Rijke M. A survey of query auto completion in information retrieval[J]. Foundations and Trends® in Information Retrieval, 2016, 10(4): 273-363.

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • ES 深度分页scroll使用方式

    YG
  • Nginx限流

    YG
  • 简单二层神经网络介绍

    YG
  • 用户画像全解析 | 都在说用户画像,你真的了解透了吗?

    在互联网逐渐步入大数据时代后,不可避免的给企业及消费者行为带来一系列改变与重塑。其中最大的变化莫过于,消费者的一切行为在企业面前似乎都将是“可视化”的。随着大数...

    华章科技
  • 干货 | 数据分析在携程产品设计中的应用

    林传毅,携程旅行网资深交互设计,负责酒店产品和客栈通(www.kztpms.com)的整体设计。先后毕业于复旦大学计算机系和香港大学商学院,曾就职解放日报和柯达...

    携程技术
  • pandas:由列层次化索引延伸的一些思考

    用pandas利用df.groupby.agg() 做聚合运算时遇到一个问题:产生了列方向上的两级索引,且需要删除一级索引。具体代码如下:

    Bo_hemian
  • 微分享回放 | 数据分析在携程产品设计中的应用

    【携程技术微分享】是携程技术中心推出的线上公开分享课程,每月1-2期,采用目前最火热的直播形式,邀请携程技术人,面向广大程序猿和技术爱好者,一起探讨最新的技术热...

    携程技术
  • Linux I/O 原理和 Zero-copy 技术全面揭秘

    如今的网络应用早已从 CPU 密集型转向了 I/O 密集型,网络服务器大多是基于 C-S 模型,也即 客户端 - 服务端 模型,客户端需要和服务端进行大量的网络...

    潘少
  • 小白学推荐1 | 协同过滤 零基础到入门

    协同过滤推荐算法是诞生最早,最为基础的推荐算法。 算法通过对用户历史行为数据的挖掘发现用户的偏好,基于不同的偏好对用户进行群组划分并推荐品味相似的商品。

    机器学习炼丹术
  • CentOS6.9下升级默认的OpenSSH操作记录(升级到OpenSSH_7.6p1)

    近期对IDC机房服务器做了一次安全漏洞扫描,漏扫结果显示服务器的OpenSSH版本太低(CentOS6默认是OpenSSH_5.3p1),存在漏洞隐患,安全部门...

    洗尽了浮华

扫码关注云+社区

领取腾讯云代金券