简读分享 | 龙文韬 编辑 | 李仲深
论文题目
Scalar is Not Enough: Vectorization-based Unbiased Learning to Rank
论文摘要
无偏差学习排名 (ULTR) 旨在从有偏差的用户点击日志中训练无偏差的排名模型。当前的大多数ULTR方法都基于检验假设(EH),假设点击概率可以被分解成两个标量函数,一个与排名特征有关,另一个与偏差因素有关。不幸的是,在实践中特征、偏差因素和点击之间的相互作用很复杂,通常无法以这种独立的方式分解。使用 EH 拟合点击数据可能会导致模型错误并带来近似误差。
本文提出了一种基于向量的EH,并将点击概率表述为两个向量函数的点乘。此解决方案是完备的,因为它在拟合任意点击函数方面具有通用性。在此基础上,作者提出了一个名为Vectorization的新模型,以自适应地学习相关性嵌入,并通过将嵌入投射到一个基础矢量上对文档进行排序。大量实验表明,作者的方法在复杂的真实点击和简单的模拟点击方面明显优于最先进的ULTR方法。
论文链接
https://doi.org/10.1145/3534678.3539468