[KDD 2022 | 论文简读] 标量是不够的：基于矢量化的无偏差学习排名

智能生信

发布于 2022-12-29 17:18:17

3630

发布于 2022-12-29 17:18:17

文章被收录于专栏：智能生信

简读分享 | 龙文韬编辑 | 李仲深

论文题目

Scalar is Not Enough: Vectorization-based Unbiased Learning to Rank

论文摘要

无偏差学习排名（ULTR）旨在从有偏差的用户点击日志中训练无偏差的排名模型。当前的大多数ULTR方法都基于检验假设（EH），假设点击概率可以被分解成两个标量函数，一个与排名特征有关，另一个与偏差因素有关。不幸的是，在实践中特征、偏差因素和点击之间的相互作用很复杂，通常无法以这种独立的方式分解。使用 EH 拟合点击数据可能会导致模型错误并带来近似误差。

本文提出了一种基于向量的EH，并将点击概率表述为两个向量函数的点乘。此解决方案是完备的，因为它在拟合任意点击函数方面具有通用性。在此基础上，作者提出了一个名为Vectorization的新模型，以自适应地学习相关性嵌入，并通过将嵌入投射到一个基础矢量上对文档进行排序。大量实验表明，作者的方法在复杂的真实点击和简单的模拟点击方面明显优于最先进的ULTR方法。

论文链接

https://doi.org/10.1145/3534678.3539468

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2022-11-01，如有侵权请联系 cloudcommunity@tencent.com 删除

vectorization

本文分享自智能生信微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

vectorization

登录后参与评论

0 条评论

热度

[KDD 2022 | 论文简读] 标量是不够的：基于矢量化的无偏差学习排名

[KDD 2022 | 论文简读] 标量是不够的：基于矢量化的无偏差学习排名

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐