前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >文本获取和搜索引擎之推荐系统

文本获取和搜索引擎之推荐系统

作者头像
爬蜥
发布2019-07-09 14:32:23
5090
发布2019-07-09 14:32:23
举报

推荐系统

推荐系统即把恰当的内容推送给用户,类似于在一系列文档中过滤出用户想要的。一般有两种方式:

  1. 看用户喜欢什么样的东西,然后检验当前文档是否和用户喜欢的相似【content-based】;
  2. 看喜欢特定文档的都是什么样的用户,然后看当前用户是否和他们一样[collaborative]。 传统的基于内容推荐模型是:

他存在如下问题:

  • 必须做一个yes/no的决策
  • 初始的数据很少,基本基于配置
  • “学习”通过用户的yes判断,而且还要靠慢慢积累

通过向量模型可以做如下改进

  1. 是它利用了TR已有的模型作为相关性【分数】计算
  2. 对于初始的配置来讲也可以当做是一个向量用来和文档做计算分数
  3. 通过阈值模型来做决定是否推送给用户,并对过滤的结果通过效用模型来评估
  4. 用户得到的反馈之后反过来更新阈值学习和向量模型的学习系统

向量学习系统即调整向量本身的位置,和搜索类似

阈值模型困难在于:能被用户判断的数据都是送给用户的;开始的时候被标记的数据少;提供给用户一些试点的数据,看用户如何反应,太少了达不到效果,太多又会担心都是用户用不到的数据

Beta-Gamma阈值学习

y轴是实际的作用(比如有点击的),x轴是排序中的位置;

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2018年07月18日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 推荐系统
  • Beta-Gamma阈值学习
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档