专栏首页爬蜥的学习之旅文本获取和搜索引擎之推荐系统

文本获取和搜索引擎之推荐系统

推荐系统

推荐系统即把恰当的内容推送给用户,类似于在一系列文档中过滤出用户想要的。一般有两种方式:

  1. 看用户喜欢什么样的东西,然后检验当前文档是否和用户喜欢的相似【content-based】;
  2. 看喜欢特定文档的都是什么样的用户,然后看当前用户是否和他们一样[collaborative]。 传统的基于内容推荐模型是:

他存在如下问题:

  • 必须做一个yes/no的决策
  • 初始的数据很少,基本基于配置
  • “学习”通过用户的yes判断,而且还要靠慢慢积累

通过向量模型可以做如下改进

  1. 是它利用了TR已有的模型作为相关性【分数】计算
  2. 对于初始的配置来讲也可以当做是一个向量用来和文档做计算分数
  3. 通过阈值模型来做决定是否推送给用户,并对过滤的结果通过效用模型来评估
  4. 用户得到的反馈之后反过来更新阈值学习和向量模型的学习系统

向量学习系统即调整向量本身的位置,和搜索类似

阈值模型困难在于:能被用户判断的数据都是送给用户的;开始的时候被标记的数据少;提供给用户一些试点的数据,看用户如何反应,太少了达不到效果,太多又会担心都是用户用不到的数据

Beta-Gamma阈值学习

y轴是实际的作用(比如有点击的),x轴是排序中的位置;

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 约束条件变更对算法运行时间所带来的影响

    有1,...,n次请求,去获取单个资源,每个请求的开始时间是s(i),结束时间是f(i), 对于请求i和j,如果二者的区间不重合,即f(i)<=s(j) 或者 ...

    爬蜥
  • 分治法(Divide and Conquer)怎么用?

    给定一个问题集合,大小为n,将它划分成a个大小为 n/b 的小问题,然后组合每个子问题的结果,递归的解决每个小问题,直到最后的问题被解决

    爬蜥
  • 常见动态规划的解决思路

    给定一个词的集合words,使用badness(i,j)表示使用的单词是words[i,j]

    爬蜥
  • No injector for custom defined data type的解决办法

    “message”: "Can’t resolve all parameters for AppComponent in c:/Code/SPA/mystore...

    Jerry Wang
  • rxjs里的Observable对象如何消费

    调用Observable构造器,传入的数组被subscribeToArray再包装一层:

    Jerry Wang
  • Angular里遇到的依赖注入问题

    遇到错误消息:NullInjectorError: No provider for ProductNameNormalizer!

    Jerry Wang
  • java学习原理篇|多用户及环境变量

    在写每个知识点的时候,我们尽量一篇应用的文章搭配就篇原理的文章。应用文章可以和大家一起来探究这个知识点的使用和功能,原理的文章可以和大家一起来探究一下这...

    微笑的小小刀
  • 深度丨CES现场采访联想CTO芮勇:我在联想做的 AI 项目,以及对人工智能的看法

    AI 科技评论按:芮勇博士自 11 月初正式公布去联想担任 CTO 后很少公开发声,而在今日的 CES 2017 现场中,AI 科技评论等媒体对联想集团高级副总...

    AI科技评论
  • SPAN+A VISPA for Verifying Cryptographic Protocols

    春风大魔王
  • Scan Order in Gibbs Sampling: Models in Which it Matters and Bounds on How Much(笔记)

        这篇文章的作者通过对当前的在线新闻和社交媒体平台新闻的观察,基于:“社交媒体用户经常通过学习朋友分享的观点来更新自己对某一特定话题的看法” ,  提出了...

    Gxjun

扫码关注云+社区

领取腾讯云代金券