首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >MMD_4a_CollaborativeFiltering

MMD_4a_CollaborativeFiltering

作者头像
用户1147754
发布2018-01-02 17:22:38
4500
发布2018-01-02 17:22:38
举报
文章被收录于专栏:YoungGyYoungGy
  • Overview
    • history
    • long tail
    • types of rs
    • model
    • key problems
  • Content-based System
    • main idea
    • plan
    • item profile
    • user profile
    • prediction
    • pros and cons
  • Collaborative Filtering
    • main idea
    • similar user
    • rating prediction
    • item-item filtering
    • item vs user
    • implement
      • complexity
      • pros and cons
      • hybrid methods
      • global baseline and CF
  • Evaluating

Overview

A tech for using one’s behavior to predict what other people will do.

history

之前,数据量很少的时候,人们一般search,但是当数据量很多,超市的货架上已经装不下的时候,这时候需要recommendation

long tail

这里写图片描述
这里写图片描述

X轴后面的商品不会出现在零售店中,因此需要去推荐购买。

types of rs

这里写图片描述
这里写图片描述

model

模型的关键在于utility matrix

这里写图片描述
这里写图片描述

key problems

推荐系统主要有三个核心问题:

  1. 搜集数据:可以显式地也可以隐式地搜集
  2. 根据数据推荐:主要解决sparse的问题
  3. 评估推荐模型的好坏
这里写图片描述
这里写图片描述

Content-based System

基于内容的推荐系统核心是:针对每一个user给很多item打了分。首先,建立item profile,比如电影的话要包含演员、年份、导演等特征。然后,根据用户的打分,将所有打过分的电影特征量聚合成一个新的user profile。最后,将每个电影的item profile和user profile对比,实施推荐方案。

main idea

Main idea: recommend items to customers x similar to previous items rated highly by x.

plan

这里写图片描述
这里写图片描述

item profile

item profile是需要人工去指定的。

针对文本特征,可以使用TF-IDF(Term frequency * Inverse Doc Frequency)。

这里写图片描述
这里写图片描述

user profile

user profile是根据一定的策略,从item profile中聚合而来。

这里写图片描述
这里写图片描述

prediction

这里写图片描述
这里写图片描述

pros and cons

这里写图片描述
这里写图片描述

Collaborative Filtering

main idea

比如想要给x推荐电影,可以采用两种方法:

  1. user-user: 根据x对电影的评分,找出和x最像的人群集合S,然后用集合S的数据给x未评分的电影打分。
  2. item-item: 根据x未评分的电影m,找出x已经评过的并且和m很相似的电影S,利用S来打分。
这里写图片描述
这里写图片描述

similar user

这里写图片描述
这里写图片描述

rating prediction

这里写图片描述
这里写图片描述

item-item filtering

这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述

item vs. user

一般来说,item-item表现更好。

这里写图片描述
这里写图片描述

implement

complexity

这里写图片描述
这里写图片描述

pros and cons

这里写图片描述
这里写图片描述

hybrid methods

这里写图片描述
这里写图片描述

global baseline and CF

这里写图片描述
这里写图片描述

Evaluating

这里写图片描述
这里写图片描述
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Overview
    • history
      • long tail
        • types of rs
          • model
            • key problems
            • Content-based System
              • main idea
                • plan
                  • item profile
                    • user profile
                      • prediction
                        • pros and cons
                        • Collaborative Filtering
                          • main idea
                            • similar user
                              • rating prediction
                                • item-item filtering
                                  • item vs. user
                                    • implement
                                      • complexity
                                      • pros and cons
                                      • hybrid methods
                                      • global baseline and CF
                                  • Evaluating
                                  领券
                                  问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档