MMD_4a_CollaborativeFiltering

Overview

A tech for using one’s behavior to predict what other people will do.

history

之前,数据量很少的时候,人们一般search,但是当数据量很多,超市的货架上已经装不下的时候,这时候需要recommendation

long tail

X轴后面的商品不会出现在零售店中,因此需要去推荐购买。

types of rs

model

模型的关键在于utility matrix

key problems

推荐系统主要有三个核心问题:

  1. 搜集数据:可以显式地也可以隐式地搜集
  2. 根据数据推荐:主要解决sparse的问题
  3. 评估推荐模型的好坏

Content-based System

基于内容的推荐系统核心是:针对每一个user给很多item打了分。首先,建立item profile,比如电影的话要包含演员、年份、导演等特征。然后,根据用户的打分,将所有打过分的电影特征量聚合成一个新的user profile。最后,将每个电影的item profile和user profile对比,实施推荐方案。

main idea

Main idea: recommend items to customers x similar to previous items rated highly by x.

plan

item profile

item profile是需要人工去指定的。

针对文本特征,可以使用TF-IDF(Term frequency * Inverse Doc Frequency)。

user profile

user profile是根据一定的策略,从item profile中聚合而来。

prediction

pros and cons

Collaborative Filtering

main idea

比如想要给x推荐电影,可以采用两种方法:

  1. user-user: 根据x对电影的评分,找出和x最像的人群集合S,然后用集合S的数据给x未评分的电影打分。
  2. item-item: 根据x未评分的电影m,找出x已经评过的并且和m很相似的电影S,利用S来打分。

similar user

rating prediction

item-item filtering

item vs. user

一般来说,item-item表现更好。

implement

complexity

pros and cons

hybrid methods

global baseline and CF

Evaluating

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏量子位

谷歌开源神经机器翻译技术,推出tf-seq2seq框架

陈桦 编译自 Google官方博客 量子位 报道 | 公众号 QbitAI 谷歌研究软件工程师、谷歌大脑团队成员Anna Goldie和Denny Britz今...

3036
来自专栏AI研习社

FAIR 开源 Tensor Comprehensions,让机器学习与数学运算高性能衔接

AI 研习社消息,Facebook AI 研究院于近日开源了 C++ 库及数学语言 Tensor Comprehensions,它能有效填补研究人员于数学运算领...

2658

基于Apache Spark机器学习的客户流失预测

流失预测是个重要的业务,通过预测哪些客户可能取消对服务的订阅来最大限度地减少客户流失。虽然最初在电信行业使用,但它已经成为银行,互联网服务提供商,...

6367
来自专栏机器人网

PID控制原理:看完这三个故事,你就明白了

一、PID的故事 小明接到这样一个任务:有一个水缸点漏水(而且漏水的速度还不一定固定不变),要求水面高度维持在某个位置,一旦发现水面高度低于要求位置,就要往水缸...

2623
来自专栏ATYUN订阅号

DeepMind开源强化学习库TRFL,可在TensorFlow中编写强化学习智能体

今天,DeepMind开源了一个新的构建模块库,用于在TensorFlow中编写强化学习(RL)智能体。名为TRFL(发音为’truffle’),它代表了其内部...

632
来自专栏机器人网

PID控制原理:看完这个故事你就明白了

小明接到这样一个任务:有一个水缸漏水,且漏水的速度是不定的,但要求水面高度维持在某个位置,一旦发现水面高度低于要求位置,就要往水缸里加水。 ? 开始小明用瓢加水...

3235
来自专栏量子位

Facebook发布张量理解库,自动编译高性能机器学习核心

? Facebook AI Research今天发布了张量理解(Tensor Comprehension),这是一个C ++库,也是一种数学语言,它能够自动、...

3385
来自专栏CreateAMind

her训练效果,可以准备人机乒乓球比赛了

902
来自专栏养码场

22G的算法导论+算法基础+算法精讲!干货三连击,让你从基础连跳至实战!

上周有群友向场主要算法的干货资料,场主花了十几分钟,终于找到了深埋网盘底部的一整套完整算法教程视频。

441
来自专栏用户3246163的专栏

[脑书笔记]《整体性学习》2-获取和理解信息的技术

这篇脑书继续讲整体性学习的第二部分整体性学习的技术,在《整体性学习》1里面在谈到信息进入大脑的顺序是,获取,理解,拓展,纠错和应用。这篇脑书笔记主要针对这5个步...

681

扫码关注云+社区