【机器学习】--隐语义模型

一、前述

隐语义模型是近年来推荐系统领域较为热门的话题,它主要是根据隐含特征将用户与物品联系起来。

因为用户和物品之间有着隐含的联系。所以把用户转成隐语义,然后物品转成隐语义组合,通过中介隐含因子连接。

二、具体

1、隐语义模型举例和求解

N代表用户,M代表物体

第一步:先分解 将用户分解成F个因子的矩阵 将物品也分解成F个因子的矩阵 (F*N)T*(F*M )=N*M 其中T表示转置。

第二步:转成机器学习模型:

RUI代表用户对物品的关系

Pu代表用户对隐藏因子的关系

QI代表物品对隐藏因子的关系

转换成机器学习模型,必须先找出损失函数。

损失值=预测值-真实值 其中预测值即分解的RUI ,真实值就是真实的RUI,我们希望找出P矩阵(用户和隐藏因子的和关系)和Q矩阵(物品和隐藏因子的关系),实际上就是找出对应的参数,所以这些参数就是我们需要求解的模型,我们将这些参数加入到损失函数里面去,做正则化。

第三步:求解模型

对损失函数求导:

对参数更新迭代:沿着梯度下降的方向,P ,Q就是具体的参数

第四步:建模求解,选择正负样本。

正样本:用户对物品打分就是正样本。

负样本:选取那些很热门,而用户却没有行为的物品。

对每个用户,要保证正负样本的平衡(数目相似)

对于用户—物品集K {(u,i)},其中如果(u, i)是正样本,则有 ???= 1,负样本则???= 0

第五步:参数选择

F值越大,表示映射维度越多。

隐特征的个数F,通常F=100

学习速率alpha,别太大 正则化参数lambda,别太大 负样本/正样本比例 ratio

第六步:模型使用

根据求得的P和Q,还原回去可得原用户对物品的评分矩阵,从而进行推荐。

2、协同过滤VS隐语义比较

原理:协同过滤基于统计,隐语义基于建模 空间复杂度,隐语义模型较小 实时推荐依旧难,目前离线计算多 隐语义模型咋解释呢?不解释

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏CDA数据分析师

几千条文本库也能做机器学习!NLP小数据集训练指南

深度学习往往需要大量数据,不然就会出现过度拟合,本文作者提出了一些在文本数据量不够大的时候可用的一些实用方法,从而赋予小数据集以价值。

10830
来自专栏智能算法

深度学习三人行(第8期)----卷积神经网络通俗原理

接下来我们一起学习下网红网络之卷积神经网络(CNN),我们多多交流,共同进步。本期主要内容如下:

10620
来自专栏新智元

【代替反向传播】终极算法作者提出另一种深度学习:离散优化

【新智元导读】在 Hinton 的 Capsule 之后,越来越多的研究者开始探讨反向传播之外的方法。《终极算法》作者、华盛顿大学教授Pedro Domingo...

45180
来自专栏专知

【干货】模仿人类的印象机制,商汤提出精确实时的视频目标检测方法

【导读】最近,针对视频目标检测中速度精度难以两全的问题,来自商汤科技(SenseTime)的学者发表论文提出一个新的概念——印象网络,其体现出了自然高效的特征聚...

44660
来自专栏吉浦迅科技

不要蓝瘦香菇,传你几招深度学习性能提升的诀窍吧!

原文: How To Improve Deep Learning Performance 作者: Jason Brownlee 翻译: KK4SBB ...

36940
来自专栏机器之心

教程 | 详解支持向量机SVM:快速可靠的分类算法

选自Monkey Learn 作者:Bruno Stecanella 参与:李泽南、李亚洲 当处理文本分类问题时,你需要不断提炼自己的数据集,甚至会尝试使用朴素...

560100
来自专栏AI研习社

为什么『无监督集成学习』乏人问津?

终于有机会给大家聊聊每天折磨我的主题 - 无监督集成学习(Unsupervised Ensemble)。其实这是个很有意思的领域,但因为各种各样的原因一直都处于...

40260
来自专栏机器之心

「房间里的大象」:让目标检测器一脸懵逼

作者:Amir Rosenfeld、Richard Zemel、John K. Tsotsos

11330
来自专栏Soul Joy Hub

《深度学习Ng》课程学习笔记03week2——机器学习(ML)策略(2)

http://blog.csdn.net/u011239443/article/details/78132697 2.1 进行误差分析 标注错误: ? 2...

35980
来自专栏新智元

DeepMind提出视觉问题回答新模型,CLEVR准确率达98.8%

【新智元导读】DeepMind为视觉问题回答提出了一种新的硬注意力机制,它只保留了回答问题所需的少量视觉特征。减少需要处理的特征使得能够训练更大的关系模型,并在...

6320

扫码关注云+社区

领取腾讯云代金券