首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >矩阵分解对协同过滤有什么帮助?

矩阵分解对协同过滤有什么帮助?
EN

Data Science用户
提问于 2018-01-22 02:22:25
回答 1查看 861关注 0票数 2

我们从不同电影的用户评分矩阵开始,其中包含一些未知元素,即用户尚未看到的电影的评级。我们需要填补这一空白。所以

  • 如何分解或分解所有元素都不预先已知的矩阵。
  • 在您以某种方式对其进行分解之后,您是否只是将矩阵相乘以重新创建原来的矩阵,但是现在填充了缺失项?
  • 你怎么知道哪种因式分解方法像非负的,奇异的,特征的,而不涉及太多的数学?
EN

回答 1

Data Science用户

回答已采纳

发布于 2018-01-22 05:23:02

回答您的问题

  1. 您可以分解矩阵,以便尽可能接近原始矩阵。这通常是从随机值开始,并根据误差(因子乘积和原始矩阵之间的误差)进行更新。换句话说,对于给定的矩阵A,您试图找到矩阵C&D,这样误差(A- (C ))是最低的。该算法旨在找到一个近似,这可能导致原始缺失条目被替换为新的值(建议或评级)。
  2. 你只是在繁殖吗?是。这是计算的本质。对于每一个用户和产品,乘法给你评级或评分。根据分数进行排序,并为每个用户选择推荐的索引。它还允许您现在存储比原始矩阵小得多的矩阵。
  3. 因式分解的选择也将由应用程序决定。如果您的应用程序只有正的评分,那么最好使用非负矩阵因式分解。您可以在不知道要开始的实现的情况下开始使用矩阵因式分解方法,只要您知道总体想法(以及使用它的缺陷)。

进一步评论

让人有些困惑的是,您从一个包含许多缺失项(未见项)的矩阵开始,通过因式分解近似矩阵,并期望得到无缺失项(这有助于进行预测)。如果任务是近似原始条目,那么建议将不是很好,因为您可以在近似中有缺失/零项,并且在近似任务上仍然得到最低的误差。其思想是:算法中的正则化(上面第1点)确保了对原始数据中的噪声进行过滤,并且只检测到模式。但这一想法也受到了不少批评。本文作者:的导言部分提供了一个可读的介绍,介绍了在简单矩阵分解方法中所发生的事情以及可能出错的原因。本文还用较好的优化准则对任务进行了重新规划。您还可以阅读西蒙·芬克的这篇文章,它用可读的语言(和代码)解释了用于建议的矩阵因式分解的机制。

票数 2
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/26902

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档