我们从不同电影的用户评分矩阵开始,其中包含一些未知元素,即用户尚未看到的电影的评级。我们需要填补这一空白。所以
发布于 2018-01-22 05:23:02
让人有些困惑的是,您从一个包含许多缺失项(未见项)的矩阵开始,通过因式分解近似矩阵,并期望得到无缺失项(这有助于进行预测)。如果任务是近似原始条目,那么建议将不是很好,因为您可以在近似中有缺失/零项,并且在近似任务上仍然得到最低的误差。其思想是:算法中的正则化(上面第1点)确保了对原始数据中的噪声进行过滤,并且只检测到模式。但这一想法也受到了不少批评。本文作者:的导言部分提供了一个可读的介绍,介绍了在简单矩阵分解方法中所发生的事情以及可能出错的原因。本文还用较好的优化准则对任务进行了重新规划。您还可以阅读西蒙·芬克的这篇文章,它用可读的语言(和代码)解释了用于建议的矩阵因式分解的机制。
https://datascience.stackexchange.com/questions/26902
复制相似问题