我正在构建一个基于内容的电影推荐系统。这很简单,只要用户输入一个电影标题,系统就会找到一部具有最相似功能的电影。
在计算相似度并对得分进行降序排序后,我找到了相似度得分最高的5部对应的电影,并返回给用户。
直到现在,当我想评估系统的准确性时,一切都运行得很好。我在Google上找到的一些公式只是基于评分值来评估准确性(比较预测评级和实际评级,如RMSE)。我没有将相似度分数更改为等级(从1到5),所以我不能应用任何公式。
您能建议任何方法将相似度分数转换为预测评分,以便我可以应用RMSE吗?或者有没有解决这个问题的办法?
发布于 2011-07-30 03:45:00
你有什么基本事实吗?例如,你有关于用户过去喜欢/看过/购买过的电影的信息吗?它不一定是一个评级,但为了评估推荐,你需要知道一些关于用户偏好的信息。
如果你这样做了,那么除了RMSE之外,还有其他方法来测量准确性。RMSE在我们预测评级时使用(正如您所说的,是真实评级和预测之间的误差),但在您的情况下,您将生成前N个推荐。在这种情况下,您可以使用精确度和召回率来评估您的建议。它们在信息检索应用程序(参见Wikipedia)中非常常用,在推荐系统中也非常常见。您还可以计算F1度量,它是精度和召回率的调和平均值。您将看到它们是非常简单的公式,并且很容易实现。
Guy Shani的“评估推荐系统”是一篇关于如何评估推荐系统的非常好的论文,将给你一个很好的洞察力。你可以找到论文here。
https://stackoverflow.com/questions/6167855
复制相似问题