新的推荐人制度必须具备什么样的质量才能具有竞争力?
我所说的“推荐的质量”是指以下内容。比方说,推荐系统提供了用户X项。之后我问他,他或她到底喜欢多少人(可能买),结果发现他喜欢Y。推荐的质量为Y/X (最佳可能值为1,这意味着用户喜欢所有推荐的项目)。
推荐的质量如何?
推荐系统大约有?
Update1: 这里 (第64页)作者写道,2007年Netflix的前2名算法分别实现了0.8914和0.8990的RMSE。
RMSE的定义可以在第63页找到,但我不明白它的含义。
发布于 2014-12-04 13:18:47
你其实是在问一个很有趣的问题。学术界对以下问题仍存在激烈的争论:(1)一个“好”的推荐甚至意味着什么;( b)用于预测准确性的度量标准以及其他评价措施。
你问:
平均推荐系统和最佳推荐系统大致具有什么样的推荐质量?
答案是-它取决于许多不同的事情。简单地说,对于推荐系统没有真正一致的“平均”或“最佳”,但您可能会找到特定推荐系统的基准--比如电影推荐系统。
为了给你提供更多的背景:
用均方误差作为预测精度的衡量标准。例如,给定一组物品(面包、牛奶、咖啡、橙汁),系统能多好地预测我对这些物品的评级,或者它能多好地预测我将购买这些物品。
您可以使用RMSE,当您对一组项的用户有一组预测的评等时,还可以使用这些项的实际评等。您通常会在实际数据集的“脱机”实验中使用RMSE。在此过程中,您将“隐藏”一些真实的评等,并查看系统是否能够预测隐藏的评等。RMSE的“误差”部分是预测评级与实际评级之间的差异。然后,首先对每个错误进行平方,然后对该用户的一组项的这些错误的平均值取(平均值部分),然后取平方根(名称的根部分)。由于RMSE首先对误差进行平方,与其他精度指标(如平均绝对误差(MAE) )相比,它不成比例地惩罚较大的误差。
做一个好的建议,不仅仅是做出准确的预测,还有很多。这就是为什么没有标准/平均数字可供选择的原因。有一系列不同的度量标准可用于精确性,而准确性只是度量推荐系统有效性的一小部分,而其他部分也都有多个度量标准可供使用!这也取决于您推荐的项目。推荐一个人去约会,这和在网上推荐什么食物是不一样的。我在0.8+看过电影推荐人的评分,在0.2+ RMSE看过推荐工作的分数。
如果您想更好地(而不是数学)了解评估推荐系统的复杂性,我建议您阅读下面的论文:
赫洛克,Konstan,Terveen,Diedl -“评估协作过滤推荐系统”(2004) -是一篇很好的论文,可以开始了解可以用来评估RS性能的不同方法。
另一篇很好的论文是McNee、Riedl和Konstan --“准确性并不总是好的:精度度量如何损害推荐系统”(2006年)。
https://stackoverflow.com/questions/27106705
复制相似问题