我正在尝试建立一个推荐系统,它将根据用户的行为向他推荐网页(谷歌搜索,点击,他也可以明确地对网页进行评分)。为了了解谷歌新闻的运作方式,它会在一个特定的主题上显示来自网络的新闻文章。从技术上讲,这就是聚类,但我的目标是相似的。它将是基于用户行为的基于内容的推荐。
所以我的问题是:
发布于 2012-10-10 21:00:54
正如Thomas所说,你可以写几本关于你的问题的书;-)我会试着给你一个简短的建议清单--但是要知道,不会有现成的解决方案.
发布于 2012-10-08 11:16:19
这应该是一个很好的阅读:http://dl.acm.org/citation.cfm?id=1242610
它关注的是协作过滤,而不是基于内容的建议,但它触及了一些非常有趣的要点,如可伸缩性、项目流失、算法、系统设置和评估。
Mahout具有非常好的协作过滤技术,这就是您所描述的使用用户行为(单击、读取等)的方法,您可以使用重新编码类介绍一些内容。
您可能还想看看http://myrrix.com/,它在某种程度上是Mahout的味觉(又名推荐)部分的演变。此外,它还允许将基于内容的逻辑应用于使用重新编码类的协作过滤之上。
如果您对Mahout感兴趣,http://manning.com/owen/将是最好的起点。
https://stackoverflow.com/questions/12778823
复制相似问题