有没有人使用贝叶斯过滤器来让论坛成员对帖子进行分类,所以随着时间的推移,论坛只会显示有趣的帖子?贝叶斯过滤器似乎能很好地检测垃圾邮件。实现贝叶斯过滤器是为用户过滤论坛帖子的可行方法吗?
发布于 2010-06-06 09:53:20
试图通过贝叶斯分类器或任何其他自动分类系统对有趣/好的论坛帖子进行分类的困难在于,帖子的单词和/或单词结构与它们的相对值或效用之间可能缺乏相关性。
垃圾邮件过滤器之所以起作用,主要是因为它的词汇选择和结构总体上是不寻常的:垃圾邮件发送者试图推广特定的产品、服务等。可以学习合理的相关性和模式,尽管垃圾邮件发送者可以尝试通过各种技术增加这样做的难度。
这样的单词/结构模式不太可能存在于好与坏的论坛帖子中。但是,有一种可能有用的替代方法来重构问题:
我提出的方法在多大程度上解决了你的问题,这在很大程度上取决于论坛的性质,用户对内容进行排名的意愿,以及他们在感知发布内容的价值方面有多少共同点。此外,用户社区的总体规模可能是一个因素:如果太小,可能没有足够的数据可用;如果太大,您可能会遇到针对排名数据运行分类器推理方法的计算缩放问题。
发布于 2010-06-06 12:42:31
协同过滤的效果不是更好吗?
https://stackoverflow.com/questions/2279783
复制相似问题