首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >论坛帖子的贝叶斯过滤

论坛帖子的贝叶斯过滤
EN

Stack Overflow用户
提问于 2010-02-17 18:17:51
回答 2查看 348关注 0票数 2

有没有人使用贝叶斯过滤器来让论坛成员对帖子进行分类,所以随着时间的推移,论坛只会显示有趣的帖子?贝叶斯过滤器似乎能很好地检测垃圾邮件。实现贝叶斯过滤器是为用户过滤论坛帖子的可行方法吗?

EN

回答 2

Stack Overflow用户

发布于 2010-06-06 09:53:20

试图通过贝叶斯分类器或任何其他自动分类系统对有趣/好的论坛帖子进行分类的困难在于,帖子的单词和/或单词结构与它们的相对值或效用之间可能缺乏相关性。

垃圾邮件过滤器之所以起作用,主要是因为它的词汇选择和结构总体上是不寻常的:垃圾邮件发送者试图推广特定的产品、服务等。可以学习合理的相关性和模式,尽管垃圾邮件发送者可以尝试通过各种技术增加这样做的难度。

这样的单词/结构模式不太可能存在于好与坏的论坛帖子中。但是,有一种可能有用的替代方法来重构问题:

  1. 允许用户将帖子分类为好的或差的,或者按照您的描述对它们进行排名。
  2. 使用贝叶斯分类器或其他统计推断方法来确定与整个社区的排名行为具有最高相关性的论坛用户,即品味最好且对整个社区如何查看内容具有最佳预测能力的用户。
  3. 使用步骤#2中确定的好预测者用户池中的论坛帖子排名来筛选论坛帖子。这需要一个或多个这样的用户在某些时候对新内容进行实际排名,因此此池需要具有一定的大小,并包括常规用户,以便这样的过滤系统有效。
  4. 此分类器系统将需要定期重建,因为用户社区可能是动态的,具有不断变化的兴趣等。

我提出的方法在多大程度上解决了你的问题,这在很大程度上取决于论坛的性质,用户对内容进行排名的意愿,以及他们在感知发布内容的价值方面有多少共同点。此外,用户社区的总体规模可能是一个因素:如果太小,可能没有足够的数据可用;如果太大,您可能会遇到针对排名数据运行分类器推理方法的计算缩放问题。

票数 1
EN

Stack Overflow用户

发布于 2010-06-06 12:42:31

协同过滤的效果不是更好吗?

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/2279783

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档