关于Slashdot

我一直对slashdot.org感兴趣,今天下午对它研究了一番。

slashdot.org创办于1997年,是一个著名的科技新闻网站。它的稿件都是由读者投稿,编辑审核后发表。但是,真正有趣的部分却是它的读者留言。

通常情况下,它的每条新闻有几百条读者留言,多的可以达到上千条,甚至几千条。留言比新闻本身提供更多的信息,许多人都是为了看留言而访问slashdot.org

但是,熟悉互联网的人都知道,网上最多的就是垃圾留言。为了保证网站质量,必须从上千条留言中,找到最有价值的发言,将那些垃圾留言过滤掉。这就成slashdot站长面对的最大问题。事实上,现在slashdot的留言过滤系统是世界上最强大的。

我感兴趣的,就是slashdot.org如何做到这一点。

1. 人工过滤

所有留言采用人工打分的方法进行过滤。5分为最佳留言,-1分为垃圾留言。

2. 匿名用户留言默认分为0分,注册用户为1分。

3. 评分员(moderator)有权为每条留言打分。

打分的方法采用分配形容词,所有可用的形容词分别为normal(一般发言)、offtopic(与主题无关)、flamebait(挑拨)、troll(没有价值)、redundant(废话)、insightful(启发性)、interesting(有趣)、informative(提供有用信息)、funny(搞笑)、overrated(评价过高)和 underrated(评价过低)。

所有正面的形容词为+1分,所有负面的形容词为-1分。

4. 评分员由系统从活跃的注册用户中随机抽取。

每一次,系统会分配给抽中的评分员5分,每评一次就减少1分,换句话说,评分员最多只能给5条留言打分。打分的有效期为3天,过期未使用的分数自动作废。

5. 经常被打高分的留言用户,道德值(karma)会提高;经常得到低分的留言用户,道德值会下降。

道德值高的用户,留言时会自动+1分;道德值低的用户,留言时默认为-1分,系统将自动将其发言过滤。

6. 系统还会随机抽取注册用户,请其对评分员的评分进行二次评估,判断评分是否公正。

经常被认为不公正的评分员,其道德值会下降。

7. 系统默认全文显示3分及3分以上的留言,2分的留言只显示标题。

但是,用户可以自己设置显示的"门槛"(Threshold)。

8. 所有在显示门槛之上的留言,按照得分高低降序排列。

得分高的留言就是最有价值的留言,会出现在最前列。

==================

上面8点就是slashdot.org留言过滤系统的基本设计。看上去非常强壮,实际效果也很好,最有价值的留言确实都显示了出来。

唯一的缺点就是这个系统建立在大量用户参与的基础上,小网站没法用,不具有推广价值。

(完)

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏软件测试经验与教训

关于BUG率的计算和它的实际意义的思考

6077
来自专栏Pulsar-V

Matlab 航模挂载设计

题目 航模组决定对某款航模的挂载能力进行改造测试,希望获得最大的飞行性能评价值。航模挂载设备的体积V(单位:cm3)和重量M(单位:g)均会影响飞行性能评价值,...

4905
来自专栏新智元

谷歌投资“算法商店”创始人:打造AI操作系统(PPT)

【新智元导读】作为拿到谷歌 AI 初创公司风险基金首笔投资的项目(1050万美元),“算法商店”Algorithmia 的创始人兼 CEO 日前做了题为《为 A...

3566
来自专栏AI2ML人工智能to机器学习

当arXiv遇到Twitter

arXiv是一个开放的存放预备版(preprint)文章的地方。 这个Cornell University在1991开启的项目, 因为Grigori Perel...

903
来自专栏玉树芝兰

如何用 R 快速了解科研领域?

用好 R 环境下的 BiblioShiny 软件包 ,可以让你在友好的图形化界面,快速扫描科研领域。

1594
来自专栏顶级程序员

2月份GitHub上最热门的Python项目:深度学习占半壁江山

源 / 开源最前线 整编 / 猿妹 本篇文章为大家盘点了1月份最热门的Python 项目,本月最热门的开源项目中,深度学习相关的开源项目占据了半壁江山,...

3369
来自专栏数据派THU

独家 | 手把手教你学习R语言(附资源链接)

作者:NSS 翻译:杨金鸿 术语校对:韩海畴 全文校对:林亦霖 本文约3000字,建议阅读7分钟。 本文为带大家了解R语言以及分段式的步骤教程! 人们学习R语言...

2797
来自专栏mySoul

软件测试的流程

V模型有两个流,为规范流和测试流。还有一个开发流属于连接规范流和测试流两个中间的桥梁。

1692
来自专栏CDA数据分析师

如何在业务分析中实现商业洞察?-基于Excel BI

作者 CDA 数据分析师 一套完整的 BI 报表应该至少具备以下四个条件: 条件一:能够批量处理有一定规模的数据; 条件二:能够保证数据的时效性及准确性; 条...

2269
来自专栏CVer

TensorFlow 2.0 要来啦!

自 2015 年开源发布以来,TensorFlow 已成为全球应用最广泛的机器学习框架,可满足广泛的用户和用例需求。在此期间,TensorFlow 随着计算硬件...

1262

扫码关注云+社区

领取腾讯云代金券