前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >每周学点大数据 | No.49 维基百科的策略中体现的“众包算法”的思想

每周学点大数据 | No.49 维基百科的策略中体现的“众包算法”的思想

作者头像
灯塔大数据
发布2018-04-04 14:28:32
7440
发布2018-04-04 14:28:32
举报
文章被收录于专栏:灯塔大数据

No.48期

众包的定义

Mr. 王:平常遇到不知道的概念或者名词,你一般会怎么办?

小可:有维基百科啊,我去查一查就知道了。对于一个名词,维基百科能给出很多的解释,而且这些解释往往非常准确和专业。

Mr. 王:好,今天我们就来聊聊维基百科。

小可惊讶地说:哦?维基百科还和大数据算法有关?

Mr. 王笑着说:当然有关了,维基百科的策略体现了“众包算法”的思想。

小可:众包算法?什么是众包算法啊?我以前好像听说过有一个说法叫“外包”,就是做一些自己不太容易完成的问题时,会找一些其他的人来做。这个众包和外包有什么联系吗?

Mr. 王:有相似之处,但不太一样,所谓“外包”是把工作交给其他的人来做,但是这些人往往是确定的、已知的这样一群雇员;而众包则不同,虽然它也是把事情交给别人来做,但是这群人往往是不固定的、参与量很大的一群未知的参与者。

小可:原来如此!

Mr. 王:你听说过开源软件吗?

小可:我知道的,一些程序员会在像GitHub 这样的网站上公开自己软件的源代码,看到代码的人都可以使用和编辑它们。他们拥有自己的社区,会在上面分享自己的一些源代码,同时也就可以基于其他人做的一些前置工作,来更快捷地完成自己的开发工作。有时候程序员还会在开源社区贴出自己的代码,请求别人来帮忙完善。

Mr. 王:其实众包的思想和开源软件很像,只是众包的应用更加广泛一些,它不局限于程序开发,它会将更丰富的、不限于开发的任务交给一些其他的人去完成。就像开源软件一样,究竟哪些人会来完成这些任务,是任务的提出者并不知道的。

小可:可是为什么要采取众包这种方法呢?

Mr. 王:众包算法的问题往往具有这样一个特点,就是人来完成这个问题很容易,但机器做起来却比较困难,或者这个任务难以由少量的人来完成,适合由大量的人参与到其中,充分发挥大众的力量,使得任务更高效、准确地完成,这样的问题非常适合使用众包算法进行解决。

小可:这样就可以发挥人在完成任务上的优势了,这的确是一种非常好的思想。

Mr. 王:想一想,维基百科是不是也利用了众包的思想呢?

小可:的确,维基百科将词条贴到网上,让网络上的人来丰富其解释,是一种众包方法的体现。

Mr. 王:世界上成千上万的人参与建设维基百科的词条,也就建成了一个数据量庞大而且质量相当高的知识库。这些人将自己的知识张贴到维基百科上的同时,也能利用维基百科来解决一些自己不太清楚的问题。在像维基百科这样的平台中,很多它的贡献者同时也是其受益者。

小可:嗯。发挥网友们的力量,最后在平台上达成一种人人为我、我为人人的效果。

Mr. 王:好,说了这么多关于众包的内容,我们还是尝试给众包下一个定义。众包指的是协调一个群体(一般是互联网上的一大群人)来做微工作(也就是每个人做出一点贡献),完成软件或者单个人难以完成的任务。

小可:嗯,但是协调互联网上的一大群人,还确实有一定难度呢。

Mr. 王:所以在实际的众包应用中,就要设计一系列的机制和方法来指导和协调群体的行为,如何做到这一点,还值得众包方法的设计者深思。

Mr. 王:这里还有一个概念叫作人本计算,众包和人本计算还是有很大的交集的,但众包和人本计算并不等价。众包在很大程度上利用了人本计算;而人本计算虽然往往是用人来做计算的主体,但人本计算完成的任务可以是大任务,也可以是微任务。众包让一个人做的任务往往是微任务,而合并起来完成的就是大任务。另外,众包算法将任务配发给的人往往是任务的提出者所不知道的,谁来完成这个任务,任务的提出者并不会事先了解或者指定。

下期精彩预告:

经过学习,我们了解了一下维基百科的策略体现的“众包算法”思想。在下一期中,我们将进一步了解众包在业界的应用。更多精彩内容,敬请关注灯塔大数据,每周五不见不散呦!

内容来源:灯塔大数据 文章编辑:柯一

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2017-08-11,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 灯塔大数据 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
大数据
全栈大数据产品,面向海量数据场景,帮助您 “智理无数,心中有数”!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档