专栏首页大数据文摘开放数据:数据也可以实行共产主义

开放数据:数据也可以实行共产主义

大数据与开放数据有着千丝万缕的联系,但两者并不是一回事儿。开放数据为大数据的合理开发利用提供了一个新途径,并在一定程度上降低了大数据的风险。

  大数据是根据其体量来界定的,而开放数据的界定则是根据其用途。大数据指体量巨大、种类复杂,同时又在迅速变化的数据集。但这些关于大数据的评定具有很强的主观性,受限于人类现有的技术:随着数据分析和计算技术水平的发展,几年之后,我们现在所谓的大数据也就称不上是大数据了。

  开放数据是可利用的公共数据,个体、公司和机构都能根据这些数据进行投融资,分析其中的模式与趋势,根据数据进行决策,解决复杂棘手的问题。开放数据的定义有两个维度:一是数据对任何人公开,二是通过某种方式授权数据的再利用。除了“开放性”之外,开放数据的使用门槛也要相对降低。同时,人们就开放数据的费用问题已达成了基本共识,即免费或是尽量低的价格。

大数据与开放数据的关联

  上面的维恩图展现了大数据与公开数据之间的关联,以及它们与广义上的政府公开数据之间的关系。这其中有几点需要重点介绍一下。

只有开放的大数据才能称之为大众化、民主化的数据:其中的第一点包括了所有未公开的大数据--如零售巨头保留的顾客数据,或是NSA收集的国家安全数据。拥有此类数据的机构具有非对称的优势,却可能使剩下的我们毫无安全感可言。这一类数据所引起的争议也愈来愈大。

开放数据不一定是大数据:正如图表中的第四点所示,公开化的少量数据也可能带来巨大的影响力。例如,地方政府公开的数据有助于公民更多地了解参与地方预算,选择医保方案,权衡地方服务水平,或是据此开发公共交通辅助app.

大数据和开放数据并不一定来自于政府公开数据:如第三点所示,越来越多的科学家开始将航天、地理或其他领域的成果以一种新的,合作研究的方式共享。另外还有其他一些研究人员利用社交媒体上的数据--其中大部分都是公开的--分析舆情和市场趋势。

政府一旦把它所掌握的大数据公开化,这将会给整个社会带来不可估量的影响:政府机构有足够的能力和资金收集大量数据(如图表中的第六点所示),此类数据库的公开将会带来巨大的经济效益。根据现有的资料,在美国,大约有500家企业利用政府公开数据进行商业运作,而其中的多数数据是大数据。

  利用开放数据的原则去开发大数据可以解决大数据所面临的很多问题。其中最重要的一点便是隐私性个人化数据的开发利用可能难以得到数据主体,亦即我们自身的许可和认可。而将敏感数据以特定方式,或可控的方式公开化,可能会在一定程度上提高数据的安全性。

  因此,目前的问题不仅是政府和某些商业机构一直在收集个人信息,而更严峻的是,我们对于自身的哪些数据被收集一无所知,也无权查看被收集的数据。如果我们了解得更多,我们可控的也就更多。英国政府制定的midata计划,鼓励大型商业机构与顾客共享其用户数据,这不失为开放数据的创新性举措。美国也有类似的项目,如Blue Button医疗数据公开方案,以及Green Button能源使用数据方案,这些都收到了积极效果。

  大数据与开放数据都将会对商业、政府和社会带来革命性的影响,而两者相结合的潜力更是不可估量。大数据赋予我们理解分析,并最终改变世界的能力。开放数据将这种能力公开共享--被我们所改变的世界将朝着更加公平、更加民主的方向发展。

原文作者Joel Gurin,

编译 郝影 摘自硅谷动力

本文分享自微信公众号 - 大数据文摘(BigDataDigest)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2014-05-05

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 涂子沛:数据之巅通向智能社会

    大数据文摘
  • 院士谈大数据时代的国家治理(上)

    大数据文摘
  • 中国电信灯塔大数据行业高峰论坛成功举办(8份ppt下载)

    大数据文摘
  • 【推荐阅读】企业实施大数据的五大关键

    业要实施大数据战略,需要从五大方面规划:1.制定大数据规划找准切入点;2.强化大数据领导力设立CDO;3.设计合理的大数据组织结构;4.搭建富有执行力的大数据团...

    钱塘数据
  • 【职业】现在学习大数据晚吗?

    ? PPV课网站上经常有人问这个问题,在回答这个问题之前,先看一段对话: Q:你好老师,我想问下现在从事大数据相关的行业是不是有点晚了, 现在大数据这块就业就...

    小莹莹
  • 投稿 | 现阶段我为什么不看好纯粹的数据交易?

    原力大数据创始人江颖表示,尽管大数据交易平台建设正值爆发期,数据交易号称的市场规模也在不断壮大,同时也有国家大力的政策支持。但是短期内,我仍然不看好数据交易,因...

    数据猿
  • 英国2020《国家数据战略》与世界各国对比解析

    2020年9月9日,英国数字、文化、媒体和体育部(DCMS)发布《国家数据战略》(下文简称《战略》),支持英国对数据的使用,帮助该国经济从疫情中复苏,并将在20...

    明悦数据
  • 透过数据魔镜看人看物看世界

    万物皆数,透过数据的魔镜能够帮助人类照出万物的本质,看人看物看世界。正如实现心愿的如意——如意如意快快显灵,数据的如意如今已经成为评判人和物的标尺,给人给物画像...

    机器思维研究院
  • 数据猿专访 | 北大新媒体研究院副院长刘德寰:大数据将在公共卫生领域迎来爆发式发展

    <数据猿导读> 刘德寰教授在接受数据猿采访时说到,公共卫生跟人的生命密切关联,未来,大数据一定会在公共卫生领域有巨大的应用前景跟爆发式发展;但同时也很担忧,现在...

    数据猿
  • 数据清洗 Chapter01 | 数据清洗概况

    这篇文章讲述的是数据存储方式和数据类型等基本概念、数据清洗的必要性和质量评价的关键点。希望这篇数据清洗的文章对您有所帮助!如果您有想学习的知识或建议,可以给作者...

    不温卜火

扫码关注云+社区

领取腾讯云代金券