关于开放数据:上海是中国第1,而中国是世界第71

2017年贵阳“数博会”上最新发布的《中国地方政府数据开放平台报告》显示,近年来,虽然各地政府日益强调开放数据的重要性,但总体上,全国范围内,真正做到开放数据的仍是少数地区。而这些地区,在分布上也存在着极不均衡的状况。

2017中国城市“数据开放”指数:上海第一,贵阳第二

随着“开源”思想在互联网领域的蔓延,这几年,全球越来越多人开始呼吁政府和企业“开放数据”。对数据开放的需求,这在大数据时代表现地尤为迫切。

作为全球互联网大潮的前沿阵地之一,中国政府相关的数据开放情况也一直受到关注。

5月27日,复旦大学和提升政府治理能力大数据应用技术国家工程实验室联合发布,由复旦大学数字与移动治理实验室出品了2017年《中国地方政府数据开放平台报告》(简称《报告》)。报告评估了国内19个城市的数据开放平台,并建立了一套“开放数林”指标评估体系。在最终的榜单上,上海市夺得头把交椅,贵阳紧随其后,排第三的则是青岛,但是青岛与上海和贵阳已经有较明显的差距。

在解读这份榜单之前,我们首先要了解什么是开放政府数据?

国际上普遍认为,开放政府数据应符合8大基本原则:完整、原始、及时、可公开获取、可机器读取、非歧视获取、非专属以及免于授权许可。简单来说,就是任何人可以凭借任何目的免费地使用、修改、分享的数据。

2017年,国务院办公厅印发的《政务信息系统整合共享实施方案》也指出,要向社会开放“政府部门和公共企事业单位的原始性、可机器读取、可供社会化再利用的数据集”。在对待开放数据的定义上,中国与国际社会的标准总体是一致的。

上述《报告》也基于这些大原则,按照更细化的指标要求,对入围的19个城市的开放数据平台进行了“开放数林”指数评分。接下来就让DT君具体带大家看看,中国各地市的数据开放情况究竟如何?

中国地方政府开放数据:平台较少,但数据丰富程度尚可

从整体上看,中国地方政府开放数据的建设与国家政策有着密切联系。

2012年,上海市首先推出了中国大陆地区第一个开放数据平台。但全国其他地区的开放数据平台的增长速度却一直较为缓慢。直到2015年国务院印发了《促进大数据发展行动纲要》,各地数据开放的速度才明显加快。浙江、贵州、广东等地方陆续上线了开放数据平台。

另一方面,对于已经开放的数据,各地平台对于元数据的提供还是比较友好的。(DT君注:元数据为描述性数据,主要说明数据的属性信息。有助于数据利用这更了解数据集的内容和背景,从而更好地获取和利用数据。)

目前,国内大多数平台已经能提供数据描述、主题、关键字等元数据信息,虽然更新频率、访问量、数据项等信息较少,但是从属性上看,数据的丰富程度还是值得肯定的。

想用开放数据创业?你还应该注意这些“坑”

全球最大的开放数据NGO“开放知识基金”认为,政府开放数据的价值,不仅在于促进政务信息透明和市民的参政议政,还在于创造社会和经济价值。DT君也看到,不少科技创新型企业是利用政府开放数据作为商业活动的载体。在北京冬天雾霾最严重的日子,DT君也曾经想过创业,如果能把政府开放的天气数据和体育结合起来,说不定能做一个“霾都跑步指南”呢。

作为政府开放数据的使用者,DT君最担心的,是开放数据的数量、质量和可持续性。

首先是数量。《报告》显示,各地平台上开放的数据集数量尚可,但即便如此,各城市之间的差异仍然非常明显。

虽然上海是综合指数最高的城市,但是如果仅从数据集总量上看,武汉以1297的数量集总和力压上海和贵阳,名列第一。不过另一方面,各地的差异也非常大,最少的湛江只有29个数据集,连第一名武汉的零头都不到。

其次是质量。

比起清洁度、真实性等细节的数据质量问题,DT君更关心的是政府开放数据的法律保障。

理论上,开放数据应该通过开放授权协议从法律上保障数据的开放性。协议内容应明确授予用户免费获取、不受歧视、自由利用、自由传播分享的权利。但是目前国内的19个开放平台,没有一个平台的协议全部明确授予了上述四项权利。

看来,企业在利用政府开放数据的时候,可能要考虑更多的政策性风险。

最后是可持续性。不更新的开放数据都是耍流氓。

对于大数据产业来说,迭代速度是另一个非常重要的指标。DT君如果要做那个霾都的项目,没有实时更新的数据是注定做不成的。那么中国这些地方政府的开放数据平台,表现如何呢?

上海不愧为综合排名第一的开放数据平台。其上线时间最早,持续性也最好,至今已经保持了连续9个时段的持续增长了。北京紧随其后,持续增长时段为6个。湛江的表现依旧垫底,自从2014年上线后,便不再新增数据集。如果你用湛江的开放数据创业,可能此时就要喝西北风了。

总的来说,2015年后新上线的开放平台,基本都能保持数据集的增长,整体形势是趋向好的一面发展。

上海这么牛,中国整体怎么样呢?

从上面这些指标看来,把上海称为中国开放数据第一城,还是很有道理的。但如果我们把目光放到国际上,中国整体的政府开放数据水平怎么样呢?

由互联网之父蒂姆·伯纳斯·李(Tim Berners-Lee)创办的万维网基金会(World Wide Web Foundation)公布了最新一期的“开放数据晴雨表”(Open Data Barometer)全球报告。报告比较了全球各个国家的政府开放数据情况。

在纳入评价的114个国家和地区中,英国在“开放数据”上得分居首,加拿大、法国、美国、韩国紧随其后。榜单中排在前列的多数是欧美国家。亚洲国家中,韩国、日本表现出色,都挤入了前十的位置。

反观中国,在榜单中仅排在第71位,比上一年度下降了15个名次。虽然上海在国内表现出色,但是中国总体上各类型的数据开放程度和质量,在国际上依然处于落后的状态。中国到底哪些类型的政府数据没有开放得很好,导致得分偏低呢?

数据显示,中国只在人口数据开放方面做得相对较好(65%),其他方面全部乏善可陈,各类数据的质量都在5%或15%之间。选举数据是开放数据中表现最不好的项目,数据质量为0%。

其实,“开放数据”这个词,如果把它看做一个人,也不过只有不到20岁的年纪。它血气方刚,正在蓬勃生长,但同时又经验不足,经常犯错。中国在政府开放数据的探索中,也是一样。我们能够看到诸如上海这种,有战略、有计划、渐进型的开放模式榜样,也看到了国内不同地区开放数据质量分布的不均。

独木不成林,要建设中国的开放数据,还需要更多的“上海”和“贵阳”,一座城市开放数据形成示范效应,带动更多城市加入,最终形成开放数据的森林,提升中国整体的开放数据水平。

备注

本文部分参考自报告《中国地方政府数据开放平台报告》(点击“阅读原文”可查看报告)。该报告由复旦大学和提升政府治理能力大数据应用技术国家工程实验室联合发布。“开放数林”指数由复旦大学数字与移动治理实验室出品。

文 | 程一祥

转载、合作、交友:欢迎勾搭DT君(微信号:dtcaijing002)

原文发布于微信公众号 - DT数据侠(DTdatahero)

原文发表时间:2017-05-27

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器之心

机器之心年度奖项Synced Machine Intelligence Awards正式发布

43610
来自专栏华章科技

大数据时代来临,这七个关键词告诉你下一波红利在哪

人人都快把大数据当做口头禅,但“知其然而不知其所以然”者甚多,甚至有很多人把大数据与数据库之间划等号。在信息技术飞速发展的移动互联网时代,究竟该如何理解大数据?...

843
来自专栏科技向令说

唯品会纽约时装周开启95后时装秀 消费C2F时代真的要来了!

纽约时间2017年2月13日(北京时间2月14日),纽约时代广场大屏幕亮起“中国95后流行大数据先锋时装秀”,好奇的路人纷纷驻足!

691
来自专栏机器人网

工业机器人专利格局深度分析,中国该怎么走?

人人都在说机器人,各行都在发展机器人,似乎大家对机器人的相关知识是了如指掌。可是,你知道工业机器人技术全球专利布局的格局是怎么样的吗?中国在机器人专利技术上掌握...

2845
来自专栏科技向令说

流量红利渐失,电商的“新故事”往哪讲?

这几天互联网企业迎来了集体狂欢:网易、搜狐、新浪微博都迎来了自己的第二春,股票大涨,市值激增。电商领域的老大哥们也没闲着:2月21日,唯品会发布了公司截至12月...

1043
来自专栏大数据文摘

赠书最后一波:新书《产业互联网》10本,封面你定

2547
来自专栏镁客网

政策解读:《智能硬件产业创新发展专项行动(2016-2018年)》(中)

1566
来自专栏腾讯大讲堂的专栏

见过乐高,才知道什么叫真正成功的创新

? 作者 | 黄亚如(腾讯工程师) 转载此文请在文首标注作者及来源:腾讯大讲堂 一、引言:成功的创新 多年前听华东师范大学的教授分享,他提到据初步统计,美国纳...

5901
来自专栏大数据文摘

[干货]金电联行:大数据在信用体系建设方面的探索和实践

2728
来自专栏数据猿

大数据24小时 | 谷歌开源10亿+语言建模模型库,原Uber技术大牛尹佐宁加盟易到用车

<数据猿导读> 谷歌开源10亿+单词语言建模模型库;碳云智能宣布收购人工智能公司Imagu,用于数字生命系统研究;原Uber总部尹佐宁加盟易到,负责大数据及风控...

3186

扫码关注云+社区

领取腾讯云代金券